发布日期:2024-06-18 13:06 点击次数:56
文/王新喜最新迪士尼彩乐园
马斯克的东谈主工智能初创公司xAI发布了更新版Grok 3大模子,马斯克称之为“地球上最智谋的东谈主工智能”。
Grok 3是用20万块英伟达芯片练出来的,运算智商是上代10倍。
xAI在今日的直播中,马斯克与该公司的三位工程师一齐进行了现场演示,Grok 3在数学、科学和编程基准测试中,Grok 3打败了谷歌Gemini、DeepSeek的V3模子、Anthropic的Claude和OpenAI的GPT-4o。
据马斯克此前先容,Grok 3是在无数的合成数据上锤真金不怕火的。它会反复查抄数据,试图达到逻辑一致性。如若有诞妄的数据,它会反念念并删除诞妄数据。
伸开剩余84%从咫尺测试看,Grok3在AIME'24数学智商测试、GPQA科学学问评估、LCB Oct - Feb编程智商测试等多项测试中得益均高于DeepSeek。领有“念念维链”推理机制,能像东谈主类同样迟缓拆解复杂任务。参数目达1万亿级别。
Grok3 如真实不少任务上进展得很棒,举例在料理复杂逻辑和推理任务时,它的智商如实有东西。不外Grok3用海量GPU刷了榜单上的分数,数学、编程分高,其实也没好若干,莫得拉开差距。而DeepSeek 的上风在于华文招引和多模态交互方面,它的进展一直很安逸,在本体期骗场景中还是得到了不少考据。
最要道的问题在于,Grok3老本极其高,议论量是前代Grok 2的10倍,有说法是其锤真金不怕火老本就30亿好意思元,阐述干系工程师清晰xAI旗下超算中默算力还是翻倍。
旧年4月,马斯克认为xAI若想收效打造出最好AI,唯独蹊径是自建数据中心。由于想尽快推出Grok 3,时分进犯,于是决定在四个月内建成数据中心。最终,团队耗时122天让第一批10万个GPU启动并运转,不外要构建假想中的AI需将集群界限翻倍。发布会上清晰,团队仅用92天就还是完了了超算集群的算力翻倍,也即是GPU数目已达20万块。
20万块GPU若干钱?以英伟达H100为例,单卡价钱约为2.5万-3万好意思元。20万块 × 3万好意思元 = 60亿好意思元(仅硬件采购老本)。这还仅仅GPU硬件老本,本体部署老本更高,还需议论配套工作器、相聚拓荒、电力、冷却武艺等,总老本可能达百亿好意思元量级,砍一半也高达50亿好意思金。
Deepseek从锤真金不怕火老原来看仅有600万好意思元,远低于GPT-4的7800万好意思元。后续deepseek资金、东谈主才、资源上去了,概述智商细目不比Grok3差。
Grok 3,印证了DeepSeek真实强
这评释了什么,评释了两点,其一,马斯克花了那么多钱堆了比OpenAI还多的算力,终末搞出来个跟OpenAI差未几的居品。第二,这解释了DeepSeek真实强啊,马斯克大把烧好意思金当柴火搞真金不怕火丹,成果全靠堆硬件,而且从数据来看,和DeepSeek并莫得拉开若干差距,DeepSeek那处走低老本道路都能差未几打平手,那只可更评释DeepSeek荒谬强。
因为这是两条不同的道路,一个是力大拍砖纵欲出遗址矍铄地砸钱堆算力,一个是编削的工程筹备与高效的锤真金不怕火门径,优化勤俭资源追求极致性价比,是两条完全不同的道路。
而堆算力的游戏,迪士尼国际彩乐园美女是让AI成为好意思国东谈主主导算力资源分拨的游戏。好意思国不错通过适度GPU芯片出口,精确调控各人AI分娩力水平。何况把各人获得AI算力分辨为三个品级圈,由它来适度分拨,这让其他国度堕入发放。
而且特朗普还投资5000亿好意思元的“星际之门”,成见即是将AI当先紧紧锁在好意思国脉土,招引把日韩、中东、欧洲等干系资金,把除中海外的其他实力国度紧紧绑在老好意思的AI战车之上。
而DeepSeek则冲突了这种主导,给了其他系数国度看到了自主发展AI的但愿,因为它在完了OpenAI模子的同等性能时,仅需要对方5%的算力,以低老本情势径直掀起了好意思国一众科技巨头,这下系数的国度都合计我方都能行了。因为,这意味着系数的国度都不需要依赖好意思国高算力GPU芯片资源了,而且还能把老本极大的降下来。
这是咫尺到处搞钱的特朗普荒谬垂青的智商,DeepSeek的横空出世,为啥不光是英伟达、AMD等企业很快接入,特朗普也一反常态的点赞——他们就一个情理:省老本,省社会总老本,不错给系数这个词国度省下老鼻子钱了。
而且在AI 大模子发展到咫尺,其实模子智商还是很难分出王人备的赢输了,在大方针络续趋同的布景下,开源才是大招,着名投资东谈主朱啸虎也曾建议一个判断,开源模子的基础即是闭源模子的斩杀线,今后闭源模子必须要作念到开源基础的两到三倍才有活下去的契机。不然十倍老本砸下去性能只栽种20%,那即使是硅谷的投资东谈主也不会罗致这么的拆伙。
而真用起来奈何,也只消开源的本领比拟充分测试。不开源,东谈主家还交钱用,还没什么荒谬当先的,买卖情势就很难确立。
视觉总监│杜放 视频监制│李小姣 设计│刘垚
加上有Chatgpt和deepseek的强盛收效在前,grok1和grok2差未几无东谈主问津,grok3单纯砸钱堆算力完了大火献技回转剧情的几率并不大。
如若不开源,马斯克强盛的参加无法变现,或会私用到我方的机器东谈主和 FSD。不外话说悲悼,咫尺特斯拉FSD用户订阅并不高,然而Grok-3如故能增强FSD的竞争力。
因为Grok 3 基于10万块英伟达 H100 芯片锤真金不怕火,每秒可料理卓越 1.5 万亿参数,能及时明白车载录像头、雷达等传感器数据,比竞品在识别暴雨天气下谈路积水深度的准确率高 37%,可匡助自动驾驶系统更精确地感知相近环境。
此外是Grok 3 引入 “念念维链” 本事,可模拟东谈主类迟缓推理经由,在导航时能概述分析及时交通数据、充电桩可用性和用户日程推选道路,在自动驾驶场景中,靠近复杂路况和交通讯号时能作念出更合理、安全的决议。
如若特斯拉将其用到FSD,这意味着新动力车企的智驾竞争会愈加热烈,对此中国的车企要有饱和的默契与准备。
联系于Grok3,deepseek的上风是编削的工程筹备与算法优化完了的超低老本、其次是开源情势的生态与本事优化智商会让明天包括好意思国在内的好多科研东谈主员只可在东大的AI模子上搞开发了!东大有望成为天下AI的开发中心。加上咱们举国之力救援,中国成百上千行业都在快速接入,促进它络续进化,和千行百业聚合实行,产生分娩力。明天发展后劲,可能不是Grok3能比的,咱们静瞻念其变。
作家:王新喜 TMT资深指摘东谈主 本文未经许可阻截转载最新迪士尼彩乐园
发布于:广东省