星洲网
星洲网
星洲网 登入
Newsletter|星洲网 Newsletter 联络我们|星洲网 联络我们 登广告|星洲网 登广告 关于我们|星洲网 关于我们 活动|星洲网 活动

ADVERTISEMENT

ADVERTISEMENT

国际

|

即时国际

发布: 11:36am 19/02/2025

Grok 3

开发速度

xAI公司

Grok 3

开发速度

xAI公司

地表最强Grok 3强压同行登顶!AI专家:开发速度快到难以置信

 地表最强Grok 3强压同行登顶!AI专家:开发速度快到难以置信
马斯克(右1)的xAI公司周二推出的最新聊天机器人“Grok 3”,宣称“此模型诞生的目的是要探索宇宙奥秘”。(图为 maginative.com)

(纽约19日综合电)特斯拉创办人、亿万富翁马斯克周二与旗下 AI 公司xAI共同发表号称地表最强的聊天机器人“”,同时放下豪雨直说“此模型诞生的目的是要探索宇宙奥秘”。对此,外媒报道,考虑到xAI才成立不到两年,目前推出的Grok 3 + Thinking就已经跟OpenAI 目前最强大的模型 o1-pro水平相当,令他直呼“真的难以置信!”

马斯克及团队在发表会上强调,同时相较于上一代Grok 2,Grok 3 超过10倍以上训练,在各方面算力表线上,将远远甩过DeepSeek-V3、Gemini-2 Pro、GPT-4o等,同时在发布会上,团队也展示由Grok 3 透过演算解决的一款结合俄罗斯方块、宝石迷阵的游戏,但目前 Grok 3 的推理模型处于测试阶段,仍在训练中。

ADVERTISEMENT

而开放早期测时后,就不少专家学者抢著试用,不到一日chocolate(Early Grok-3)就登上聊天机器人比拚榜首,分数略胜于Gemini-2.0-Flash及DeepSeek-R1,AI 专家 卡帕斯就在自身X平台分享早期测试的心得,认为Grok 3 + Thinking跟目前Open AI最强大的模型(需要每个月付费200美元)的水平相当,且略优于 DeepSeek-R1 及 Gemini 2.0 Flash Thinking,但考虑到xAI团队在2023年才开始,这种追赶上的速度是前所未有、令人难以置信,同时表示从早期评论来看,Grok 3的评价非常之高。

但原先有外界认为,OpenAI 在周二已经准备好发布GPT-5来应对Grok 3上市,但在看完发表会后认为“毫无新意”,因此并没有突袭上架来抢占市场话题,将会继续依照自己步调进行发布。

马斯克周二在发布会上表示,Grok 3 于今年1月初完成预训练(pre-training),其运算能力是去年8月推出的Grok 2的“10倍以上”,它基本上有点像测试版,目前其团队仍在每天不断改良模型,实际上在24小时内“已可看到改进的成果”。xAI计划,在最新版本Grok模型完全成熟后,立即开源其先前版本。马斯克预计, Grok 3的转变将在数月内完成。

能自我改错 达至逻辑一致

马斯克称,Grok 3的训练在xAI数据中心进行,过程累计使用20万个Nvidia(辉达)GPU。该模型以合成数据训练,能透过反复检视数据自我修改错误,以达至逻辑一致性,避免其他AI聊天机械人常见的“幻觉”。这种“幻觉”会导致AI将虚假讯息或误导内容当成事实来处理。

马斯克此前宣称Grok 3“聪明得吓人”,拥有非常强大的推理能力,“在迄今所有测试结果显示,Grok 3的性能胜于任何已推出的AI模型”。

彭博社称,马斯克对Grok 3的评价,尚未得到独立验证。任何新进展都反映其与OpenAI之间的竞争加剧。马斯克于2023年创立xAI时,声称要成为OpenAI的替代选项,并就OpenAI计划改组成营利企业提出诉讼,指其违反创立宗旨。

目前xAI和OpenAI等AI初创公司正加快筹集资金。根据彭博社上周报道,xAI正为新一轮融资进行谈判,集资额约100亿美元,使该公司估值增至750亿美元。OpenAI亦正谈判,希望透过新一轮融资,集资400亿美元,这将使该公司估值达到3000亿美元。

科技企业的AI竞赛近期愈趋激烈,例如DeepSeek继推出V3后,上月另推出了R1模型,表现媲美OpenAI最先进的o1正式版。此外,OpenAI预告即将推出GPT-4.5和GPT-5。

打开全文

ADVERTISEMENT

热门新闻

百格视频

ADVERTISEMENT

点击 可阅读下一则新闻

ADVERTISEMENT