xAI 新模型 Grok 3 逻辑推理能力获 OpenAI 创始人点赞_AI资讯_AI_新闻资讯

xAI 新模型 Grok 3 逻辑推理能力获 OpenAI 创始人点赞

AI资讯

2025-02-25

埃隆・马斯克的人工智能公司 xAI 于本周一发布了其最新的语言模型 Grok3，标志着该公司在人工智能领域的重要进展。据马斯克介绍，新模型所需的计算能力是其前身的十倍，使用了位于孟菲斯的数据中心，配备了约20万块 GPU。

Grok3系列模型推出了多种变体，其中包括一个精简版，旨在提高速度但牺牲部分准确性。此外，新的 “推理” 模型专门设计用于解决数学和科学问题。用户可以通过 Grok 界面中的 “思考” 和 “大脑” 设置来调整这些功能。xAI 表示，这一版本尚未最终定型，模型仍在持续训练中，团队计划在未来几周内进行改进。

根据 AI 基准测试平台 lmarena.ai 的数据，Grok3在聊天机器人领域的得分超过了1400，成为领先者，涵盖编程等所有类别，超越了 OpenAI、Anthropic 和谷歌的模型。然而，实际性能可能与基准结果有所不同。例如，尽管 Claude3.5Sonnet 在编码基准测试中的得分低于某些模型，但许多用户仍认为它是编程任务的更优选择。

OpenAI 创始人安德烈・卡尔帕西（Andrej Karpathy）获得了 Grok3的早期访问权，他对该模型的逻辑推理能力给予了高度评价。“思考” 功能能够成功处理复杂任务，比如计算 GPT-2的训练 flops 或为棋盘游戏创建六边形网格，这些能力在之前仅限于 OpenAI 的高端模型 o1-pro。此外，该功能还提高了基本数学操作的准确性，比如字母计数和比较小数。

在新搜索功能方面，卡尔帕西指出，DeepSearch 的质量与 Perplexity 的研究工具相当，可以提供关于即将发布的苹果产品和 Palantir 股票动态等主题的相关答案。然而，他也发现了一些明显的问题:模型有时会生成虚假的网址，做出不支持的声明，并且仅在特定提示下引用 X 的帖子。

它似乎还对自己的存在缺乏意识，遗漏了 xAI 在主要 AI 实验室中的位置。这些局限性使 DeepSearch 尚未达到 OpenAI “深度研究” 的质量水平，并且在幽默和伦理问题上表现不佳。

0 人点赞

文章来源于网络，如有侵权请联系本站删除

精选二手好课

更多>>

年卡|【转让】知名机构考研VIP班（专业课1对1+全程规划），低价急转！

考研全程班

￥11000

次卡|转让自考本科汉语言文学专业课程

自考本科（汉语言文学）

￥3768

年卡|名师天团五科全套大招课

高三大招课

￥27000

年卡|81之家军队文职技能岗线上课程

军队文职技能岗

￥4100

年卡|低价出还有书

专升本

￥1800

次卡|沧州木/电吉他一对一课程转让线上线下均可

吉他课

￥2600

次卡|Hellokid纯欧美英语外教一对一

欧美英语外教一对一

￥12000

年卡|便宜转让

健身年卡+私教课

￥10000

次卡|低价转让

瑜伽

￥75

年卡|JS舞蹈（珠海井岸店）双项教练班年卡转让

古典舞，JAZZ，K-POP，HIPPOP

￥9000

xAI 新模型 Grok 3 逻辑推理能力获 OpenAI 创始人点赞

AI资讯

2025-02-25

文章来源于网络，如有侵权请联系本站删除