今日运势评分

-1

本月运势

戊寅月

震荡偏多

癸水为财,亥子丑三会水
壬不泱水更难提防
戌不吃犬作怪上床

祭祀,塞穴,结网,破土,谢土,安葬,移柩,除服,成服,馀事勿取

嫁娶,入宅

月相

有明

底部反弹

日冲

Powered by RitMEX

TRUMP16.27 0.30%

SUI3.41 1.26%

TON3.78 3.01%

TRX0.24 2.00%

DOGE0.25 0.88%

XRP2.59 0.11%

SOL171.89 -0.11%

BNB663.26 0.76%

ETH2808.90 3.79%

BTC96407.01 0.08%

ETH Gas0.66 Gwei

中性
49
7x24h快讯︎
OpenAI 员工公开指责 Grok3 的基准测试结果具有误导性

深潮 TechFlow 消息,据金十报道,近日,OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。

对此,xAI的联合创始人伊戈尔・巴布什金(Igor Babushkin)则坚称公司并无不当。

xAI的图表显示,Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。

然而,OpenAI的员工很快在X平台上指出,xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金在X平台上辩称,OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。