今日运势评分

-2

本月运势

戊子月

震荡偏多

丁破格,巳申合水
丁不剃头头必生疮
巳不远行财物伏藏

祭祀,解除,馀事勿取

诸事不宜

月相

有明

底部反弹

日冲

Powered by RitMEX

ONDO0.45 -1.28%

TRUMP5.46 -0.83%

SUI1.56 -3.59%

TON1.56 -3.27%

TRX0.28 2.42%

DOGE0.14 0.01%

XRP1.97 -1.62%

SOL132.89 1.33%

BNB887.79 -0.23%

ETH3136.64 1.36%

BTC89514.33 0.18%

ETH Gas0.36 Gwei

恐惧
21

OpenAI 正在悄悄研发代号「草莓」的神秘项目,其能力或已达到博士水平

该项目旨在实现迄今为止 AI 模型无法实现的深度研究。

撰文:Samuel Nwite

编译:MetaverseHub

为了在飞速发展的人工智能领域保持领先地位,OpenAI 正在秘密研发一种新的 AI 模型,代号为「草莓」

这一消息来自路透社和一位知情人士透露的内部文件。这家由微软支持的初创公司以其 ChatGPT 产品而闻名,目前正全力展示其模型具备的高级推理能力,这可能会成为 AI 技术的一大飞跃。

01.「草莓」项目内部一览

根据路透社 5 月份看到的一份最新内部文件,OpenAI 团队正在深入研究「草莓」项目。虽然该文件的确切时间线尚不清楚,但它概述了 OpenAI 利用「草莓」进行高级人工智能研究的计划。

该项目被称为「正在进行中」,即使在公司内部也一直处于保密状态。「草莓」的目标是让人工智能不仅能生成答案,还能自主、可靠地浏览互联网,进行 OpenAI 所称的「深度研究」。

「这是迄今为止人工智能模型无法实现的。」消息人士指出了该项目的雄心勃勃。

在被问及「草莓」和这篇报道中的细节时,OpenAI 的一位发言人在一份声明中说道:「我们希望我们的人工智能模型能像我们一样看待和理解这个世界。持续研究新的 AI 能力是业界的普遍做法,我们的共同信念是,随着时间的推移,这些系统的推理能力将不断提高。」

但这位发言人没有直接回答有关「草莓」的问题。

02.从 Q 到「草莓」推理新时代

有消息称,「草莓」是前一个名为 Q 的项目的继任者。

据两位知情人士透露,OpenAI 内部已将 Q 视为一项突破,因为它能够回答复杂的科学和数学问题,超越了目前大多商业化模型的能力。

据彭博社报道,在今年的一次内部全体会议上,OpenAI 展示了一个研究项目,展示了新的类人推理能力。

虽然路透社无法证实所展示的项目是否为「草莓」,但这与该公司一直以来为增强人工智能推理能力所做的努力不谋而合。

OpenAI 首席执行官奥特曼强调了推理在 AI 中的重要性,他在今年早些时候表示,「最重要的进步领域将围绕推理能力展开」

03.人工智能推理的挑战

研究人员认为,提高人工智能模型的推理能力是实现人类或超人级智能的关键。虽然大型语言模型可以高效地总结文本和撰写文章,但它们在常识性问题和逻辑任务上会经常失误,导致所谓的「幻觉」或生成错误信息。

根据 AI 研究人员的描述,推理涉及人工智能规划、理解物理世界和解决多步骤问题的能力

OpenAI 的「草莓」项目旨在通过采用专门的后期训练过程来克服这些挑战。这包括在大量数据集上对人工智能模型进行预训练后,对其进行微调。

据一位知情人士透露,「草莓」的方法与斯坦福大学的「自学推理」(STaR)有相似之处,后者允许人工智能模型迭代地创建自己的训练数据,有可能使它们达到更高的智能水平。

STaR 的创造者之一、斯坦福大学教授 Noah Goodman 评论说:「我认为这既令人兴奋,又令人恐惧......如果事情继续朝着这个方向发展,作为人类,我们就有一些严肃的事情需要思考了。」

04.长任务规划和自主研究

「草莓」项目雄心勃勃的目标之一是能够执行长期任务(LHT),这要求人工智能在较长时间内计划并执行一系列行动。

内部文件显示,OpenAI 正在一个「深度研究」数据集上训练和评估模型,以实现这些能力。

虽然该数据集的具体内容和延长时间仍未披露,但目标很明确:让人工智能能够在计算机使用代理(CUA)的帮助下自主开展研究,并根据研究结果采取行动。

05.竞争激烈的人工智能产业

在增强人工智能推理能力方面,OpenAI 并非孤军奋战。谷歌、Meta 和微软等大型科技公司以及众多学术实验室也在探索各种技术,以提高人工智能的推理能力。

然而,对于大型语言模型能否在预测中纳入长期规划和高级推理,人们的看法却不尽相同。Meta 的现代人工智能先驱 YannLeCun 就经常对大语言模型(LLM)能否实现类人推理的能力表示怀疑。

「草莓」代表了 OpenAI 战略的重要组成部分,旨在解决当前 AI 模型的局限性。通过开发更先进的推理能力,OpenAI 旨在为人工智能开启新的可能性,从科学发现到创建新的软件应用。

同时,该公司一直在向开发者和合作伙伴发出信号,表示即将发布推理能力显著增强的技术。

「草莓」的开发包括微调等后期训练方法,其中涉及人类反馈和迭代学习过程。这些技术旨在完善人工智能模型,提高它们在特定任务中的表现。

通过「草莓」技术取得的进步可以重新定义人工智能的能力,并为这些模型所能达到的目标设定新的标准。

虽然前进的道路充满挑战,但潜在的回报也是巨大的,预示着一个智能、自主的人工智能系统的新时代即将到来。

用 OpenAI 发言人的话来说,「我们希望我们的人工智能模型能像我们一样看待和理解这个世界。如果‘草莓’项目取得成功,我们就离实现这一愿景更近了一步。」

OpenAI 引入了一个五级系统来跟踪其在实现通用人工智能(AGI)的进展。这些等级从代表当前对话式人工智能的第 1 级,到设想能够管理和执行整个组织工作的第 5 级,涵盖了不同层次的 AI 能力。

下面是 OpenAI 划定的五个人工智能等级:

1.聊天机器人:具备对话语言的 Al

2.推理者:具备人类水平的问题解决能力

3.代理者:能够采取行动的系统

4.创新者:能够帮助发明创造的 AI

5.组织者:能够完成组织工作的 Al

OpenAI 认为「草莓」正在接近第 2 级,这一级涉及解决问题,类似于不借助工具的博士水平。该框架旨在提供一种结构化的方法来理解和开发人工智能系统,从而最终超越人类智能

欢迎加入深潮TechFlow官方社群

Telegram订阅群:https://t.me/TechFlowDaily
Twitter官方账号:https://x.com/TechFlowPost
Twitter英文账号:https://x.com/BlockFlow_News
作者元宇宙之心
相关文章
2025.12.15 - 4 小时前
数字银行早已不做银行生意,真正的金矿在稳定币与身份认证
市场正逐步摒弃各平台分散的 KYC 流程,转向可跨服务、跨国家、跨平台使用的可移植性认证身份体系。
2025.12.15 - 4 小时前
币圈印钞机欲收购尤文图斯:欧洲新老钱的攻防战
当 Paolo 满怀热忱地敲响尤文图斯的大门时,迎接他的没有鲜花,没有掌声。
2025.12.15 - 4 小时前
「合法」的收割?特朗普夫妇 Meme 币狂欢背后的利益链与丑闻
没人愿意因为帮助第一对夫妇推出从峰值暴跌 90% 以上的加密货币而获得功劳。
2025.12.15 - 6 小时前
巴基斯坦,从「巴铁兄」到「链上铁」?
巴基斯坦拥有超过 2.4 亿人口,数字支付接受度不断提高,加密货币的渗透率还有很大的上升空间。
2025.12.15 - 6 小时前
小盘代币跌至四年低点,「山寨牛」 彻底没希望了?
尽管与加密大盘代币的相关性高达 0.9,却未能提供任何多元化价值。
2025.12.15 - 7 小时前
为何大语言模型并不会比你更聪明?
只有在结构建立好之后,大语言模型才能安全地转换成通俗语言,且不会导致理解质量下降。
2025.12.15 - 7 小时前
2025 Crypto x AI 年度复盘:哪些叙事活下来了?
整个行业正在从叙事转向基础设施,从投机转向系统化解决方案,从炒作转向实际产品。
AI
2025.12.15 - 7 小时前
如果你觉得加密变得“无聊”,说明你看懂了游戏的终局
十年前加密爱好者所设想的一切,正在慢慢变得“无聊”到足够实用,而这一切正发生在关键时刻。
2025.12.15 - 10 小时前
山寨币 ETF 全面开闸:数据透视、机遇与风险解析
本文将围绕比特币与以太坊ETF 的示范效应、山寨币 ETF 的批量上市热潮以及正在申请中的潜在标的,对当前山寨币 ETF 的整体发展脉络进行系统梳理。