今日运势评分

2

本月运势

己卯月

震荡

食神生财,巳火为用
庚不经络织机虚张
辰不哭泣必主重丧

塞穴,诸事不宜

安门,作灶,安葬,嫁娶

月相

渐盈凸

冲顶回落

日冲

Powered by RitMEX

TRUMP10.82 5.21%

SUI2.24 0.57%

TON2.71 1.97%

TRX0.22 1.18%

DOGE0.17 3.09%

XRP2.23 2.76%

SOL124.15 0.89%

BNB577.58 4.07%

ETH1870.99 -1.88%

BTC83219.65 1.75%

ETH Gas0.49 Gwei

恐惧
34

OpenAI 正在悄悄研发代号「草莓」的神秘项目,其能力或已达到博士水平

该项目旨在实现迄今为止 AI 模型无法实现的深度研究。

撰文:Samuel Nwite

编译:MetaverseHub

为了在飞速发展的人工智能领域保持领先地位,OpenAI 正在秘密研发一种新的 AI 模型,代号为「草莓」

这一消息来自路透社和一位知情人士透露的内部文件。这家由微软支持的初创公司以其 ChatGPT 产品而闻名,目前正全力展示其模型具备的高级推理能力,这可能会成为 AI 技术的一大飞跃。

01.「草莓」项目内部一览

根据路透社 5 月份看到的一份最新内部文件,OpenAI 团队正在深入研究「草莓」项目。虽然该文件的确切时间线尚不清楚,但它概述了 OpenAI 利用「草莓」进行高级人工智能研究的计划。

该项目被称为「正在进行中」,即使在公司内部也一直处于保密状态。「草莓」的目标是让人工智能不仅能生成答案,还能自主、可靠地浏览互联网,进行 OpenAI 所称的「深度研究」。

「这是迄今为止人工智能模型无法实现的。」消息人士指出了该项目的雄心勃勃。

在被问及「草莓」和这篇报道中的细节时,OpenAI 的一位发言人在一份声明中说道:「我们希望我们的人工智能模型能像我们一样看待和理解这个世界。持续研究新的 AI 能力是业界的普遍做法,我们的共同信念是,随着时间的推移,这些系统的推理能力将不断提高。」

但这位发言人没有直接回答有关「草莓」的问题。

02.从 Q 到「草莓」推理新时代

有消息称,「草莓」是前一个名为 Q 的项目的继任者。

据两位知情人士透露,OpenAI 内部已将 Q 视为一项突破,因为它能够回答复杂的科学和数学问题,超越了目前大多商业化模型的能力。

据彭博社报道,在今年的一次内部全体会议上,OpenAI 展示了一个研究项目,展示了新的类人推理能力。

虽然路透社无法证实所展示的项目是否为「草莓」,但这与该公司一直以来为增强人工智能推理能力所做的努力不谋而合。

OpenAI 首席执行官奥特曼强调了推理在 AI 中的重要性,他在今年早些时候表示,「最重要的进步领域将围绕推理能力展开」

03.人工智能推理的挑战

研究人员认为,提高人工智能模型的推理能力是实现人类或超人级智能的关键。虽然大型语言模型可以高效地总结文本和撰写文章,但它们在常识性问题和逻辑任务上会经常失误,导致所谓的「幻觉」或生成错误信息。

根据 AI 研究人员的描述,推理涉及人工智能规划、理解物理世界和解决多步骤问题的能力

OpenAI 的「草莓」项目旨在通过采用专门的后期训练过程来克服这些挑战。这包括在大量数据集上对人工智能模型进行预训练后,对其进行微调。

据一位知情人士透露,「草莓」的方法与斯坦福大学的「自学推理」(STaR)有相似之处,后者允许人工智能模型迭代地创建自己的训练数据,有可能使它们达到更高的智能水平。

STaR 的创造者之一、斯坦福大学教授 Noah Goodman 评论说:「我认为这既令人兴奋,又令人恐惧......如果事情继续朝着这个方向发展,作为人类,我们就有一些严肃的事情需要思考了。」

04.长任务规划和自主研究

「草莓」项目雄心勃勃的目标之一是能够执行长期任务(LHT),这要求人工智能在较长时间内计划并执行一系列行动。

内部文件显示,OpenAI 正在一个「深度研究」数据集上训练和评估模型,以实现这些能力。

虽然该数据集的具体内容和延长时间仍未披露,但目标很明确:让人工智能能够在计算机使用代理(CUA)的帮助下自主开展研究,并根据研究结果采取行动。

05.竞争激烈的人工智能产业

在增强人工智能推理能力方面,OpenAI 并非孤军奋战。谷歌、Meta 和微软等大型科技公司以及众多学术实验室也在探索各种技术,以提高人工智能的推理能力。

然而,对于大型语言模型能否在预测中纳入长期规划和高级推理,人们的看法却不尽相同。Meta 的现代人工智能先驱 YannLeCun 就经常对大语言模型(LLM)能否实现类人推理的能力表示怀疑。

「草莓」代表了 OpenAI 战略的重要组成部分,旨在解决当前 AI 模型的局限性。通过开发更先进的推理能力,OpenAI 旨在为人工智能开启新的可能性,从科学发现到创建新的软件应用。

同时,该公司一直在向开发者和合作伙伴发出信号,表示即将发布推理能力显著增强的技术。

「草莓」的开发包括微调等后期训练方法,其中涉及人类反馈和迭代学习过程。这些技术旨在完善人工智能模型,提高它们在特定任务中的表现。

通过「草莓」技术取得的进步可以重新定义人工智能的能力,并为这些模型所能达到的目标设定新的标准。

虽然前进的道路充满挑战,但潜在的回报也是巨大的,预示着一个智能、自主的人工智能系统的新时代即将到来。

用 OpenAI 发言人的话来说,「我们希望我们的人工智能模型能像我们一样看待和理解这个世界。如果‘草莓’项目取得成功,我们就离实现这一愿景更近了一步。」

OpenAI 引入了一个五级系统来跟踪其在实现通用人工智能(AGI)的进展。这些等级从代表当前对话式人工智能的第 1 级,到设想能够管理和执行整个组织工作的第 5 级,涵盖了不同层次的 AI 能力。

下面是 OpenAI 划定的五个人工智能等级:

1.聊天机器人:具备对话语言的 Al

2.推理者:具备人类水平的问题解决能力

3.代理者:能够采取行动的系统

4.创新者:能够帮助发明创造的 AI

5.组织者:能够完成组织工作的 Al

OpenAI 认为「草莓」正在接近第 2 级,这一级涉及解决问题,类似于不借助工具的博士水平。该框架旨在提供一种结构化的方法来理解和开发人工智能系统,从而最终超越人类智能

欢迎加入深潮TechFlow官方社群

Telegram订阅群:https://t.me/TechFlowDaily
Twitter官方账号:https://x.com/TechFlowPost
Twitter英文账号:https://x.com/DeFlow_Intern
作者元宇宙之心
相关文章
2025.03.13 - 33 分钟前
从“山寨之王”到“机构乐园”?Pectra 升级能否重塑以太坊生态格局
未来短期内的以太坊北极星或许将是ETF质押,会把以太坊的价格预期上升至比特币战略储备落地同等重要地位。
2025.03.13 - 36 分钟前
香港会成为 Web3 的全球中心吗?
浅聊香港 Web3 生态的现实状况和未来可能的方向。
2025.03.13 - 45 分钟前
币安牵手阿联酋皇室:主权基金 MGX 豪掷 20 亿美元进军加密,币安低估值“交朋友”?
这笔交易不仅为币安注入充裕资金,更带来了阿联酋主权资本的战略背书、资源支持以及政策庇护。
2025.03.13 - 47 分钟前
CS2 饰品逆市上涨:当“龙狙”上链 ,NFT 市场能否再次迎来夏天?
CS2饰品交易体系或许能为区块链行业提供有益的借鉴。
NFT
2025.03.13 - 4 小时前
HTX Ventures:DeepSeek 引爆 AI 赛道“iPhone 时刻”,Agents 代币加速融入真实加密业务
详细分析AI与加密世界的深度融合,推动AI在真实加密业务中的应用与落地。
2025.03.13 - 6 小时前
观点:加密叙事已进入“后性能时代 ”,过度优化基建性能没有意义
差异化必须来自其他方面:独特的功能和体验。
2025.03.13 - 6 小时前
加密早报:美国二月 CPI 全面低于预期,币安获得阿布扎比主权基金 20 亿美元投资
交易活动显著增加之前,谨慎的市场情绪可能会继续主导。
2025.03.12 - 19 小时前
当数据造假和流量贿赂成为了上所的基操,加密行业还剩什么?
当前加密行业正经历一场信任危机
2025.03.12 - 22 小时前
山寨币季节是否已死?比特币 ETF 重写加密投资规则
轻松、周期性的山寨币上涨的日子可能会被一个由资本效率、结构化金融产品和监管透明度决定资金流向的生态系统所取代。
2025.03.12 - 22 小时前
完整复盘:Manus 是怎么诞生的?
「Agent 可能是『对齐』的问题,而不是基础模型能力的问题」