今日运势评分

-1

本月运势

戊寅月

震荡偏多

癸水为财,亥子丑三会水
壬不泱水更难提防
戌不吃犬作怪上床

祭祀,塞穴,结网,破土,谢土,安葬,移柩,除服,成服,馀事勿取

嫁娶,入宅

月相

有明

底部反弹

日冲

Powered by RitMEX

TRUMP16.04 -1.73%

SUI3.33 -2.03%

TON3.79 2.95%

TRX0.24 2.63%

DOGE0.24 -0.23%

XRP2.55 -1.22%

SOL168.95 -2.74%

BNB653.50 -0.32%

ETH2792.40 1.93%

BTC95637.97 -0.99%

ETH Gas0.85 Gwei

中性
49

OpenAI 正在悄悄研发代号「草莓」的神秘项目,其能力或已达到博士水平

该项目旨在实现迄今为止 AI 模型无法实现的深度研究。

撰文:Samuel Nwite

编译:MetaverseHub

为了在飞速发展的人工智能领域保持领先地位,OpenAI 正在秘密研发一种新的 AI 模型,代号为「草莓」

这一消息来自路透社和一位知情人士透露的内部文件。这家由微软支持的初创公司以其 ChatGPT 产品而闻名,目前正全力展示其模型具备的高级推理能力,这可能会成为 AI 技术的一大飞跃。

01.「草莓」项目内部一览

根据路透社 5 月份看到的一份最新内部文件,OpenAI 团队正在深入研究「草莓」项目。虽然该文件的确切时间线尚不清楚,但它概述了 OpenAI 利用「草莓」进行高级人工智能研究的计划。

该项目被称为「正在进行中」,即使在公司内部也一直处于保密状态。「草莓」的目标是让人工智能不仅能生成答案,还能自主、可靠地浏览互联网,进行 OpenAI 所称的「深度研究」。

「这是迄今为止人工智能模型无法实现的。」消息人士指出了该项目的雄心勃勃。

在被问及「草莓」和这篇报道中的细节时,OpenAI 的一位发言人在一份声明中说道:「我们希望我们的人工智能模型能像我们一样看待和理解这个世界。持续研究新的 AI 能力是业界的普遍做法,我们的共同信念是,随着时间的推移,这些系统的推理能力将不断提高。」

但这位发言人没有直接回答有关「草莓」的问题。

02.从 Q 到「草莓」推理新时代

有消息称,「草莓」是前一个名为 Q 的项目的继任者。

据两位知情人士透露,OpenAI 内部已将 Q 视为一项突破,因为它能够回答复杂的科学和数学问题,超越了目前大多商业化模型的能力。

据彭博社报道,在今年的一次内部全体会议上,OpenAI 展示了一个研究项目,展示了新的类人推理能力。

虽然路透社无法证实所展示的项目是否为「草莓」,但这与该公司一直以来为增强人工智能推理能力所做的努力不谋而合。

OpenAI 首席执行官奥特曼强调了推理在 AI 中的重要性,他在今年早些时候表示,「最重要的进步领域将围绕推理能力展开」

03.人工智能推理的挑战

研究人员认为,提高人工智能模型的推理能力是实现人类或超人级智能的关键。虽然大型语言模型可以高效地总结文本和撰写文章,但它们在常识性问题和逻辑任务上会经常失误,导致所谓的「幻觉」或生成错误信息。

根据 AI 研究人员的描述,推理涉及人工智能规划、理解物理世界和解决多步骤问题的能力

OpenAI 的「草莓」项目旨在通过采用专门的后期训练过程来克服这些挑战。这包括在大量数据集上对人工智能模型进行预训练后,对其进行微调。

据一位知情人士透露,「草莓」的方法与斯坦福大学的「自学推理」(STaR)有相似之处,后者允许人工智能模型迭代地创建自己的训练数据,有可能使它们达到更高的智能水平。

STaR 的创造者之一、斯坦福大学教授 Noah Goodman 评论说:「我认为这既令人兴奋,又令人恐惧......如果事情继续朝着这个方向发展,作为人类,我们就有一些严肃的事情需要思考了。」

04.长任务规划和自主研究

「草莓」项目雄心勃勃的目标之一是能够执行长期任务(LHT),这要求人工智能在较长时间内计划并执行一系列行动。

内部文件显示,OpenAI 正在一个「深度研究」数据集上训练和评估模型,以实现这些能力。

虽然该数据集的具体内容和延长时间仍未披露,但目标很明确:让人工智能能够在计算机使用代理(CUA)的帮助下自主开展研究,并根据研究结果采取行动。

05.竞争激烈的人工智能产业

在增强人工智能推理能力方面,OpenAI 并非孤军奋战。谷歌、Meta 和微软等大型科技公司以及众多学术实验室也在探索各种技术,以提高人工智能的推理能力。

然而,对于大型语言模型能否在预测中纳入长期规划和高级推理,人们的看法却不尽相同。Meta 的现代人工智能先驱 YannLeCun 就经常对大语言模型(LLM)能否实现类人推理的能力表示怀疑。

「草莓」代表了 OpenAI 战略的重要组成部分,旨在解决当前 AI 模型的局限性。通过开发更先进的推理能力,OpenAI 旨在为人工智能开启新的可能性,从科学发现到创建新的软件应用。

同时,该公司一直在向开发者和合作伙伴发出信号,表示即将发布推理能力显著增强的技术。

「草莓」的开发包括微调等后期训练方法,其中涉及人类反馈和迭代学习过程。这些技术旨在完善人工智能模型,提高它们在特定任务中的表现。

通过「草莓」技术取得的进步可以重新定义人工智能的能力,并为这些模型所能达到的目标设定新的标准。

虽然前进的道路充满挑战,但潜在的回报也是巨大的,预示着一个智能、自主的人工智能系统的新时代即将到来。

用 OpenAI 发言人的话来说,「我们希望我们的人工智能模型能像我们一样看待和理解这个世界。如果‘草莓’项目取得成功,我们就离实现这一愿景更近了一步。」

OpenAI 引入了一个五级系统来跟踪其在实现通用人工智能(AGI)的进展。这些等级从代表当前对话式人工智能的第 1 级,到设想能够管理和执行整个组织工作的第 5 级,涵盖了不同层次的 AI 能力。

下面是 OpenAI 划定的五个人工智能等级:

1.聊天机器人:具备对话语言的 Al

2.推理者:具备人类水平的问题解决能力

3.代理者:能够采取行动的系统

4.创新者:能够帮助发明创造的 AI

5.组织者:能够完成组织工作的 Al

OpenAI 认为「草莓」正在接近第 2 级,这一级涉及解决问题,类似于不借助工具的博士水平。该框架旨在提供一种结构化的方法来理解和开发人工智能系统,从而最终超越人类智能

欢迎加入深潮TechFlow官方社群

Telegram订阅群:https://t.me/TechFlowDaily
Twitter官方账号:https://x.com/TechFlowPost
Twitter英文账号:https://x.com/DeFlow_Intern
作者元宇宙之心
相关文章
2025.02.22 - 昨天
再次盗取15亿美元加密货币,朝鲜如何培养出世界一流黑客的?
在键盘取代导弹的新时代,年轻黑客们的键盘将会成为加密货币的达摩克利斯之剑。
2025.02.21 - 前天
加密右翼浪潮下的 Web3 社区建设
从早期的技术理想主义到如今的金融化和资本集中化,Web3社区正在经历一场从“左”到“右”的深刻转变。
2025.02.21 - 前天
Meme 退潮、大额解锁,Solana“好运”用完了?
近期Meme明显“退潮”迹象,加上临近的超大额解锁,可谓是祸不单行,Solana压力倍增,它的“好运”真的用完吗了?
2025.02.21 - 前天
实测百度搜索 DeepSeek 满血版:“为我所用”还是“拿来主义”?
百度搜索目前已全量上线DeepSeek满血版并提供联网服务,其中PC端开放仅1小时就有超千万人使用。
2025.02.21 - 前天
月之暗面 MoBA 核心作者自述:一个 “新晋大模型训练师” 的三入思过崖
“从开源论文、开源代码出发,现在已经进化到开源思维链了嘛!”
2025.02.21 - 前天
访谈了 10 个职场卷王,看看他们都在用哪些 AI?
一文精选30+个职场“自我增效”实用AI。
AI
2025.02.21 - 前天
为何金融走在每一个生产变革的前面?
金融在以区块链为代表的第四次工业革命中,从交易结算、价值传递到创新激发、生产关系变革以及产业升级等多个维度,都发挥着不可替代的关键作用。
2025.02.21 - 前天
外部创新与内生困境:Crypto 在迷雾中航行
MemeCoin 的退潮背后或许正藏着一个转折点,人类的未来里未必只有AI。
2025.02.21 - 前天
Alliance DAO:AI 已彻底改变了创业公司,提前思考竞争优势比产品契合度更重要
在当下,提前思考 PMF 之后的竞争优势可能比以往任何时候都更加重要。
AI
2025.02.21 - 前天
2025年加密货币九大趋势:AI、DeFi、代币化与更多创新发展
探讨九大影响加密市场的核心趋势,从实体资产代币化(RWA)到 DeFi 与 AI 的结合,帮助你了解 2025 年最值得关注的区块链发展方向。