马斯克：人类知识总和作为 AI 训练数据已基本耗尽，合成数据将成为未来发展方向

今日运势评分

本月运势

丁丑月

震荡偏多

己土强身，卯酉相冲

戊不受田田主不祥
寅不祭祀神鬼不尝

宜

开市,交易,立券,挂匾,开光,解除,伐木,作梁,出火,入宅,移徙,安床,拆卸,动土,上梁,栽种,纳畜,安葬

忌

嫁娶,祭祀,出行,置产

月相

宵

冲顶回落

日冲

PEPE0.00 -3.18%

SUI4.70 2.44%

TON5.17 -1.60%

TRX0.24 -3.66%

DOGE0.32 -4.58%

XRP2.28 -1.74%

SOL186.26 -4.36%

BNB681.97 -0.89%

ETH3209.88 -2.02%

BTC92211.98 -1.75%

ETH Gas6.70 Gwei

贪婪

首页 深潮精选 Research 项目发现 7x24h︎快讯 最新活动

7x24h快讯︎

马斯克：人类知识总和作为 AI 训练数据已基本耗尽，合成数据将成为未来发展方向

2025.01.09 - 01月09日 19:06

深潮 TechFlow 消息，1 月 9 日，据 TechCrunch 报道，马斯克在与 Stagwell 董事长 Mark Penn 的直播对话中表示，人类知识总和作为 AI 训练数据已在 2024 年基本耗尽，这一观点呼应了 OpenAI 前首席科学家 Ilya Sutskever 在 12 月 NeurIPS 会议上提出的“数据峰值”理论。

马斯克认为，合成数据将成为未来 AI 发展的关键路径。目前，Microsoft、Meta、OpenAI 和 Anthropic 等科技巨头已在其旗舰 AI 模型中采用合成数据训练方案。其中，Microsoft 新开源的 Phi-4、Google 的 Gemma 模型、Anthropic 的 Claude 3.5 Sonnet 以及 Meta 最新的 Llama 系列模型均采用了合成数据进行训练或微调。

从成本角度看，AI 初创公司 Writer 使用近乎全部合成数据开发的 Palmyra X 004 模型仅花费 70 万美元，显著低于 OpenAI 同等规模模型 460 万美元的开发成本。然而研究显示，合成数据可能导致模型坍塌问题，使模型输出更不具创造性且偏见加剧，这源于原始训练数据中的偏见和局限性会在合成过程中被放大。根据 Gartner 统计，2024 年 AI 和分析项目中约 60% 的数据为合成生成。

原文链接

添加收藏

分享社交媒体

7x24h 快讯︎更多

01月10日 00:01: Coinbase 国际站将上线 AERO、BEAM、DRIFT 永续合约

01月09日 23:58: ETH 波段巨鲸过去 1 小时买入 5334 枚 WETH，价值 1760 万美元

01月09日 23:55: Metis 网络因交易量激增宕机，正通过升级 L1DTL 内存容量恢复网络

01月09日 23:52: 今日加密货币市值前 100 代币涨跌：NEO 涨 4.84%，AI16Z 跌 21.08%

01月09日 23:49: 比特币回升突破 94,000 美元

01月09日 23:47: 灰度数字资产大盘基金中比特币和以太坊占比调整为 90%

01月09日 23:40: 调查：2024 年配置加密货币的理财顾问占比翻倍至 22%，56% 顾问今年更倾向于投资加密货币

01月09日 23:37: 特朗普推出其首个基于比特币 Ordinals 协议的 NFT 系列数字交易卡

深潮精选更多

: AI Agent 多到看不过来？一文带你完整梳理当前热点叙事和项目
2025.01.09

: 加密早报：OKX 将上线 DUCK（DuckChain）现货，QCP Capital 称当前回调或为多头反弹蓄势
2025.01.09

: 加密早报：Backpack 收购 FTX EU，Jambo 宣布 1 月推出代币 $J
2025.01.08

: Crypto x AI Agents 淘金指南：5 大爆发赛道 + 潜力项目，抓住下一个百倍机会
2025.01.07

: 「AI+DeFi」趋势已现，DeFAI 板块这些项目值得你关注
2025.01.07

7x24h快讯

马斯克：人类知识总和作为 AI 训练数据已基本耗尽，合成数据将成为未来发展方向

据 TechCrunch 报道，马斯克在与 Stagwell 董事长 Mark Penn 的直播对话中表示，人类知识总和作为 AI 训练数据已在 2024 年基本耗尽，这一观点呼应了 OpenAI 前首席科学家 Ilya Sutskever 在 12 月 NeurIPS 会议上提出的“数据峰值”理论。马斯克认为，合成数据将成为未来 AI 发展的关键路径。目前，Microsoft、Meta、OpenAI 和 Anthropic 等科技巨头已在其旗舰 AI 模型中采用合成数据训练方案。

2025.01.0919:06:26