今日运势评分

0

本月运势

辛巳月

震荡偏多

劫财夺财,丑克水
戊不受田田主不祥
子不问卜自惹祸殃

纳采,订盟,嫁娶,造车器,祭祀,祈福,求嗣,开光,出火,拆卸,修造,动土,进人口,挂匾,入宅,移徙,安床,栽种,入殓,破土,安葬,除服,成服

开市,立券

月相

下弦

底部反弹

日冲

Powered by RitMEX

TRUMP12.82 -4.71%

SUI3.79 -4.33%

TON2.99 -5.72%

TRX0.27 -2.38%

DOGE0.22 -5.23%

XRP2.36 -3.11%

SOL165.25 -6.07%

BNB646.34 -1.00%

ETH2502.33 -2.88%

BTC105276.05 -0.47%

ETH Gas3.43 Gwei

贪婪
74

斯坦福 HAI《2025 年人工智能指数报告》精华

人工智能更高效、更易获取且更经济实惠;此外,亚洲人对人工智能更为乐观。

作者:Stanford HAI(斯坦福人工智能研究院)

编译:Felix,PANews

斯坦福 HAI 近期发布了长达 456 页的《2025 年人工智能指数报告》。以下是人工智能趋势的一些关键要点:

1.人工智能变得比想象的要强大得多

在新的基准测试 MMMU、GPQA 和 SWE-bench 中,人工智能的表现大幅提升:得分分别提高了 18.8%、48.9% 和 67.3%。除了基准测试外,人工智能系统在生成高质量视频方面取得重大进展,在某些情况下,大型语言模型(LLM)甚至在限时的编程任务中超越了人类。

注:

MMMU 是一个精心设计的新型基准,专为大学水平的多学科多模态理解和推理而设,旨在评估基础模型在广泛任务中的专家级多模态理解能力。

GPQA 是一个具有挑战性的数据集,包含 448 道由不同领域专家编写的高质量且难度极高的多项选择题。在相应领域拥有或正在攻读博士学位的专家,准确率仅为 65%,而技能高超的非专家验证者尽管平均花费时间超过 30 分钟且可不受限制地访问网络,准确率也只有 34%。

SWE-bench 是一个用于评估大型语言模型(LLM)在从 GitHub 收集的真实世界软件问题上的表现的基准。

斯坦福HAI《2025年人工智能指数报告》精华

2.人工智能更高效、更易获取且更经济实惠

参数更少的小型人工智能模型的能力日益增强:在短短两年内,参数数量减少了约 100 倍,但其在大规模多任务语言理解(MMLU)测试中的得分仍超过 60%。

开源模型与闭源模型之间的差距也在缩小,在某些基准测试中,性能差距从 8% 降至仅 1.7%。

斯坦福HAI《2025年人工智能指数报告》精华

此外,从 2022 年 11 月到 2024 年 10 月,达到 GPT-3.5 水平的系统的推理成本下降了 280 倍以上。在硬件层面,成本每年下降 30%,而能源效率每年提高 40%。

高级人工智能的门槛正在迅速降低。更不用说像 DeepSeek 这样的稀疏模型的开发,在专家混合(MoE)的结构下,只有相关的参数会被激活以回答用户的查询,使整个事情更加高效。

的确,随着规模更小但能力更强的 AI 模型不断涌现,AI 模型训练的要求降低了,成本效益高的分布式训练有望在未来十年成为主流。目前有一些顶尖项目正在基于不同的理论框架开展相关研究。

3.人工智能正日益融入日常生活

2023 年,美国食品药品监督管理局(FDA)批准了 223 款人工智能辅助医疗设备,而 2015 年这一数字仅为 6 款。在道路上,自动驾驶汽车已不再是实验品:美国最大的运营商之一 Waymo 每周提供超过 15 万次自动驾驶服务,而百度的 Apollo Go 无人驾驶出租车车队如今已在中国多个城市投入运营。

斯坦福HAI《2025年人工智能指数报告》精华

4.企业在人工智能领域的投资大幅增加,推动创纪录的投资和应用

人工智能在商业中的应用也在加速:2024 年,78% 的组织正在使用人工智能,而前一年这一比例为 55%。与此同时,越来越多的研究证实,人工智能能够提高生产力,并有助于缩小整个劳动力队伍中的技能差距。

事实上,随着人工智能导致客户期望值呈指数级增长,现有解决方案会在一夜之间显得过时,从而使现有企业失去适应的机会,产品市场匹配崩溃的情况会更频繁地发生。

5.尽管全球对人工智能的乐观情绪上升,但亚洲人对人工智能更为乐观

在中国(83%)、印度尼西亚(80%)和泰国(77%)等国家,大多数人认为人工智能产品和服务利大于弊。相比之下,在加拿大(40%)、美国(39%)和荷兰(36%)等地,乐观情绪仍远低于此。

不过,这种态度正在转变:自 2022 年以来,一些此前持怀疑态度的国家的乐观情绪显著增长,包括德国(增长 10%)、法国(增长 10%)、加拿大(增长 8%)、英国(增长 8%)和美国(增长 4%)。

斯坦福HAI《2025年人工智能指数报告》精华

6.人工智能在科研中的影响力日益增强,已成为推动科学进步的重要驱动力

人工智能日益增长的重要性在重大科学奖项中有所体现:两项诺贝尔奖分别授予了在深度学习(物理学)和将其应用于蛋白质折叠(化学)方面做出贡献的研究,而图灵奖则表彰了在强化学习方面的开创性贡献。

显然,人工智能正以指数级、出乎意料的速度飞速发展,这对大多数人来说意义非凡。因此,人工智能安全也变得越来越重要。虽然人工智能让伪造变得更容易,但密码学则让伪造变得更加困难。期待着那些能够利用区块链的原生属性(可验证性和透明性)来构建这一领域实用解决方案的加密项目。

欢迎加入深潮TechFlow官方社群

Telegram订阅群:https://t.me/TechFlowDaily
Twitter官方账号:https://x.com/TechFlowPost
Twitter英文账号:https://x.com/BlockFlow_News
作者Stanford HAI@StanfordHAI
相关文章
2025.05.19 - 4 小时前
中国 AI 大厂,被 Deepseek 掀了牌桌之后
当技术范式重构,强者也不得不重新起跑。
AI
2025.05.19 - 4 小时前
YZi Labs 参投,一文读懂 AI「数据挖矿」项目 Gata
Gata 的 GPT-to-Earn 和 DataAgent 能否实现人人可参与的可「数据挖矿」?
2025.05.19 - 9 小时前
Coinbase Venture:链上 AI 兴起,全赛道版图与商业模式一览
链上 AI 将加密领域扩展到潜在的数十亿个由 AI 驱动的参与者。
AI
2025.05.16 - 3 天前
Allora Network 和 gumi 宣布战略合作,将去中心化 AI 引入游戏及更多领域
随着 gumi 继续扩展其 Web3 游戏计划(包括 OSHI3 平台),以及 Allora 推进其去中心化 AI 基础设施,这一合作是朝着更开放、更智能、更无需信任的游戏环境迈出的一步。
2025.05.16 - 3 天前
Cobo 稳定币周报 NO.7:Stripe 和 Tether 抢占 AI 支付入口,稳定币或成 AI 经济体的原生货币层
全球支付正在经历一场变革,而稳定币是这场革命的核心。它不仅在重塑跨境交易,更在重新定义支付的未来。
2025.05.13 - 6 天前
对话RockFlow创始人Vakee:杀死一切App,从股神少女到AI赌徒 |100 AI Creators
在Vakee看来,Agent不是app的升级版,而是下一代用户界面。她甚至断言:「所有App未来都会消失,都会被Agent取代。」
2025.05.13 - 6 天前
AI 经济如何超越 DeFi TVL 神话?
本文将探讨能够构成AI原生经济支柱的新原语。
2025.05.13 - 6 天前
AI 时代的创业革命:Seed-Strapping 模式如何颠覆传统融资思维?
为什么它最适合 AI 原生公司?
2025.05.09 - 10 天前
麦肯锡的 Lilli 案例为企业 AI 市场提供了哪些发展思路?
相比过去比拼算力、算法的资源垄断式跃进,当市场把重心放到边缘计算 + 小模型方式时,会带来更大的市场活力。
2025.05.09 - 10 天前
AI in Crypto:在 Meme 狂热之后是一地鸡毛还是破茧重生?
本研究文章将叙述并评析目前 AI 在 Web3 领域的演化路径。
AI