当前位置 当前位置:首页 > 值得一看 > 热门事件

“人类终极考试”基准测试发布:顶级AI系统表现惨淡,准确率均未超10%

2025-01-25小罗网络收集218

“人类终极考试”基准测试发布:顶级AI系统表现惨淡,准确率均未超10% 图1

“人类终极考试”基准测试发布:顶级AI系统表现惨淡,准确率均未超10%


非营利组织“人工智能安全中心”(CAIS)与Scale AI联合推出名为“人类终极考试”的新型基准测试,旨在评估前沿AI系统的综合能力。该测试由来自50个国家500多个机构的近1000名学科专家出题,涵盖数学、人文学科和自然科学等领域,题目形式多样,包括结合图表和图像的复杂题型。

初步研究显示,所有公开可用的旗舰AI系统在该测试中的回答准确率均未超过10%,表明当前AI技术在应对复杂、综合性问题时仍存在明显短板。CAIS和Scale AI计划向研究社区开放该测试,以帮助评估新开发的AI模型。
附件内容

本站提供的一切软件、教程和内容信息仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途。本站所有信息均来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序,请支持正版,购买注册,得到更好的正版服务。如有侵权不妥之处请致信 E-mail:[email protected] 我们会积极处理。敬请谅解!


标签:系统  发布  人类  考试  测试  
   相关评论
本站资源来自互联网收集 仅供用于学习和交流 我们尊重任何软件和教程作者的版权 请遵循相关法律法规 本站一切资源不代表本站立场
投诉侵权邮箱:[email protected] © 小罗资源网