人工智能研究人员介绍GAIA:通用人工智能助手的基准测试工具

   日期:2025-02-25     来源:本站    作者:admin    浏览:69    
核心提示:      隶属于人工智能初创公司Gen AI、meta、AutoGPT、HuggingFace和Fair meta的一组研究人员开发了一个基准工具,供人工

  

  AI researchers introduce GAIA: A benchmark testing tool for general AI assistants

  隶属于人工智能初创公司Gen AI、meta、AutoGPT、HuggingFace和Fair meta的一组研究人员开发了一个基准工具,供人工智能助手制造商使用,特别是那些制造基于大型语言模型的产品的制造商,以测试他们的应用程序作为潜在的人工通用智能(AGI)应用程序。他们写了一篇论文,描述了他们的工具,他们将其命名为GAIA,以及如何使用它。这篇文章发表在arXiv预印本服务器上。

  在过去的一年里,人工智能领域的研究人员一直在私下和社交媒体上讨论人工智能系统的能力。一些人认为人工智能系统非常接近AGI,而另一些人则认为相反的情况更接近事实。所有人都认为,这样的系统将在某一时刻赶上甚至超越人类的智力。唯一的问题是什么时候。

  在这项新的努力中,研究小组指出,为了达成共识,如果真正的AGI系统出现,必须有一个评级系统来衡量它们彼此之间以及与人类的智力水平。他们进一步指出,这样一个系统必须从一个基准开始,这就是他们在论文中提出的建议。

  该团队创建的基准包括向未来的人工智能提出一系列问题,并将答案与随机一组人类提供的答案进行比较。在创建基准时,团队已经确保这些问题不是典型的人工智能问题,而人工智能系统往往在这些问题上得分很高。

  相反,他们提出的问题往往是那种对人类来说很容易回答,但对计算机来说很难回答的问题。在很多情况下,找到研究人员设计的问题的答案需要经历多个步骤的工作和/或“思考”。举个例子,他们可能会问一个特定网站上的问题,比如,“根据维基百科的报道,根据美国农业部的标准,一品脱冰淇淋的脂肪含量高出或低于多少?”

  研究团队测试了他们使用的人工智能产品,发现它们都没有接近基准,这表明该行业可能不像一些人想象的那样接近开发真正的AGI。

  更多信息:gr

  goire Mialon等人,GAIA:通用人工智能助手的基准,arXiv(2023)。DOI: 10.48550/ arXiv .2311.12983

  ?2023 Science X Network

  引用:人工智能研究人员介绍GAIA:通用人工智能助手的基准测试工具(2023年,12月1日)检索自https://techxplore.com/news/2023-12-ai-gaia-benchmark-tool-general.html本文档

  作品受版权保护。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。的有限公司

  内容仅供参考之用。

 
打赏
 
更多>同类文章

推荐图文
推荐文章
点击排行