谷歌推出了迄今为止最先进、最通用的人工智能(AI)模型双子座(Gemini)。该工具将集成到谷歌平台Bard和最新的Pixel 8 Pro智能手机中。谷歌首席执行官桑达尔·皮查伊强调了Gemini在几个行业领先基准上的领先表现。Gemini 1.0将提供不同的版本:Ultra、Pro和Nano。“这些是双子座时代的首批模型,实现了我们今年早些时候创立谷歌深度思维时的愿景。这个新时代的模型代表了我们公司在科学和工程方面所做的最大努力之一。”Pichai说。
Gemini是谷歌团队(包括谷歌研究院)的一项合作成果,旨在能够“概括并无缝理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。”。在一次演示中,谷歌展示了双子座是如何用人类的眼睛看到、理解、实时评估并建议下一步的。对于高度复杂的任务,Gemini Ultra将是更大、更有能力的型号,而Gemini Pro将擅长处理各种任务,而Gemini Nano将直接在设备上处理任务。从今天开始,Gemini Nano将在Pixel 8 Pro上使用,支持Recorder应用程序中的摘要和通过Gboard(从WhatsApp开始)的智能回复等新功能。Gemini将在其他谷歌产品和服务中推出,包括搜索、广告、Chrome和Duet AI。
从12月13日开始,开发者和企业客户将能够通过Google AI Studio或Google Cloud Vertex AI中的Gemini API访问Gemini Pro。Android开发者还可以通过AICore使用Gemini Nano,这是Android 14的一项新系统功能,从Pixel 8 Pro设备开始。Gemini Ultra将向有限的客户、开发人员、合作伙伴和安全专家提供初步实验和反馈,然后在明年年初向开发人员和企业客户推出。
与此同时,巴德将获得“专门优化的Gemini Pro英语版本,用于高级推理、规划、理解等。”明年年初,谷歌将推出Bard Advanced,用户将首先获得其最先进的模型和功能,从Gemini Ultra开始。谷歌表示,在语言模型研究和开发中常用的32项基准测试中,Gemini Ultra的性能在30项测试中超过了目前最先进的水平。Gemini Ultra的得分为90.0%,是第一个在大规模多任务语言理解方面超越人类专家的模型,该模型使用数学、物理、历史、法律、医学和伦理学等57门学科的组合来测试对世界的了解和解决问题的能力。此外,该公司表示,Gemini可以“理解、解释并生成世界上最流行的编程语言的高质量代码,如Python、Java、c++和Go”。