注意力的变革正在进行中。人们在线购物、交流和娱乐的方式似乎层出不穷,广告要脱颖而出,就必须具有相关性且有用——事实上,这比以往任何时候都更加重要。在各个渠道上,企业都需要能吸引人们注意力的广告素材。
在此之前,大规模化实现这一目标似乎是不可能的,但生成式 AI 正在改变这一局面。这项技术正在帮助我们更好地满足广告主的需求,从全新的沉浸式广告体验到效果出色的广告素材,它为整个营销流程带来了新的可能。在我们共同打造营销的下一个时代之际,我们将在 Google Marketing Live (GML) 上分享最新的创意素材生成控制、全新的广告体验以及视觉化叙事等更多功能。
我们一直致力于让跨营销渠道的广告素材制作更加便捷和迅速。广告素材的多样性对于打造影响力强大的广告至关重要,而随着生成式 AI 在效果最大化广告系列(Performance Max)中的应用,越来越多的广告主可以更轻松地实现这一目标。我们发现,那些成功将效果最大化广告系列的广告效力提升至“极佳”的广告主,其转化平均增加了 6%。¹Event Tickets Center 作为效果最大化广告系列中生成素材资源功能的首批测试者之一,该功能使团队的广告素材制作提高了 5 倍,同时显著减少了时间和人力成本。
当然,广告效果并非是对广告素材的全部要求,素材资源也需要遵循品牌规范。很快,广告主将能够在效果最大化广告系列中分享他们的字体和颜色指南,并且提供有用的图片作为参考,从而生成新的更多的符合品牌标准的素材资源。
利用 Google AI 创作效果出色的广告,同时确保符合你的品牌规范
我们还将推出新的图片编辑功能,让广告主能够尝试添加新的物品、扩展背景、裁剪图片,从而适应不同的格式、尺寸和方向。此外,零售商也将能够充分利用这些编辑功能,在 Google Merchant Center 突出展示他们的产品。随着广告主尝试不同广告素材创意,Google AI 还将生成更多建议,展示产品在各种环境和场景中的效果,以便广告主能够挑选心仪的素材用于各个营销渠道。
通过 AI 赋能的图片编辑功能,将您的产品置于中心
即使广告中的图片和文本素材再出色,消费者在未能亲眼看到或试穿产品的情况下,仍然难以对在线购买决策充满信心,然而,我们的研究发现,这种信心对于品牌而言至关重要。生成式 AI 则有助于企业更有效地传达产品信息,进而通过广告激发消费者的信心。很快,广告主将能够借助如虚拟试穿(Virtual Try-On)和生成的 3D 广告等沉浸式的视觉效果来增强他们的购物广告(Shopping ads)。同时,我们还将推出一项新功能,让消费者能够深入探索广告内容,查看广告主提供的产品视频、简介以及相似产品推荐。
通过带有视频宣传信息的购物广告增强购物者信心
我们目前还在搜索中测试一种全新的广告体验,以帮助引导人们复杂的消费决策。假设有朋友正要翻新房屋并搜索了“短期储存”。当他们点击某个储存设施的广告时,将被引导进入一个动态的体验,在这里,AI 将协助他们确定具体的储存需求。如果他们分享了家具的照片、预算等细节信息,Google AI 还可以推荐合适的储存室大小和打包材料,并且会提供网站上的购买链接。
通过搜索广告中 AI 赋能的推荐,解锁全新的互动广告体验
除了视觉沉浸式广告,广告主还可以通过我们最具视觉沉浸感的渠道——YouTube,Discover 和 Gmail——与消费者建立联系。去年,我们推出了需求开发广告系列(Demand Gen),其每月的触达用户数可达 30 亿。²这些广告系列已成功帮助广告主发掘需求并促进转化的提升。很快,我们将在 Display & Video 360 以及 Search Ads 360 中推出这一广告系列给更多广告主使用。
YouTube Shorts 每月有超过 20 亿登录用户,³他们通过短视频发现新的兴趣点。为了帮助企业吸引这些观众,我们正在推出新的广告格式和功能,其中包括竖屏广告格式、促进用户行动的广告贴纸(ad stickers),以及从广告主账号和需求开发广告系列商品流中的图片自动生成的全新动画图片广告(animated image ads)。
在 YouTube Shorts 上通过动画图片广告展示相关产品
广告在消费者获取信息的过程中始终扮演着重要角色。在 Google I/O 大会上,我们宣布了搜索中的 AI Overviews 已经面向美国的所有用户推出,并将很快推广到更多国家。当 AI Overviews 提供的结果较搜索引擎的结果更加有帮助时,它就会出现在搜索结果中。借助 AI Overviews,人们能够访问更多样化的网站,从而获得更复杂问题的答案。我们还发现,在相同查询下,AI Overviews 中的链接点击量高于在传统网页列表的点击量。事实上,我们发现,使用 AI Overviews 的用户不仅搜索频率更高,而且对搜索结果也表示出更高的满意度。当人们从 AI Overviews 中点击链接时,这些点击的质量更高,用户更有可能在网站上停留更长时间。随着我们不断测试和优化搜索体验,我们将继续致力于为发布商和创作者提供有价值的流量。
在初期测试阶段,我们收到用户反馈称显示在 AI 生成概览上下方的广告十分有用。很快,我们将开始在美国用户中在 AI Overviews 里测试搜索和购物广告。当广告与用户查询以及 AI Overviews 中的信息相匹配时,将有机会在 AI Overviews 中一个被明确标注为“赞助”字样的部分展示。广告主无需进行任何额外操作,现有的搜索广告、效果最大化广告系列及标准购物广告系列(Standard Shopping campaigns)中的广告都有机会在 AI Overviews 中展示。随着我们不断探索和进步,我们将继续测试和学习新的广告格式,并会积极收集广告主和行业内的反馈。
在消费者进行新的探索时吸引他们。很快,我们将开始在美国用户中在 AI Overviews 里测试搜索和购物广告。
虽然这些更新对企业都大有帮助,但 AI 的能力完全取决于它所获取的信息。为了充分利用 AI,企业需要构建一个坚实的基于第一方数据的衡量策略。许多企业拥有来自不同来源的数据,如转化数据、电子邮件列表和调查问卷等。然而,整合这些数据一直是一项繁琐复杂的任务,对于小型企业来说更是如此。我们正通过 Google Ads 数据管理器(Data Manager)简化这一过程,为广告主提供便利,现在,该功能已全面开放。广告主现在可以轻松地将第一方数据源汇集于一处,方便使用、分析和启用。这意味着,过去可能需要数周或数月才能完成的任务,现在只需几分钟即可完成。
通过 Google Ads 数据管理器简化关联过程并使用您的第一方数据
以我们的 AI 原则和客户反馈为指导,这些最新的 AI 创新将助力营销人员拓宽思维,大胆创新,并更快地取得成果。Google AI 的存在是为了协助,而非替代。人类的创造力、战略洞察力和专业知识始终是营销人员无法替代的优势。同时,我们也深知,尽管这些进步令人振奋,但对于许多企业来说,转向 AI 仍需要做大量的工作。因此,我们在推进产品时始终保持谨慎,并期待在此过程中收到您的反馈。
在 GML,我们还将介绍新的方式,让商家可以借助生成式 AI 更深入地与客户建立联系,同时更高效地推广其品牌和产品。欢迎访问我们的帮助中心网站,了解更多关于我们的商家和广告创新。
观看主题演讲和数字展会总结以获取更多新闻,并加入#GML2024 的讨论。
我们推出了 Gemini 系列模型的多项更新,包括我们针对速度与效率的轻量模型 Gemini 1.5 Flash,以及 Astra 项目,我们针对未来 AI 助理的愿景。
开发者和企业客户已经在以各种令人惊叹的方式开始使用 1.5 Pro,他们发现,1.5 Pro 的长上下文窗口,多模态推理能力,以及出色的整体性能非常实用。
从用户反馈中,我们了解到,有些应用场景需要更低的延迟和更低的部署成本。这激励着我们不断创新,所以今天,我们推出了 Gemini 1.5 Flash:一个相较于 1.5 Pro 更轻量的模型,旨在快速高效地进行规模化服务。
100 万令牌上下文窗口的 1.5 Pro 和 1.5 Flash 目前都已在 Google AI Studio 和 Vertex AI 中发布公开预览版。现在,使用 API 的开发者和 Google Cloud 客户还可以通过候补名单获取 200 万令牌上下文窗口的 1.5 Pro。
我们还将推出开放模型系列的更新,发布我们下一代开放模型 Gemma 2,并通过 Astra 项目与大家分享 AI 助理的未来。
新推出的 1.5 Flash,速度更快、效率更高
1.5 Flash 是 Gemini 系列模型中最新成员,它也是通过 API 提供的速度最快的 Gemini 模型。在具备突破性的长文本能力的情况下,它针对大规模地处理高容量、高频次任务进行了优化,部署起来更具性价比。
尽管它比 1.5 Pro 更轻量级,但它在处理大量信息时具有强大的多模态推理能力,就其大小而言达到了令人印象深刻的质量。
1.5 Flash 在总结摘要、聊天应用、图像和视频字幕生成以及从长文档和表格中提取数据等方面表现出色。这是因为我们利用 1.5 Pro 对该模型进行了被称作“蒸馏”(distillation)的训练,将较大模型中最核心的知识和技能迁移到了更小、更高效的模型中。
如需了解关于 1.5 Flash 的更多信息,请参阅我们新发布的 Gemini 1.5 技术报告、了解 1.5 Flash的性能和价格。我们将在即将更新的 Gemini 1.5 技术报告中分享更多细节。
1.5 Pro 的重磅更新
在过去几个月中,我们已经大幅改善了 1.5 Pro,这是我们在各种任务中综合表现最佳的模型。
除了将模型的上下文窗口扩展到支持 200 万个令牌之外,我们还通过改进数据和算法,提升了模型的代码生成、逻辑推理与规划、多轮对话以及音频和图像理解能力。我们看到了每个任务的公开基准和内部基准层面有了显著改进。
现在,1.5 Pro 可以遵循越来越复杂和细致的指令,包括指定产品级行为的指令,如角色、格式和风格。针对特定的使用场景,例如,打造聊天智能体的个性和回答风格,或通过多个功能调用来自动化工作流程,我们改进了对模型回应的控制权。同时,我们也已经让用户能够通过设置系统指令来引导模型的行为。
我们还在 Gemini API 和 Google AI Studio 中添加了音频理解功能,现在 1.5 Pro 可以对 Google AI Studio 中上传的视频进行图像和音频推理。现在,我们已经将 1.5 Pro 整合到 Google 产品中,包括 Gemini Advanced 和 Workspace 应用程序。
如需了解关于 1.5 Pro 的更多信息,请参阅 Gemini 技术页面。我们新发布的 Gemini 1.5 技术报告中将公布更多细节。
Gemini Nano 理解多模态输入
Gemini Nano 从仅可处理文本输入扩展到可以处理图像输入。从 Pixel 开始,使用 Gemini Nano 多模态功能的应用将能够像人类一样理解世界——不仅仅通过文本,还可以通过视觉、声音和语言。
如需了解更多信息,请访问 Android Gemini 1.0 Nano。
今天,我们还将分享一系列关于 Gemma 的更新,这是我们用创建 Gemini 模型相同的研究和技术打造的开放模型系列。
我们将推出 Gemma 2,我们为负责任的 AI 创新打造的下一代开放模型。Gemma 2 采用了一种新型架构,实现了突破性的性能和效率,并且将包含新的大小。
Gemma 模型系列也在不断扩展,新推出了受 PaLI-3 启发开发的首款视觉语言模型 PaliGemma。我们还升级了负责任的生成式 AI 工具包(Responsible Generative AI Toolkit),加入了 LLM Comparator 来评估模型输出的质量。
如需了解更多信息,请访问 开发者博客。
Google DeepMind 的使命是以负责任的方式构建 AI,造福人类。作为这项使命的一部分,我们一直希望开发能在日常生活中提供帮助的通用 AI 智能体。这就是为什么在今天,我们将通过 Astra(高级视觉和对话响应智能体)项目分享我们在构建未来 AI 助理的进展。
要做到真正实用, 智能体需要能够像人一样理解周围复杂多变的环境并做出反应——它需要能接收并记忆所见所闻,从而了解上下文信息并采取行动。它还需要具备主动性、“会学习”并能满足个性化需求,这样用户才能自然地与它交谈,不会有滞后或延迟。
虽然我们在开发能够理解多模态信息的 AI 系统方面取得了惊人的进步,但要将回答时间缩短到可对话的程度,仍是一项非常艰巨的工程挑战。在过去几年中,我们一直在努力改进模型的感知、推理和对话方式,让交互的节奏和质量更加自然。
基于 Gemini 模型,我们已经开发了智能体原型,它通过对视频帧进行连续编码,将视频和语音输入组合成事件时间轴,并缓存这些信息以便高效召回,从而能够更快地处理信息。
我们还利用领先的语音模型增强了这些智能体的声音效果,为它们提供了更丰富的语调。这些智能体可以更好地理解它们的使用环境,并在对话中做出快速回答。
凭借这些技术,我们不难想象,在未来,通过手机或眼镜,人们就能让随身 AI 专家助理提供服务。今年晚些时候,我们将把其中一些功能带到 Gemini 应用和网络体验等 Google 产品中。
迄今为止,我们的 Gemini 系列模型已经取得了惊人的进步,我们也始终在努力推动前沿技术实现更进一步的发展。通过对创新产品线的不懈投入,我们不仅得以探索前沿新理念,同时也为 Gemini 在更多新的使用场景中大放异彩提供了可能。
如需了解更多,参阅 Gemini 及其能力。
作者:Sundar Pichai,Google 和 Alphabet CEO
Google 已全面进入 Gemini 时代。
在深入探讨之前,我想先回顾一下我们所处的时刻。十多年来,我们一直在 AI 领域进行投入,并在各个层面进行创新:研究、产品、基础设施,今天我们将对此进行全面讨论。
尽管如此,我们仍处于 AI 平台转型的初期。我们看到了为创作者、开发者、初创公司以及每一个人所带来的巨大机遇。帮助推动这些机遇正是我们 Gemini 时代的意义所在。让我们开始吧。
一年前,在 I/O 大会上,我们首次分享了 Gemini 的计划:一个从一开始就构建为原生多模态的前沿模型,能够跨文本、图像、视频、代码等多种数据类型进行推理。它标志着将任意输入转换成任意输出的重要一步——新一代的“I/O”。
自那以来,我们推出了首批 Gemini 模型,这是我们迄今为止功能最强大的模型。它们在每个多模态基准测试中都拥有卓越的表现。两个月后,我们又推出了 Gemini 1.5 Pro,它在处理长上下文方面取得了重大突破,能够稳定地在生产环境中运行 100 万个令牌(Token),比目前任何其他大规模基础模型都要多。
我们希望每个人都能从 Gemini 的功能中受益。因此,我们立即行动起来,与大家分享这些进展。目前,超过 150 万的开发者在使用我们各种工具中的 Gemini 模型。你们使用它来调试代码、获得新的见解并打造下一代的 AI 应用。
我们也在不断将 Gemini 的突破性功能以强大的方式整合到我们的产品中。今天,我们将展示搜索、Photos、Workspace 和 Android 等产品中的实例。
今天,我们所有拥有 20 亿用户的产品都在使用 Gemini。
我们还推出了全新的体验,包括在移动设备上,人们现在可以通过 Android 和 iOS 上的应用程序直接与 Gemini 互动, Gemini Advanced让用户还可以使用我们功能最强的模型。仅在三个月的时间里,已有超过一百万人注册试用,并且势头依然强劲。
Gemini 带来的最令人兴奋的变革之一是在 Google 搜索中。
在过去的一年中,作为我们生成式搜索体验(Search Generative Experience)的一部分,我们已经回答了数十亿个搜索查询。人们正在以全新的方式使用搜索,提出全新类型的问题,作出更长、更复杂的查询,甚至是通过照片进行搜索,并获得网络上的最佳信息。
我们一直在 Labs 之外对这种体验进行测试。我们倍受鼓舞地看到,不仅搜索的使用量有所增加,用户满意度也得到了提升。
我很高兴宣布,我们将于本周在美国向所有用户推出这一全新改版的 AI Overviews 体验。我们很快也将把这项体验推广到更多国家。
在搜索领域正发生着诸多创新。得益于 Gemini,我们能够打造更为强大的搜索体验,包括在我们的产品之中。
Google Photos 就是一个例子,在大约九年前,我们发布了这款产品,自那以来,人们一直用它来整理最珍贵的回忆。如今,每天上传的照片和视频数量超过 60 亿。
人们喜欢使用 Photos 来搜索他们生活中的点滴。借助 Gemini,我们让这一切变得更加简单。
假设你在停车场缴费时,却想不起自己的车牌号。以往,你需要在 Photos 中搜索关键词,然后翻找多年积累的照片来寻找车牌。但现在,你只需直接询问 Photos 即可。它能够识别出经常出现的车辆,通过多方信息交叉验证判断出哪一辆是你的,并提供车牌号码。
Ask Photos 还能够帮助你以更深入的方式重温回忆。例如,你可能正在回味女儿 Lucia 成长的早期重要时刻。现在,你可以直接问 Photos:“Lucia 是什么时候学会游泳的?”
你甚至可以跟进提出更复杂的问题:“向我展示 Lucia 的游泳技能是怎么进步的。”
在这里,Gemini 不再只是进行简单的搜索,它会识别不同的上下文——从在游泳池中扑腾,到在海洋中浮潜,再到她游泳证书上的文字和日期。Photos 会将所有这些信息整合在一起形成一个总结,让你能够全面了解,并再次重温那些美妙的回忆。我们将在今年夏天推出 Ask Photos,并将持续增加更多功能。
为了理解跨越不同格式的各种知识,我们从一开始就将Gemini 打造成多模态的。它是一个内置了所有模态的模型。因此,它可以理解不同类型的输入,并找到它们之间的联系。
多模态从根本上扩展了我们可以提出的问题以及我们将得到的答案。而长文本能力则使其更进一步,让我们能够引入更多信息:数百页文本、数小时音频或一小时视频、整个代码存储库……或者,如果你愿意,大约 96 份芝士蛋糕工厂餐厅的菜单。
处理这么大量的菜单,你可能需要 100 万令牌的上下文窗口,而现在通过 Gemini 1.5 Pro 就可以实现。开发者们就一直在以各种非常有趣的方式使用它。
在过去的几个月里,我们已经推出了具有长上下文能力的 Gemini 1.5 Pro的预览版,我们还对翻译、编码和推理的质量进行了一系列改进。从今天开始,你也将在模型中看到这些更新。
现在我很高兴地宣布,我们将向全球所有开发者推出改进版的 Gemini 1.5 Pro。此外,从今天开始,具有100 万令牌上下文能力的 Gemini 1.5 Pro 也可供 Gemini Advanced 的消费者直接使用,包含 35 种语言。
100 万令牌正在开辟全新的可能性。这已经很振奋人心,但我认为我们还可以更进一步。
今天,我们将上下文窗口扩展到 200 万个令牌,并将其以非公开预览版的方式提供给开发者们。
过去几个月来我们所取得的进展让我非常激动,这代表着我们朝无限上下文的最终目标又迈出了一步。
这在 Google Workspace 中体现得更加淋漓尽致。
长期以来,人们总在 Gmail 中搜索他们的电子邮件。而现在我们正通过 Gemini 使其变得更加强大。例如,作为家长,你希望随时了解孩子在学校发生的一切,Gemini 就可以帮助你!
现在,我们可以让 Gemini 总结学校最近发来的所有电子邮件。在后台,它可以识别相关电子邮件,甚至分析 PDF 等附件,你可以获得一份包含关键要点和待办事项的摘要。也许你本周正在旅途中,无法参加家长会议,而会议录音长达一个小时。如果这份录音来自于 Google Meet,你就可以让 Gemini 为你提供重点内容。倘若有个家长小组正在寻找志愿者,而你那天正好有空,那么当然,Gemini 还可以帮助你起草回复邮件。
还有无数其他例子可以说明 Gemini 如何让生活更轻松。今天起 Gemini 1.5 Pro 已经应用在 Workspace Labs中。Aparna 将分享更多。
我们刚刚看了一个文本输出的例子,但通过多模态模型,我们可以做得更多。
我们在这方面已经取得了进展,未来还会有更多。NotebookLM 中的音频概述(Audio Overview)就显示了在这方面的进展:它通过 Gemini 1.5 Pro,可以基于你的源文件生成个性化和交互式音频对话。
这就是多模态带来的可能性,很快你就能够将输入和输出进行混合和匹配,这就是我们所说的新一代 I/O的意思。但如果我们还能再进一步呢?
在这一方面更进一步就是我们在 AI 智能体(AI Agents)上看到的机遇之一。我认为它们是可以推理、规划和记忆的智能系统。它们能够提前多步“思考”,跨软件和系统工作,所有这些都是为了帮助你完成任务,而最重要的是要在你的监督之下。
我们仍处于早期阶段,但让我向你展示一些我们正在努力解决的应用案例的类型。
让我们以购物为例。买鞋很有意思,但当鞋子不合适需要退货时就不那么有趣了。
想象一下,如果 Gemini 可以为你完成所有步骤:
在你的收件箱中搜索收据……
从你的电子邮件中找到订单号……
填写退货表格……
甚至安排 UPS 取件。
那是不是容易多了?
让我们再举一个更复杂一些的例子。
假设你刚搬到芝加哥。想象一下 Gemini 和 Chrome 能够共同协作帮助你做很多准备工作——代替你组织、推理、综合分析等。
比如,你想要探索这座城市并找到附近的服务——从干洗店到遛狗服务,你还必须在数十个网站上更新你的新地址。
现在 Gemini 可以胜任这些工作,并在需要时提示你提供更多信息。这样事情始终在你的掌控之中。
这部分非常重要——当我们做这些体验的原型设计时,我们深思熟虑如何以一种私密、安全且对每个人都适用的方式来进行。
这些都是简单的应用案例,但它们可以让你很好地了解到,通过构建能够代表你去提前思考、推理和计划的智能系统,我们希望能够解决的问题类型。
Gemini 凭借其多模态、长上下文和智能体,使我们更接近我们的最终目标:让 AI 助力每个人。
我们认为,这是我们在达成使命方面取得最大进展的方式:整合以各种方式输入的全球信息,使其可以通过任何输出方式被获取,并将全球信息与你的世界中的信息结合起来,以一种真正对你有用的方式进行呈现。
我们已经收到了大家对 1.5 Pro 及其长上下文窗口的热情反馈,但我们也从开发人员那里了解到,他们想要更快、更具成本效益。因此,明天,我们将推出 Gemini 1.5 Flash,一个为规模化构建的更轻量级的模型,它针对以低延迟和成本为重的任务进行了优化。1.5 Flash 将于周二在 AI Studio 和 Vertex AI 中提供。
展望未来,我们始终希望构建一个在日常生活中有用的通用智能体。Astra 项目展示了多模态理解和实时对话能力。
我们还在视频和图像生成方面取得了进展,推出了 Veo 和 Imagen 3,并推出了 Gemma 2.0——我们为负责任的 AI 创新打造的下一代开放模型。阅读更多关于 Demis Hassabis 的信息。
训练最先进的模型需要大量的计算能力。过去六年中,行业对机器学习计算能力的需求增长了 100 万倍。而且,每年都会以十倍的速度增长。
Google 在这方面具有优势。25 年来,我们一直在投资世界一流的技术基础设施,从支持搜索的尖端硬件,到为我们的 AI 进步提供支持的定制张量处理单元(tensor processing units)。
Gemini 完全在我们的第四代和第五代 TPU 上进行训练和服务。包括 Anthropic 在内的其他领先的 AI 公司也已经在 TPU 上训练了他们的模型。
今天,我们很高兴地宣布推出第六代 TPU—— Trillium。Trillium 是我们迄今为止性能最强、效率最高的 TPU,与上一代 TPU v5e 相比,每个芯片的计算性能提高了 4.7 倍。
我们将在 2024 年底向 Cloud 客户提供 Trillium。
除了我们的 TPU,我们还推出 CPU 和 GPU 来支持任何工作负载。这包括我们上个月宣布的新型 Axion 处理器,我们的首款基于 Arm 定制的 CPU,可提供业界领先的性能和能效。
我们也很自豪成为首批提供 Nvidia 尖端 Blackwell GPU 的 Cloud 提供商之一,该 GPU 将于 2025 年初上市。我们很幸运能与 NVIDIA 建立长期合作伙伴关系,并很高兴能将 Blackwell 的突破性功能带给我们的客户。
芯片是我们集成端到端系统的基础部分,从性能优化的硬件和开放软件到灵活的消费模式。所有这些都汇集在我们的 AI 超级计算机( AI Hypercomputer)中,这是一种开创性的超级计算机架构。
企业和开发者正在使用它来应对更复杂的挑战,其效率是仅购买原始硬件和芯片的两倍多。我们的 AI 超级计算机的进步之所以成为可能,是因为我们在数据中心采用了液体冷却的方法。
我们已经这样做近10年了,远早于它成为行业的先进技术。如今,我们部署的液体冷却系统总容量已接近 1 吉瓦,并且还在不断增长——这几乎是任何其他团队的 70 倍。
这背后的基础是我们庞大的网络规模,它连接了我们全球的基础设施。我们的网络覆盖了超过 200 万英里的陆地和海底光纤:是紧随之后的云服务提供商的 10 倍(!)以上。
我们将继续进行必要的投资,以推进 AI 创新并提供最先进的功能。
我们最大的投资和创新领域之一是我们的创始产品——搜索。25 年前,我们创建了搜索,以帮助人们理解互联网上汹涌的信息浪潮。
随着每一次平台的转变,我们都在帮助更好地回答你的问题上取得了突破。在移动设备上,我们利用更好的上下文、位置感知和实时信息,解锁了新型的问题和答案。随着自然语言理解和计算机视觉技术的进步,我们实现了新的搜索方式,可以用语音或哼唱来找到你最喜欢的新歌;或者用你在散步时看到的那朵花的图像来进行搜索。现在,你甚至可以使用 Circle to Search 来搜索你可能想要购买的那些很酷的新鞋。去试试吧,反正你总能退货!
当然,Gemini 时代的搜索将把这一切提升到一个全新的水平,它将把我们的基础设施优势、最新的 AI 功能、对信息质量的高标准以及数十年来把你与丰富的网络连接起来的经验相结合。其结果将是一款为你工作的产品。
Google 搜索是生成式 AI,其规模足以满足人类好奇心。这是我们迄今为止最激动人心的搜索篇章。阅读 Liz Reid 的文章了解更多关于 Gemini 时代的搜索。
Gemini 不仅仅是一个聊天机器人;它旨在成为你得力的私人助手,可以帮助你处理复杂的任务并代表你采取行动。
与 Gemini 的互动应该是对话式的、直观的。因此,我们宣布推出称为 Live 的全新 Gemini 体验,让你可以使用语音与 Gemini 进行深入对话。我们还会在今年晚些时候将 Gemini Advanced 提升为 200 万个令牌,以便能够上传和分析视频和长代码等超密集文件。Sissie Hsiao 分享更多信息。
全球有数十亿 Android 用户,因此我们很高兴能将 Gemini 更深入地融入用户体验。作为你的全新 AI 助手,Gemini 可随时随地为你提供帮助。我们已将 Gemini 模型整合到 Android 中,包括我们最新的设备端模型:Gemini Nano 多模态模型 (Gemini Nano with Multimodality),它可以处理文本、图像、音频和语音,在保证存储在设备上的信息私密性的同时解锁新的体验。Sameer Samat 分享 Android 新闻。
我们继续大胆而振奋地把握住 AI 所带来的机遇。同时,我们也在确保以负责任的方法行事。我们正在开发一种叫做 AI 辅助红队测试 (AI-assisted red teaming) 的尖端技术,该技术利用了 Google DeepMind 在 AlphaGo 等游戏方面的突破以改进我们的模型。此外,我们也已将 SynthID 水印工具扩展到文本和视频两种新的模态,因此更容易识别 AI 生成的内容。James Manyika 分享更多信息。
所有这些都表明了我们在以大胆而负责任的方法,让 AI 助力每个人方面取得的重要进展。
很长一段时间以来,我们一直采用 AI 为先的方法。我们数十年的研究领导者地位开创了许多现代突破,为我们和整个行业的 AI 进步提供了动力。最重要的是,我们拥有:
这一进步之所以能够实现,是因为我们卓越的开发者社区。通过每天创建的体验和应用程序,你们将这一切变为现实。在此,我要向在 Shoreline 现场的各位以及全球数百万在线观看的朋友们致意:让我们共同迎接未来的无限可能,携手共创美好未来。