Google 黑板报: Google I/O 2023: 让 AI 更好地助力每个人

中国的博客，走近我们的产品、技术和文化

Google 中国的博客，走近我们的产品、技术和文化

Google I/O 2023: 让 AI 更好地助力每个人

2023年5月11日

编者语：以下是我们在 2023年 Google I/O 大会上公布的内容摘要。Google 已经走过了七年“AI 为先” 的旅程，现在正处于一个激动人心的转折点。我们有机会让 AI 为人类、企业、社区，甚至我们每个人带来更多帮助。在过去的一段时间里，我们一直在利用 AI 让我们的产品更加有用。伴随生成式 AI 的出现，我们迈出了下一步，以一种大胆而负责任的方式，重新构想我们所有的核心产品，包括 Search。将 AI 融入产品Gmail 的 “Help me write” 功能有一些很好的例子可以说明生成式 AI 如何帮助我们提升产品，首先谈一谈 Gmail。2017 年，我们推出了 Smart Reply 这一功能，只需轻击鼠标，即可选择简短的回复。接下来是 Smart Compose 功能，可以在用户输入时提供写作建议。 Smart Compose 不断完善，实现了由 AI 驱动的更先进的写作功能，并且仅在过去一年中，在 Workspace 中就被使用了超过 1800 亿次。现在，通过更强大的生成式模型，我们在 Gmail 中推出了更先进的功能 “Help me write”。我们 Workspace 更新Google Maps 中新沉浸式路线视图自推出 Street View 以来，AI 已经将数十亿张全景图片拼接在一起，让人们可以在自己的设备上探索世界。在去年的 I/O 大会上，我们又推出了沉浸式视图，即利用 AI 创建一个地方的高保真地图，让用户可以在到达之前就先获得身临其境般的体验。
现在，我们正在将同样的技术扩展到 Maps 最擅长的领域：帮助用户到达目的地。Google Maps 每天提供 200 亿公里的路线指引——这是一个非常大的量。想象一下，如果你能提前看到整个旅程……现在，通过沉浸式路线视图 (Immersive View for routes)，无论你是步行、骑车还是驾车，都可以实现这一点。它还可以提供更多的信息。你可以查看今天的空气质量、交通和天气情况，并了解它们未来可能的变化。沉浸式路线视图将在夏季推出，并在今年年底前在 15 个城市上线，包括伦敦、纽约、东京和旧金山等。

在新沉浸式路线视图下骑行纽约Photos 中全新的 Magic Editor 体验另一个通过 AI 得以提升的产品是 Google Photos。我们在 2015 年的 I/O 大会上介绍了该产品，它也是我们首批 AI 原生产品之一。得益于机器学习的突破，它可能在照片中搜索人物、日落或瀑布等元素。当然，我们希望用户做的不仅仅是搜索照片——还希望帮助用户把照片变得更好。事实上，每个月有 17 亿张图片在 Google Photos 中被编辑。AI 的进步为我们提供了更多强大的方法来实现这一点。例如，率先在 Pixel 上推出的 Magic Eraser 可使用 AI 驱动的计算摄影来消除不必要的干扰。今年晚些时候，我们将推出结合语义理解和生成式 AI 的 Magic Editor，用户将会获得更多新的体验。例如，这是一张很精彩的抓拍照片，但作为父母，你可能希望孩子的位置更居中一些，并且照片中，气球看起来像是被切掉一部分，所以你可以去重新调整孩子的位置。Magic Editor 会自动重现原始照片中没有捕捉到的长凳和气球的部分。作为点睛之笔，你甚至可以把天空调高，同时照片其他部分的光线也会随之改变，所有的编辑都是连贯一致的。这确实很神奇！我们很高兴能在今年晚些时候在 Google Photos 中推出 Magic Editor。

一张使用 Magic Editor 编辑的照片

让 AI 更好地助力每个人

从 Gmail 和 Photos 到 Maps，这些只是 AI 如何在重要时刻提供帮助的几个例子。我们还可以做更多的事情，在你熟悉和喜爱的产品中充分挖掘 AI 的潜力。

今天，我们有 15 个为个人和企业提供帮助的产品用户数都超过了 5 亿，其中 6 个产品的用户数已超过了 20 亿。这给了我们很多机会来践行我们的使命——整合全球信息，供大众使用，使人人受益。

这是一个永恒的使命，随着时间的推移，它变得越来越重要。展望未来，让 AI 助力每一个人是我们推进这一使命最深入的方式。我们正通过四个重要方法来实现这一目标：

首先，通过提升用户的知识和学识，加深他们对世界的理解。

第二，通过提高创造力和生产力，帮助用户表达自己并把事情做好。

第三，通过赋能开发者和企业，帮助他们打造具有变革性的产品和服务。

最后，通过负责任地创建和部署 AI，使每个人都能平等受益。

PaLM 2 和 Gemini

我们对未来的机会感到非常兴奋。让 AI 助力每一个人的能力在于不断推进我们的基础模型。因此，我想用一点时间来分享我们是如何去实现的。

去年，你们都了解到了 PaLM，它给我们的产品带来了许多改进。今天，我们已准备好宣布最新的 PaLM 模型并已投入使用：PaLM 2。

PaLM 2 建立在我们的基础研究和最新的基础设施之上，在各种任务中都具有很强的能力，并且易于部署。我们今天将宣布超过 25 种由 PaLM 2 支持的产品和功能。

PaLM 2 模型在各种规模的情况下都能提供出色的基础功能。我们亲切地将它们命名为 Gecko、Otter、Bison 和 Unicorn。Gecko 非常轻巧，可以在移动设备上工作，其速度快到足以在设备上运行出色的交互式应用程序，即使在离线的状态下。由于对科学和数学课题进行了广泛的训练，PaLM 2 模型的逻辑和推理能力更强。它还接受了逾百种的多语言文本训练，因此它能够理解并生成精确的结果。

结合强大的编码能力，PaLM 2 还可以帮助世界各地的开发人员进行合作。假设你正在与首尔的一位同事一起工作，并且正在调试代码。你可以要求它修复错误，并通过在代码中添加韩文注释来帮助你的同事。它首先识别代码是递归的，然后建议修复。它会解释修复背后的原因，并按照你的要求添加韩文注释。

尽管 PaLM 2 的功能已经非常强大，但当用特定领域的知识对它进行微调后，它的表现会更加出色。我们最近发布了针对安全用例进行了微调的 Sec-PaLM。它通过 AI 来更好地检测恶意脚本，并能够帮助安全专家理解和解决威胁。

另一个例子是根据医学知识进行了微调的 Med-PaLM 2。与基础的模型相对比，这种微调使不准确的推理减少了 9 倍，接近于回答同一组问题的临床医生专家的表现。事实上，Med-PaLM 2 是第一个在医学执照考试上展现出 "专家 "水平的语言模型，展现出目前的最高技术水平。

我们还在努力增加 Med-PaLM 2 的功能，使其能够结合医学影像信息，如平片和乳房 X 光检查。你可以想像一个 AI 协作者帮助放射科医生解释图像和交流结果。这些是 PaLM 2 被用于专业领域的一些例子。我们迫不及待地想看到它被用于更多的领域。我很高兴地宣布 PaLM 2 现在已经有了预览版。

PaLM 2 是我们十年以来，用负责任的方式将 AI 带给数十亿人的旅程中的最新进展。它建立在 Google Brain 和 DeepMind 两个世界顶级研究团队所取得的进展之上。

回顾过去十年 AI 的重大突破，上述团队做出了相当数量的贡献，包括 AlphaGo，Transformers 和序列对序列模型等。所有这些都为我们今天所处的转折点奠定了基础。

我们最近将这两个团队合并为 Google DeepMind，利用 Google 的计算资源，让他们专注于创建安全和负责任的更强大系统。

这其中有我们在训练中的下一代基础模型 Gemini。它从一开始就被创建为多模态、高效的工具和 API 集成，以支持未来的创新，如内存和规划。尽管它还处于早期阶段，但我们已经看到在以往模型中没有出现的多模态能力，这让人印象深刻。

经过微调和严格的安全测试后，Gemini 将像 PaLM 2 一样适应多重体量模式和功能。

AI 的责任：识别生成式内容的工具

随着我们不断投入能力越来越强大的模型，我们也在深入研究 AI 应当肩负的责任，这包括让用户拥有可识别出合成的生成式内容工具。

水印和元数据是两个重要方式。水印将信息直接嵌入到内容中，即使经过适度编辑的图像，水印也能保存其中。展望未来，我们正在建立自己的模型，让水印从开始就融入其中。如果你看到一张合成图片，发现它如此真实，令人印象深刻，这也是为什么这项责任如此重要。

元数据允许内容创作者将额外的背景信息与原始文件关联，每当你看到一张图片时，元数据就会提供其背景信息。我们将确保，每一张由 AI 生成的图像都会绑定这种元数据。点击阅读更多关于我们大胆而负责任的方法的信息

Bard 和 Workspace 的更新

随着模型变得更好、更强大，最令人兴奋的机会之一是人们可以直接参与其中。

这就是 Bard 带给我们的机会——对话式 AI 实验。我们正在迅速提升 Bard, 目前它已支持广泛的编程功能，并在推理和数学提示方面更加智能。并且，从今天起，它将完全运行在 PaLM 2 之上。点击阅读更多关于 Bard 的最新信息

我们还为 Google Workspace 带来了新功能。除了在 Docs 和 Gmail 中的“Help me write”功能外，Google Workspace 的 Duet AI 提供了一些工具，可以在 Slides 和 Meet 中从文本描述中生成图像，在 Sheet 中创建自定义计划等等。点击阅读更多 Workspace 的最新更新

介绍 Labs 和 Search 的新生成式体验

随着 AI 不断的快速升级，我们专注于为用户带来更有用的功能。从今天开始，我们为用户提供了一种新的方式，来预览 Workspace 和其他产品中的部分体验。这就是 Labs。虽然我说这是一种新方式，但是 Google 使用 Labs 作为一种早期访问和获得反馈的方式已经有很长的历史了，用户可以在今天晚些时候开始注册。

除了你们刚才看到的 Workspace 功能外，能够在 Labs 测试的首批体验之一是我们的创始产品——Google Search 。多年前，我们之所以开始深入投资 AI，就是因为我们看到了让 Search 变得更好的机会。随着每一次的突破，我们都让它变得更加便利和直观。

语言理解能力的提高让我们可以更自然地提出问题，并在网络上找到最相关的内容。计算机视觉的进步引入了新的视觉搜索方式。现在，即使用户没有用语言来描述要搜索的内容，也可以用 Google Lens 搜索任何看到的东西。事实上，Lens 每个月完成的视觉搜索超过 120 亿次，短短两年就增长了 4 倍。结合了多模式的 Lens 可以实现多模式搜索，即让用户使用图像和文本同时进行搜索。

展望未来，Google对信息的深刻理解与生成式 AI 强大能力的结合，将会再次改变 Search 的工作方式，解锁 Search 可以回答的全新问题，并带来越来越多更有帮助的体验，将用户与网络世界的丰富内容相连接。

当然，将生成式AI用于搜索仍处于早期阶段。世界各地的人们在重要时刻都依赖于Search，我们知道，做好这一点并继续赢得他们的信任是多么重要。这始终是我们一直不变的努力方向。

因此，我们一直以负责任的态度来推进创新，一如既往地为追求最高的信息质量而努力。这就是为什么我们在Labs最先为用户带来 Search 新生成式体验（new Search Generative Experience）的原因。

帮助他人创新更加便捷

AI 不仅仅是一个强大的赋能工具，它也代表着平台的大转变。所有企业和组织都在思考如何推动转型。因为，我们一直专注于帮助他人能更便捷地利用 AI 进行创新，并使其具有可拓展性。

这意味着我们要提供最先进的计算基础设施，并扩大对 Google 最新基础模型的访问，包括最先进的 TPU 和 GPU。这些模型已经通过严格的测试，并已集成到我们自己的产品之中。我们还在努力提供世界一流的工具，以便客户能够训练、调整和运行他们自己的模型，助力其具备企业级的安全、保密和隐私保护。点击查看更多来自 Google Cloud CEO Thomas Kurian 的资讯

用 Android 推动进步

我们对 AI 大胆和负责任的做法可以释放人们的创造力和潜力。我们也想确保这种帮助能够尽可能助力更多人。通过像 Android 这样的计算平台，我们做到了这一点，今天我们将分享 AI 的进步如何让手机更加个性化，包括 Magic Compose (魔法撰写)、Cinematic Wallpapers（电影壁纸）和Generative AI Wallpapers （生成式 AI 壁纸）。