2024 年 8 月 7 日,Google I/O Connect China —— 2024 Google 开发者大会在北京正式开启。在为期两天的大会中,来自 Google 全球不同领域的专家将为中国出海开发者深入分享 Google 在 AI、Web、Mobile、Cloud 等领域的最新技术进展、开发工具的革新和触达全球的平台。这些前沿的技术、工具和平台将助力中国出海开发者更有效地利用 Google AI 赋能的开发工具,加速创新步伐,持续提升开发效率与质量,从而打造出让全球用户受益的优质产品和体验。
作为全球最具活力的开发者群体之一,中国开发者始终紧跟技术创新的浪潮,凭借卓越的创新能力和对用户需求的深刻洞察,打造出了众多风靡全球的产品和体验。在这个过程中,Google 丰富的开发者产品工具与触达全球的平台,也成为开发者出海的坚实后盾,助力众多优秀的出海开发者走向世界,在全球舞台上展现了自己的非凡创造力。
Google 大中华区总裁陈俊廷强调,中国开发者一直是全球舞台上不可或缺的先锋力量。在 AI 赋能的时代,充满创新精神的广大出海开发者,始终不断探索,积极打造创新产品和应用让全球用户受益。Google 也希望为中国出海开发者的全球开拓之旅贡献一己之力,更好地服务中国开发者走向海外,迎接未来的无限可能。
Google 大中华区总裁陈俊廷
如今,AI 正从根本上改变开发的格局,从激发应用创意到重塑构建方法,无不带来深远影响,而 Google 也始终致力于以大胆而负责任的方式,通过 AI 赋能的产品开发工具和平台,帮助出海开发者大胆创新,高效创造,触达全球。
Google Developer X 和开发者关系副总裁兼总经理 Jeanine Banks 在大会上详细介绍了 Google AI 赋能的开发者工具和产品,并分享了中国开发者如何能利用这些工具激发应用构建创意,提升开发效率,为全球用户打造前所未有的创新体验。
Google Developer X 和开发者关系副总裁兼总经理 Jeanine Banks
当天,来自 Google 各领域的专家还分享了 Google AI 在 Web、Mobile、Cloud 等领域为出海开发者带来的机遇和进展,以及 Google 在这些领域的开发工具创新将如何帮助出海开发者进一步利用 AI 技术,丰富创新成果,在全球市场取得成功。Google 也将持续致力于维护丰富蓬勃的开发者生态,助力开发者们在 AI 时代蓬勃发展。
当我们将 AI 应用于服务数十亿用户、创作者和企业时,其产生的影响是呈指数级增长的。在搜索领域,AI 正在帮助用户找到更具体和复杂问题的答案。同时,在 YouTube 这样的平台上,人们渴望探索新的可能性、发现新奇事物和获得灵感,AI 也在推动着新的探索和创作方式。
随着 AI 推动着数字化体验的升级,广告在连接人与商业方面仍然扮演着至关重要的角色。我们帮助人们在这个浩瀚的信息世界中找到所需的内容。在他们的探索过程中,那些既相关又能引发共鸣的创意,始终是让广告主脱颖而出的关键所在。
我们相信,在这一方面,生成式 AI 将释放巨大的潜力,规模、速度和个性化将达到全新的水平。更快速的创意制作、更精准的媒体投放以及实时的效果衡量将协同作用,共同推动广告效果的提升。这是我们多年的愿景, 但事实上,这项技术已经给广告主带来了诸多助益。
首先,你可以使用 AI 来挖掘有关受众的洞察,从而更好地理解他们的行为,并据此制定新的互动策略。
你还可以缩短创意制作周期,扩大制作规模,以更快地实现创意想法。以我们最新推出的、最先进的视频生成模型 Veo 为例,它能够根据细致入微的创意提示生成高清内容——你甚至可以指定它使用特定的电影拍摄技巧和视觉效果。下面这只狮子就是 Veo 专门为戛纳创作的。
此外,借助全新的素材资源库,你可以扩大广告系列的规模,以前所未有的速度与更多消费者建立联系。在近期的 Pixel 8 广告系列中,Google 市场营销团队利用 Demand Gen 生成了多达 4500 种不同的广告在 YouTube、Discover 和 Gmail 上投放。
我觉得 AI 就像是我们手机上的摄像头。尽管有些人依然喜欢玩胶卷,但今天,得益于技术的进步,普通照片和视频的质量已经有了显著的提升。然而,这并不意味着我们每个人都能拍摄出杂志封面级别的作品。无论 AI 如何发展,它本身并不具备审美或独创性。不过,AI 可以开辟全新的方式,帮助你拓展自身的潜力。
如果说去年的主题是探讨“什么是 AI”,那么今年则转向了“我该如何使用 AI”。在过去的一年里,在美国,对“如何使用AI”的搜索兴趣增长了 450%,在欧盟则增长了 350%。¹这确实是一个值得深思的问题:随着 AI 技术的不断进步和普及,你的创造力、战略思维能力以及运用这些工具的能力,将成为制胜的关键。
令人振奋的是,创意人员如今可以用 AI 进行创意实验。像 Gemini 这样的新型大模型是多模态的,这意味着它们能够跨越文本、代码、图像、音频和视频等多种数据类型进行推理。
今天在台上,创意实验室(Creative Lab)的总监 Alex Chen 展示了如何通过简单的 AI 互动就能激发出无限的创意,他同时也展示了 Google 创意团队在这方面的一些开创性案例,例如:
正如 Alex 所言,你无需任何专业技能就可以开始使用 AI。现在正是投身其中、开启创意探索之旅的绝佳时机。人类的好奇心仅受限于我们所掌握的工具。而有了 AI 这一强大工具,创意和创造力的潜能将是无限的。
和任何一项新技术一样,要清楚如何让 AI 助力每个人,还需要时间。在很多情况下,我们需要通过探索和学习来共同找到正确的答案,而现在已经有了一些工具,让你可以立即开始尝试。
当我们以负责任的方法打造 AI 时,它便成为了一个拓展你潜力的强大赋能者。AI 将帮助你迅速探索各种想法,并将这些想法规模化,从而同时提升创造力和效果。对于营销而言,这意味着我们将从一个视觉创意,变成浩瀚的品牌和创意素材的宇宙。而这一切都将由你,借助 AI,亲手创造。
¹Google Trends 数据覆盖了美国和欧洲地区截止到 2024 年 5 月,过去 12 个月的数据。
作者:Pierre Caessa,Google艺术与文化项目经理
广州,这座千年商都,自古以来、见证了东西方文化与商贸的深度融合。而坐落于珠江之畔、镇海楼中的广州博物馆,便是这座城市的文化灵魂,讲述着广州的历史与文化。
今天,Google 艺术与文化与广州博物馆在去年合作的基础上,推出了全新的主题页面 “广州—探索这座千年港口、历史名城的文化艺术瑰宝”。该专题页面涵盖了127件珍贵馆藏图片和10个丰富的文化故事。绚丽的广式彩绘玻璃窗、精美的广彩瓷器……这些璀璨的艺术瑰宝,将通过Google艺术与文化的平台,穿越时空的界限,与国内外的观众共鸣。
广彩是清代以来广州地区釉上彩瓷的简称,是应海外市场之需出现的外销瓷品种。它以“广州”命名,发展历程及工艺特征凝聚着广州这座口岸城市包容并蓄、海纳百川的胸襟气度,以及瓷商瓷匠们融会贯通、创新求变的人文精神。
德化瓷在中国陶瓷瑰宝中脱颖而出,以其莹润的白釉吸引着世人的目光。德化瓷得名于山中出产的陶土。德化瓷出现于唐朝,发展于宋元时期,并通过海上丝绸之路远销海外,获得了国际认可。
镇海楼,华南地区唯一一处中国历史文化名楼。它雄踞于广州越秀山蟠龙岗上,整座建筑呈长方形,五层楼阁,逐层收减,飞檐翘角,是我国古建筑中少见的多层楼阁式建筑,被誉为“岭南第一胜概”。
晚清民国,广州工匠在中国传统技艺的基础上,吸收西方彩色玻璃制作方法,采用蚀刻、磨砂、彩绘、套色等多种工艺制作出丰富多彩的玻璃片,结合历史悠久、变化万千的木雕工艺,形成具有鲜明广州地区民俗文化特色的岭南建筑装饰构件——广式彩色玻璃窗。
明清时期,是我国织绣工艺发展的鼎盛期,绣工们以精巧的构思、纯熟的技艺、多变的针法,运丝如笔,将大自然中生机盎然的飞鸟禽虫与色彩妍丽的花草树木绣入衣饰,制作出神韵灵动、托物寓兴、工艺卓越的织绣品。这些精选馆藏花鸟纹织绣品,展现清代至民国时期我国织绣技艺之妙、寓意之吉以及时代变迁中不断与时俱进、开拓创新的工匠精神。
目前,Google 艺术与文化已经与 49 家中国文化机构建立了合作伙伴关系。我们期待与更多的中国艺术、历史机构合作,让更多人可以欣赏到中国的艺术瑰宝,感受华夏文明的魅力。
注意力的变革正在进行中。人们在线购物、交流和娱乐的方式似乎层出不穷,广告要脱颖而出,就必须具有相关性且有用——事实上,这比以往任何时候都更加重要。在各个渠道上,企业都需要能吸引人们注意力的广告素材。
在此之前,大规模化实现这一目标似乎是不可能的,但生成式 AI 正在改变这一局面。这项技术正在帮助我们更好地满足广告主的需求,从全新的沉浸式广告体验到效果出色的广告素材,它为整个营销流程带来了新的可能。在我们共同打造营销的下一个时代之际,我们将在 Google Marketing Live (GML) 上分享最新的创意素材生成控制、全新的广告体验以及视觉化叙事等更多功能。
我们一直致力于让跨营销渠道的广告素材制作更加便捷和迅速。广告素材的多样性对于打造影响力强大的广告至关重要,而随着生成式 AI 在效果最大化广告系列(Performance Max)中的应用,越来越多的广告主可以更轻松地实现这一目标。我们发现,那些成功将效果最大化广告系列的广告效力提升至“极佳”的广告主,其转化平均增加了 6%。¹Event Tickets Center 作为效果最大化广告系列中生成素材资源功能的首批测试者之一,该功能使团队的广告素材制作提高了 5 倍,同时显著减少了时间和人力成本。
当然,广告效果并非是对广告素材的全部要求,素材资源也需要遵循品牌规范。很快,广告主将能够在效果最大化广告系列中分享他们的字体和颜色指南,并且提供有用的图片作为参考,从而生成新的更多的符合品牌标准的素材资源。
利用 Google AI 创作效果出色的广告,同时确保符合你的品牌规范
我们还将推出新的图片编辑功能,让广告主能够尝试添加新的物品、扩展背景、裁剪图片,从而适应不同的格式、尺寸和方向。此外,零售商也将能够充分利用这些编辑功能,在 Google Merchant Center 突出展示他们的产品。随着广告主尝试不同广告素材创意,Google AI 还将生成更多建议,展示产品在各种环境和场景中的效果,以便广告主能够挑选心仪的素材用于各个营销渠道。
通过 AI 赋能的图片编辑功能,将您的产品置于中心
即使广告中的图片和文本素材再出色,消费者在未能亲眼看到或试穿产品的情况下,仍然难以对在线购买决策充满信心,然而,我们的研究发现,这种信心对于品牌而言至关重要。生成式 AI 则有助于企业更有效地传达产品信息,进而通过广告激发消费者的信心。很快,广告主将能够借助如虚拟试穿(Virtual Try-On)和生成的 3D 广告等沉浸式的视觉效果来增强他们的购物广告(Shopping ads)。同时,我们还将推出一项新功能,让消费者能够深入探索广告内容,查看广告主提供的产品视频、简介以及相似产品推荐。
通过带有视频宣传信息的购物广告增强购物者信心
我们目前还在搜索中测试一种全新的广告体验,以帮助引导人们复杂的消费决策。假设有朋友正要翻新房屋并搜索了“短期储存”。当他们点击某个储存设施的广告时,将被引导进入一个动态的体验,在这里,AI 将协助他们确定具体的储存需求。如果他们分享了家具的照片、预算等细节信息,Google AI 还可以推荐合适的储存室大小和打包材料,并且会提供网站上的购买链接。
通过搜索广告中 AI 赋能的推荐,解锁全新的互动广告体验
除了视觉沉浸式广告,广告主还可以通过我们最具视觉沉浸感的渠道——YouTube,Discover 和 Gmail——与消费者建立联系。去年,我们推出了需求开发广告系列(Demand Gen),其每月的触达用户数可达 30 亿。²这些广告系列已成功帮助广告主发掘需求并促进转化的提升。很快,我们将在 Display & Video 360 以及 Search Ads 360 中推出这一广告系列给更多广告主使用。
YouTube Shorts 每月有超过 20 亿登录用户,³他们通过短视频发现新的兴趣点。为了帮助企业吸引这些观众,我们正在推出新的广告格式和功能,其中包括竖屏广告格式、促进用户行动的广告贴纸(ad stickers),以及从广告主账号和需求开发广告系列商品流中的图片自动生成的全新动画图片广告(animated image ads)。
在 YouTube Shorts 上通过动画图片广告展示相关产品
广告在消费者获取信息的过程中始终扮演着重要角色。在 Google I/O 大会上,我们宣布了搜索中的 AI Overviews 已经面向美国的所有用户推出,并将很快推广到更多国家。当 AI Overviews 提供的结果较搜索引擎的结果更加有帮助时,它就会出现在搜索结果中。借助 AI Overviews,人们能够访问更多样化的网站,从而获得更复杂问题的答案。我们还发现,在相同查询下,AI Overviews 中的链接点击量高于在传统网页列表的点击量。事实上,我们发现,使用 AI Overviews 的用户不仅搜索频率更高,而且对搜索结果也表示出更高的满意度。当人们从 AI Overviews 中点击链接时,这些点击的质量更高,用户更有可能在网站上停留更长时间。随着我们不断测试和优化搜索体验,我们将继续致力于为发布商和创作者提供有价值的流量。
在初期测试阶段,我们收到用户反馈称显示在 AI 生成概览上下方的广告十分有用。很快,我们将开始在美国用户中在 AI Overviews 里测试搜索和购物广告。当广告与用户查询以及 AI Overviews 中的信息相匹配时,将有机会在 AI Overviews 中一个被明确标注为“赞助”字样的部分展示。广告主无需进行任何额外操作,现有的搜索广告、效果最大化广告系列及标准购物广告系列(Standard Shopping campaigns)中的广告都有机会在 AI Overviews 中展示。随着我们不断探索和进步,我们将继续测试和学习新的广告格式,并会积极收集广告主和行业内的反馈。
在消费者进行新的探索时吸引他们。很快,我们将开始在美国用户中在 AI Overviews 里测试搜索和购物广告。
虽然这些更新对企业都大有帮助,但 AI 的能力完全取决于它所获取的信息。为了充分利用 AI,企业需要构建一个坚实的基于第一方数据的衡量策略。许多企业拥有来自不同来源的数据,如转化数据、电子邮件列表和调查问卷等。然而,整合这些数据一直是一项繁琐复杂的任务,对于小型企业来说更是如此。我们正通过 Google Ads 数据管理器(Data Manager)简化这一过程,为广告主提供便利,现在,该功能已全面开放。广告主现在可以轻松地将第一方数据源汇集于一处,方便使用、分析和启用。这意味着,过去可能需要数周或数月才能完成的任务,现在只需几分钟即可完成。
通过 Google Ads 数据管理器简化关联过程并使用您的第一方数据
以我们的 AI 原则和客户反馈为指导,这些最新的 AI 创新将助力营销人员拓宽思维,大胆创新,并更快地取得成果。Google AI 的存在是为了协助,而非替代。人类的创造力、战略洞察力和专业知识始终是营销人员无法替代的优势。同时,我们也深知,尽管这些进步令人振奋,但对于许多企业来说,转向 AI 仍需要做大量的工作。因此,我们在推进产品时始终保持谨慎,并期待在此过程中收到您的反馈。
在 GML,我们还将介绍新的方式,让商家可以借助生成式 AI 更深入地与客户建立联系,同时更高效地推广其品牌和产品。欢迎访问我们的帮助中心网站,了解更多关于我们的商家和广告创新。
观看主题演讲和数字展会总结以获取更多新闻,并加入#GML2024 的讨论。
我们推出了 Gemini 系列模型的多项更新,包括我们针对速度与效率的轻量模型 Gemini 1.5 Flash,以及 Astra 项目,我们针对未来 AI 助理的愿景。
开发者和企业客户已经在以各种令人惊叹的方式开始使用 1.5 Pro,他们发现,1.5 Pro 的长上下文窗口,多模态推理能力,以及出色的整体性能非常实用。
从用户反馈中,我们了解到,有些应用场景需要更低的延迟和更低的部署成本。这激励着我们不断创新,所以今天,我们推出了 Gemini 1.5 Flash:一个相较于 1.5 Pro 更轻量的模型,旨在快速高效地进行规模化服务。
100 万令牌上下文窗口的 1.5 Pro 和 1.5 Flash 目前都已在 Google AI Studio 和 Vertex AI 中发布公开预览版。现在,使用 API 的开发者和 Google Cloud 客户还可以通过候补名单获取 200 万令牌上下文窗口的 1.5 Pro。
我们还将推出开放模型系列的更新,发布我们下一代开放模型 Gemma 2,并通过 Astra 项目与大家分享 AI 助理的未来。
新推出的 1.5 Flash,速度更快、效率更高
1.5 Flash 是 Gemini 系列模型中最新成员,它也是通过 API 提供的速度最快的 Gemini 模型。在具备突破性的长文本能力的情况下,它针对大规模地处理高容量、高频次任务进行了优化,部署起来更具性价比。
尽管它比 1.5 Pro 更轻量级,但它在处理大量信息时具有强大的多模态推理能力,就其大小而言达到了令人印象深刻的质量。
1.5 Flash 在总结摘要、聊天应用、图像和视频字幕生成以及从长文档和表格中提取数据等方面表现出色。这是因为我们利用 1.5 Pro 对该模型进行了被称作“蒸馏”(distillation)的训练,将较大模型中最核心的知识和技能迁移到了更小、更高效的模型中。
如需了解关于 1.5 Flash 的更多信息,请参阅我们新发布的 Gemini 1.5 技术报告、了解 1.5 Flash的性能和价格。我们将在即将更新的 Gemini 1.5 技术报告中分享更多细节。
1.5 Pro 的重磅更新
在过去几个月中,我们已经大幅改善了 1.5 Pro,这是我们在各种任务中综合表现最佳的模型。
除了将模型的上下文窗口扩展到支持 200 万个令牌之外,我们还通过改进数据和算法,提升了模型的代码生成、逻辑推理与规划、多轮对话以及音频和图像理解能力。我们看到了每个任务的公开基准和内部基准层面有了显著改进。
现在,1.5 Pro 可以遵循越来越复杂和细致的指令,包括指定产品级行为的指令,如角色、格式和风格。针对特定的使用场景,例如,打造聊天智能体的个性和回答风格,或通过多个功能调用来自动化工作流程,我们改进了对模型回应的控制权。同时,我们也已经让用户能够通过设置系统指令来引导模型的行为。
我们还在 Gemini API 和 Google AI Studio 中添加了音频理解功能,现在 1.5 Pro 可以对 Google AI Studio 中上传的视频进行图像和音频推理。现在,我们已经将 1.5 Pro 整合到 Google 产品中,包括 Gemini Advanced 和 Workspace 应用程序。
如需了解关于 1.5 Pro 的更多信息,请参阅 Gemini 技术页面。我们新发布的 Gemini 1.5 技术报告中将公布更多细节。
Gemini Nano 理解多模态输入
Gemini Nano 从仅可处理文本输入扩展到可以处理图像输入。从 Pixel 开始,使用 Gemini Nano 多模态功能的应用将能够像人类一样理解世界——不仅仅通过文本,还可以通过视觉、声音和语言。
如需了解更多信息,请访问 Android Gemini 1.0 Nano。
今天,我们还将分享一系列关于 Gemma 的更新,这是我们用创建 Gemini 模型相同的研究和技术打造的开放模型系列。
我们将推出 Gemma 2,我们为负责任的 AI 创新打造的下一代开放模型。Gemma 2 采用了一种新型架构,实现了突破性的性能和效率,并且将包含新的大小。
Gemma 模型系列也在不断扩展,新推出了受 PaLI-3 启发开发的首款视觉语言模型 PaliGemma。我们还升级了负责任的生成式 AI 工具包(Responsible Generative AI Toolkit),加入了 LLM Comparator 来评估模型输出的质量。
如需了解更多信息,请访问 开发者博客。
Google DeepMind 的使命是以负责任的方式构建 AI,造福人类。作为这项使命的一部分,我们一直希望开发能在日常生活中提供帮助的通用 AI 智能体。这就是为什么在今天,我们将通过 Astra(高级视觉和对话响应智能体)项目分享我们在构建未来 AI 助理的进展。
要做到真正实用, 智能体需要能够像人一样理解周围复杂多变的环境并做出反应——它需要能接收并记忆所见所闻,从而了解上下文信息并采取行动。它还需要具备主动性、“会学习”并能满足个性化需求,这样用户才能自然地与它交谈,不会有滞后或延迟。
虽然我们在开发能够理解多模态信息的 AI 系统方面取得了惊人的进步,但要将回答时间缩短到可对话的程度,仍是一项非常艰巨的工程挑战。在过去几年中,我们一直在努力改进模型的感知、推理和对话方式,让交互的节奏和质量更加自然。
基于 Gemini 模型,我们已经开发了智能体原型,它通过对视频帧进行连续编码,将视频和语音输入组合成事件时间轴,并缓存这些信息以便高效召回,从而能够更快地处理信息。
我们还利用领先的语音模型增强了这些智能体的声音效果,为它们提供了更丰富的语调。这些智能体可以更好地理解它们的使用环境,并在对话中做出快速回答。
凭借这些技术,我们不难想象,在未来,通过手机或眼镜,人们就能让随身 AI 专家助理提供服务。今年晚些时候,我们将把其中一些功能带到 Gemini 应用和网络体验等 Google 产品中。
迄今为止,我们的 Gemini 系列模型已经取得了惊人的进步,我们也始终在努力推动前沿技术实现更进一步的发展。通过对创新产品线的不懈投入,我们不仅得以探索前沿新理念,同时也为 Gemini 在更多新的使用场景中大放异彩提供了可能。
如需了解更多,参阅 Gemini 及其能力。
作者:Sundar Pichai,Google 和 Alphabet CEO
Google 已全面进入 Gemini 时代。
在深入探讨之前,我想先回顾一下我们所处的时刻。十多年来,我们一直在 AI 领域进行投入,并在各个层面进行创新:研究、产品、基础设施,今天我们将对此进行全面讨论。
尽管如此,我们仍处于 AI 平台转型的初期。我们看到了为创作者、开发者、初创公司以及每一个人所带来的巨大机遇。帮助推动这些机遇正是我们 Gemini 时代的意义所在。让我们开始吧。
一年前,在 I/O 大会上,我们首次分享了 Gemini 的计划:一个从一开始就构建为原生多模态的前沿模型,能够跨文本、图像、视频、代码等多种数据类型进行推理。它标志着将任意输入转换成任意输出的重要一步——新一代的“I/O”。
自那以来,我们推出了首批 Gemini 模型,这是我们迄今为止功能最强大的模型。它们在每个多模态基准测试中都拥有卓越的表现。两个月后,我们又推出了 Gemini 1.5 Pro,它在处理长上下文方面取得了重大突破,能够稳定地在生产环境中运行 100 万个令牌(Token),比目前任何其他大规模基础模型都要多。
我们希望每个人都能从 Gemini 的功能中受益。因此,我们立即行动起来,与大家分享这些进展。目前,超过 150 万的开发者在使用我们各种工具中的 Gemini 模型。你们使用它来调试代码、获得新的见解并打造下一代的 AI 应用。
我们也在不断将 Gemini 的突破性功能以强大的方式整合到我们的产品中。今天,我们将展示搜索、Photos、Workspace 和 Android 等产品中的实例。
今天,我们所有拥有 20 亿用户的产品都在使用 Gemini。
我们还推出了全新的体验,包括在移动设备上,人们现在可以通过 Android 和 iOS 上的应用程序直接与 Gemini 互动, Gemini Advanced让用户还可以使用我们功能最强的模型。仅在三个月的时间里,已有超过一百万人注册试用,并且势头依然强劲。
Gemini 带来的最令人兴奋的变革之一是在 Google 搜索中。
在过去的一年中,作为我们生成式搜索体验(Search Generative Experience)的一部分,我们已经回答了数十亿个搜索查询。人们正在以全新的方式使用搜索,提出全新类型的问题,作出更长、更复杂的查询,甚至是通过照片进行搜索,并获得网络上的最佳信息。
我们一直在 Labs 之外对这种体验进行测试。我们倍受鼓舞地看到,不仅搜索的使用量有所增加,用户满意度也得到了提升。
我很高兴宣布,我们将于本周在美国向所有用户推出这一全新改版的 AI Overviews 体验。我们很快也将把这项体验推广到更多国家。
在搜索领域正发生着诸多创新。得益于 Gemini,我们能够打造更为强大的搜索体验,包括在我们的产品之中。
Google Photos 就是一个例子,在大约九年前,我们发布了这款产品,自那以来,人们一直用它来整理最珍贵的回忆。如今,每天上传的照片和视频数量超过 60 亿。
人们喜欢使用 Photos 来搜索他们生活中的点滴。借助 Gemini,我们让这一切变得更加简单。
假设你在停车场缴费时,却想不起自己的车牌号。以往,你需要在 Photos 中搜索关键词,然后翻找多年积累的照片来寻找车牌。但现在,你只需直接询问 Photos 即可。它能够识别出经常出现的车辆,通过多方信息交叉验证判断出哪一辆是你的,并提供车牌号码。
Ask Photos 还能够帮助你以更深入的方式重温回忆。例如,你可能正在回味女儿 Lucia 成长的早期重要时刻。现在,你可以直接问 Photos:“Lucia 是什么时候学会游泳的?”
你甚至可以跟进提出更复杂的问题:“向我展示 Lucia 的游泳技能是怎么进步的。”
在这里,Gemini 不再只是进行简单的搜索,它会识别不同的上下文——从在游泳池中扑腾,到在海洋中浮潜,再到她游泳证书上的文字和日期。Photos 会将所有这些信息整合在一起形成一个总结,让你能够全面了解,并再次重温那些美妙的回忆。我们将在今年夏天推出 Ask Photos,并将持续增加更多功能。
为了理解跨越不同格式的各种知识,我们从一开始就将Gemini 打造成多模态的。它是一个内置了所有模态的模型。因此,它可以理解不同类型的输入,并找到它们之间的联系。
多模态从根本上扩展了我们可以提出的问题以及我们将得到的答案。而长文本能力则使其更进一步,让我们能够引入更多信息:数百页文本、数小时音频或一小时视频、整个代码存储库……或者,如果你愿意,大约 96 份芝士蛋糕工厂餐厅的菜单。
处理这么大量的菜单,你可能需要 100 万令牌的上下文窗口,而现在通过 Gemini 1.5 Pro 就可以实现。开发者们就一直在以各种非常有趣的方式使用它。
在过去的几个月里,我们已经推出了具有长上下文能力的 Gemini 1.5 Pro的预览版,我们还对翻译、编码和推理的质量进行了一系列改进。从今天开始,你也将在模型中看到这些更新。
现在我很高兴地宣布,我们将向全球所有开发者推出改进版的 Gemini 1.5 Pro。此外,从今天开始,具有100 万令牌上下文能力的 Gemini 1.5 Pro 也可供 Gemini Advanced 的消费者直接使用,包含 35 种语言。
100 万令牌正在开辟全新的可能性。这已经很振奋人心,但我认为我们还可以更进一步。
今天,我们将上下文窗口扩展到 200 万个令牌,并将其以非公开预览版的方式提供给开发者们。
过去几个月来我们所取得的进展让我非常激动,这代表着我们朝无限上下文的最终目标又迈出了一步。
这在 Google Workspace 中体现得更加淋漓尽致。
长期以来,人们总在 Gmail 中搜索他们的电子邮件。而现在我们正通过 Gemini 使其变得更加强大。例如,作为家长,你希望随时了解孩子在学校发生的一切,Gemini 就可以帮助你!
现在,我们可以让 Gemini 总结学校最近发来的所有电子邮件。在后台,它可以识别相关电子邮件,甚至分析 PDF 等附件,你可以获得一份包含关键要点和待办事项的摘要。也许你本周正在旅途中,无法参加家长会议,而会议录音长达一个小时。如果这份录音来自于 Google Meet,你就可以让 Gemini 为你提供重点内容。倘若有个家长小组正在寻找志愿者,而你那天正好有空,那么当然,Gemini 还可以帮助你起草回复邮件。
还有无数其他例子可以说明 Gemini 如何让生活更轻松。今天起 Gemini 1.5 Pro 已经应用在 Workspace Labs中。Aparna 将分享更多。
我们刚刚看了一个文本输出的例子,但通过多模态模型,我们可以做得更多。
我们在这方面已经取得了进展,未来还会有更多。NotebookLM 中的音频概述(Audio Overview)就显示了在这方面的进展:它通过 Gemini 1.5 Pro,可以基于你的源文件生成个性化和交互式音频对话。
这就是多模态带来的可能性,很快你就能够将输入和输出进行混合和匹配,这就是我们所说的新一代 I/O的意思。但如果我们还能再进一步呢?
在这一方面更进一步就是我们在 AI 智能体(AI Agents)上看到的机遇之一。我认为它们是可以推理、规划和记忆的智能系统。它们能够提前多步“思考”,跨软件和系统工作,所有这些都是为了帮助你完成任务,而最重要的是要在你的监督之下。
我们仍处于早期阶段,但让我向你展示一些我们正在努力解决的应用案例的类型。
让我们以购物为例。买鞋很有意思,但当鞋子不合适需要退货时就不那么有趣了。
想象一下,如果 Gemini 可以为你完成所有步骤:
在你的收件箱中搜索收据……
从你的电子邮件中找到订单号……
填写退货表格……
甚至安排 UPS 取件。
那是不是容易多了?
让我们再举一个更复杂一些的例子。
假设你刚搬到芝加哥。想象一下 Gemini 和 Chrome 能够共同协作帮助你做很多准备工作——代替你组织、推理、综合分析等。
比如,你想要探索这座城市并找到附近的服务——从干洗店到遛狗服务,你还必须在数十个网站上更新你的新地址。
现在 Gemini 可以胜任这些工作,并在需要时提示你提供更多信息。这样事情始终在你的掌控之中。
这部分非常重要——当我们做这些体验的原型设计时,我们深思熟虑如何以一种私密、安全且对每个人都适用的方式来进行。
这些都是简单的应用案例,但它们可以让你很好地了解到,通过构建能够代表你去提前思考、推理和计划的智能系统,我们希望能够解决的问题类型。
Gemini 凭借其多模态、长上下文和智能体,使我们更接近我们的最终目标:让 AI 助力每个人。
我们认为,这是我们在达成使命方面取得最大进展的方式:整合以各种方式输入的全球信息,使其可以通过任何输出方式被获取,并将全球信息与你的世界中的信息结合起来,以一种真正对你有用的方式进行呈现。
我们已经收到了大家对 1.5 Pro 及其长上下文窗口的热情反馈,但我们也从开发人员那里了解到,他们想要更快、更具成本效益。因此,明天,我们将推出 Gemini 1.5 Flash,一个为规模化构建的更轻量级的模型,它针对以低延迟和成本为重的任务进行了优化。1.5 Flash 将于周二在 AI Studio 和 Vertex AI 中提供。
展望未来,我们始终希望构建一个在日常生活中有用的通用智能体。Astra 项目展示了多模态理解和实时对话能力。
我们还在视频和图像生成方面取得了进展,推出了 Veo 和 Imagen 3,并推出了 Gemma 2.0——我们为负责任的 AI 创新打造的下一代开放模型。阅读更多关于 Demis Hassabis 的信息。
训练最先进的模型需要大量的计算能力。过去六年中,行业对机器学习计算能力的需求增长了 100 万倍。而且,每年都会以十倍的速度增长。
Google 在这方面具有优势。25 年来,我们一直在投资世界一流的技术基础设施,从支持搜索的尖端硬件,到为我们的 AI 进步提供支持的定制张量处理单元(tensor processing units)。
Gemini 完全在我们的第四代和第五代 TPU 上进行训练和服务。包括 Anthropic 在内的其他领先的 AI 公司也已经在 TPU 上训练了他们的模型。
今天,我们很高兴地宣布推出第六代 TPU—— Trillium。Trillium 是我们迄今为止性能最强、效率最高的 TPU,与上一代 TPU v5e 相比,每个芯片的计算性能提高了 4.7 倍。
我们将在 2024 年底向 Cloud 客户提供 Trillium。
除了我们的 TPU,我们还推出 CPU 和 GPU 来支持任何工作负载。这包括我们上个月宣布的新型 Axion 处理器,我们的首款基于 Arm 定制的 CPU,可提供业界领先的性能和能效。
我们也很自豪成为首批提供 Nvidia 尖端 Blackwell GPU 的 Cloud 提供商之一,该 GPU 将于 2025 年初上市。我们很幸运能与 NVIDIA 建立长期合作伙伴关系,并很高兴能将 Blackwell 的突破性功能带给我们的客户。
芯片是我们集成端到端系统的基础部分,从性能优化的硬件和开放软件到灵活的消费模式。所有这些都汇集在我们的 AI 超级计算机( AI Hypercomputer)中,这是一种开创性的超级计算机架构。
企业和开发者正在使用它来应对更复杂的挑战,其效率是仅购买原始硬件和芯片的两倍多。我们的 AI 超级计算机的进步之所以成为可能,是因为我们在数据中心采用了液体冷却的方法。
我们已经这样做近10年了,远早于它成为行业的先进技术。如今,我们部署的液体冷却系统总容量已接近 1 吉瓦,并且还在不断增长——这几乎是任何其他团队的 70 倍。
这背后的基础是我们庞大的网络规模,它连接了我们全球的基础设施。我们的网络覆盖了超过 200 万英里的陆地和海底光纤:是紧随之后的云服务提供商的 10 倍(!)以上。
我们将继续进行必要的投资,以推进 AI 创新并提供最先进的功能。
我们最大的投资和创新领域之一是我们的创始产品——搜索。25 年前,我们创建了搜索,以帮助人们理解互联网上汹涌的信息浪潮。
随着每一次平台的转变,我们都在帮助更好地回答你的问题上取得了突破。在移动设备上,我们利用更好的上下文、位置感知和实时信息,解锁了新型的问题和答案。随着自然语言理解和计算机视觉技术的进步,我们实现了新的搜索方式,可以用语音或哼唱来找到你最喜欢的新歌;或者用你在散步时看到的那朵花的图像来进行搜索。现在,你甚至可以使用 Circle to Search 来搜索你可能想要购买的那些很酷的新鞋。去试试吧,反正你总能退货!
当然,Gemini 时代的搜索将把这一切提升到一个全新的水平,它将把我们的基础设施优势、最新的 AI 功能、对信息质量的高标准以及数十年来把你与丰富的网络连接起来的经验相结合。其结果将是一款为你工作的产品。
Google 搜索是生成式 AI,其规模足以满足人类好奇心。这是我们迄今为止最激动人心的搜索篇章。阅读 Liz Reid 的文章了解更多关于 Gemini 时代的搜索。
Gemini 不仅仅是一个聊天机器人;它旨在成为你得力的私人助手,可以帮助你处理复杂的任务并代表你采取行动。
与 Gemini 的互动应该是对话式的、直观的。因此,我们宣布推出称为 Live 的全新 Gemini 体验,让你可以使用语音与 Gemini 进行深入对话。我们还会在今年晚些时候将 Gemini Advanced 提升为 200 万个令牌,以便能够上传和分析视频和长代码等超密集文件。Sissie Hsiao 分享更多信息。
全球有数十亿 Android 用户,因此我们很高兴能将 Gemini 更深入地融入用户体验。作为你的全新 AI 助手,Gemini 可随时随地为你提供帮助。我们已将 Gemini 模型整合到 Android 中,包括我们最新的设备端模型:Gemini Nano 多模态模型 (Gemini Nano with Multimodality),它可以处理文本、图像、音频和语音,在保证存储在设备上的信息私密性的同时解锁新的体验。Sameer Samat 分享 Android 新闻。
我们继续大胆而振奋地把握住 AI 所带来的机遇。同时,我们也在确保以负责任的方法行事。我们正在开发一种叫做 AI 辅助红队测试 (AI-assisted red teaming) 的尖端技术,该技术利用了 Google DeepMind 在 AlphaGo 等游戏方面的突破以改进我们的模型。此外,我们也已将 SynthID 水印工具扩展到文本和视频两种新的模态,因此更容易识别 AI 生成的内容。James Manyika 分享更多信息。
所有这些都表明了我们在以大胆而负责任的方法,让 AI 助力每个人方面取得的重要进展。
很长一段时间以来,我们一直采用 AI 为先的方法。我们数十年的研究领导者地位开创了许多现代突破,为我们和整个行业的 AI 进步提供了动力。最重要的是,我们拥有:
这一进步之所以能够实现,是因为我们卓越的开发者社区。通过每天创建的体验和应用程序,你们将这一切变为现实。在此,我要向在 Shoreline 现场的各位以及全球数百万在线观看的朋友们致意:让我们共同迎接未来的无限可能,携手共创美好未来。
作者:Steve Kafka and Khawaja Shams,Android 安全与隐私团队Mohet Saxena,Google Play 信任与安全团队
为用户提供安全和可信的 Google Play 体验是我们的首要任务。我们依据 SAFE (见下文)原则创建了一个框架,旨在为用户和开发者营造一个安全的环境。以下是我们将这些原则付诸实践的几个关键方式:
基于以上原则,我们最近进行了改善并推出了新的措施,以应对不断演变的安全威胁,继续确保 Google Play 用户的安全。2023 年,我们通过持续投资全新且更完善的安全功能、政策更新、先进的机器学习系统和应用审查程序,成功阻止了 228 万个违反政策的应用在 Google Play¹ 上发布。同时,我们也增强了开发者入驻及审查程序,要求开发者创建 Google Play 账号时提供更多的身份信息。得益于我们对审查工具和流程的持续投入,2023 年我们更快地识别了 Google Play 平台上的恶意行为和欺诈团伙,封禁了 33.3 万个违规账户。
此外,我们驳回或修正了约 20 万个应用的上架申请,确保敏感权限,如后台位置访问和短信使用,得到正确和合理的使用。为了在更大范围内帮助用户保护隐私,我们已经与 SDK 提供方展开合作,限制敏感数据的访问和共享,增强了超过 31 个 SDK 79 万个应用的隐私保护。另外,我们还扩大了 Google Play SDK 索引,目前该资源已覆盖 Android 生态系统中超过 600 万个应用。帮助开发者做出更明智的 SDK 选择,从而提高应用的质量并降低整体风险。
在与 App Defense Alliance (ADA) 合作取得成功的基础上,我们与微软和 Meta 公司合作,成为联合开发基金会旗下新重组的应用防范联盟 (ADA) 指导委员会成员,隶属于 Linux 基金会家族。联盟将支持全行业采纳应用安全最佳实践和指导方针,并采取措施应对新的安全风险。
此外,我们发布了一项新的 Google Play 商店透明度标签功能,突出显示那些通过 ADA 的移动应用安全评估 (Mobile App Security Assessment) 完成了独立安全审查的 VPN 应用。当用户搜索 VPN 应用时,他们会在 Google Play 顶部看到一条横幅,该横幅向他们介绍数据安全模板的“独立安全审查”徽章。这有助于用户一目了然地看到开发者已经优先考虑安全和隐私的最佳实践,致力于保障用户安全。
为了更好的保护在 Google Play 商店之外安装应用的用户,我们通过代码层的实时扫描增强了 Google Play 保护机制的安全能力,以对抗新型的恶意应用。我们的安全保护和机器学习算法会从提交给谷歌审查的每个应用程序中学习,分析数千个信号并比较应用程序的行为。该功能已经检测到超过 500 万款新型恶意应用,有助于保护全球的 Android 用户。
去年,我们更新了 Google Play 中有关生成式 AI 应用、干扰性通知和扩大隐私保护的政策。我们还在提高新的个人开发者账户的门槛,新账户需要达到特定的测试要求,才能在 Google Play 平台上架应用。他们会在发布前通过测试应用程序、收集反馈,确保能够为 Google Play 用户提供高质量的内容。为了提高用户信任和透明度,我们引入了扩展版开发者验证要求 (expanded developer verification requirements),包括组织开发者使用的邓氏编码 (D-U-N-S) 和新的“关于开发者”板块。
为了让您能够更自主有效的控制自己的个人数据,支持创建帐户的应用程序现在需要提供一个选项,使用户能够在应用程序内启动帐户和数据的删除。这项网络要求尤为重要,它确保用户无需重新安装应用即可直接申请删除账户和数据。为了简化这一用户体验,我们还将其整合到了 Google Play Store 数据安全模块中。
Android 操作系统(包括其强大的 APIs )的每次迭代,都会引入无数的功能改进和完善,旨在提升用户体验,加强安全协议,并优化 Android 平台的整体性能。为了进一步保护用户安全,约 150 万个未按照最新 API 进行更新的应用程序将不再在 Google Play 商店上向已将设备更新至最新版本的新用户开放。
保护 Google Play 上的用户和开发者至关重要,也是一个持续发展的过程。我们将在 2024 年推出新的安全举措,包括从 Google Play 中移除隐私保护不透明的应用。
最近,我们向联邦法院起诉了两名欺诈者,他们在 Google Play 平台上发布具有欺骗性质的投资及加密货币交易应用程序,诱骗用户上当。这起诉讼是追责这些不良行为者的关键一步,同时传递出明确信息:我们将坚决打击任何企图利用我们用户的欺诈行为。
我们一直在探索新的方法来保护用户在 Google Play 和整个 Android 生态系统中的体验,我们期待着在未来分享更多的更新和进展,以继续提升我们的服务和安全措施。
¹根据欧盟的《数字服务法案》(DSA)报告要求,Google Play现在根据与开发者的沟通情况来计算政策违规情况。
你是否曾梦想潜入深邃的海洋,聆听珊瑚礁的低语,领略海底森林的瑰丽风光?你是否曾仰望蓝天,对飞机划过天际的尾迹心生好奇,探寻它与环境之间的微妙联系?
在科学家和研究人员的共同努力下,先进的科学技术和创新的解决方案给出了答案,并且,它们正在帮助人类解决诸多复杂的环境问题。在第 55 个世界地球日到来之际,跟随 Google 的脚步,深入了解创新技术在环境保护和可持续发展中的重要作用吧~
你听过珊瑚礁的声音吗?
在 Google 艺术与文化团队和海洋生态学家的共同努力下,人们有了机会参与到保护珊瑚礁的行动中,倾听来自这个世界的声音,为珊瑚礁生态系统的恢复贡献一份力量。
Google 艺术与文化团队和海洋生态学家联合推出了一项 AI 实验,深入分析了澳大利亚、印度尼西亚和菲律宾等地区数百个小时的珊瑚礁录音。通过这些数据,Google 的合作伙伴可以深入了解栖息地的健康状况、生物多样性和习惯,从而精准把握保护珊瑚礁的工作重点。同时,人们也可以通过 Google 文化与艺术的“Calling in Our Corals”实验,收听这些珊瑚礁的录音片段,分辨不同声音的来源,为训练AI模型提供帮助。
与陆地一样,海底亦存在茂密繁盛的森林,只不过这里的“树木”是由高耸的海带目大型褐藻构成。在澳大利亚南部海岸,就曾经矗立着一片规模庞大的海藻森林,栖息着仙女企鹅、叶海龙、红手鱼等珍稀生物。然而,由于海水温度的持续上升,这片美丽的海底森林正面临着彻底消亡的危险。
为了守护这片珍贵的海底生态,Google 与澳大利亚多个机构合作,利用先进的 AI 技术,对卫星图像进行精准识别,从而定位现存的海底森林,为保护工作提供了宝贵的科学依据。此外,他们还通过 AI 强大的计算能力,对现存的海藻进行基因测序,分析这部分海藻在升温的海水中存活的原因,为选育耐热品种恢复海底森林做准备。
当前,全球变暖现象日益严重,不断升高的气温损害了空气质量、基础公共设施和公众健康。Google 的“Tree Canopy”项目将 AI 技术与航拍图像相结合,通过地图绘制技术为城市和社区的领导者提供数据分析服务,评估城市当前的树冠覆盖率,促成更科学的城市绿化方案,为城市带来清凉。例如,通过 Tree Canopy 的工具,人们可以发现树冠覆盖不足的区域,并有针对性地进行树木种植。
印度是世界上重要的农业大国,耕地面积位居世界第二,约一半人口从事农业,是大米、小麦、棉花、糖和乳制品等农产品的生产国和出口国。然而,近年来由于不可持续的耕作方式、水资源的不合理使用等问题,印度的农业系统面临着气候变化的严峻挑战,如若不采取相关措施,全球的粮食和环境系统都将受到威胁。
Google 团队开发了一整套人工智能驱动技术对印度的农业数据进行分析,利用卫星图像和机器学习划定耕地边界,确定耕地、森林和林地的面积并识别灌溉结构,为抗旱做好准备。同时,Google 研究团队也正在开发“Landscape Monitoring”模型,该模型可以提供作物类型、面积、水源距离等数据,为农业决策提供支持。通过了解耕地质量和环境变化,农民可以减少土地和水资源浪费,提高作物产量,从而增强整个农业生态系统的能力,促进农业生产的高效和可持续发展。
当飞机穿越低温且湿度充足的空域时,其尾部便会留下一道独特的“白线”,这就是凝结尾迹(Contrails),也被称为飞机云。然而,这道看似柔和美丽的云线,却对气候产生了不可忽视的影响。这些飞机云在特定条件下可能扩散成为宽广的卷云,宛如给地球覆盖上了一层厚厚的“毯子”,不仅严重阻碍了地球热量的正常散发,还进一步加剧了气候变暖的趋势。
那么如何消除飞机云呢? 这一点其实并不复杂。Google Contrails 项目的科学家们运用先进的技术手段,通过训练 AI 模型来识别卫星图像中的飞机云。经过大量数据的训练,AI 模型已经能够预测出哪些区域和时段容易形成飞机云。基于这些数据,飞机在飞行过程中可以灵活地调整高度和速度,从而有效避免产生飞机云。
实验结果表明,通过这一技术的应用,Google 帮助减少了 54% 的飞机云。这些成果不仅证明了科技在环保领域的巨大潜力,也为我们提供了一种新的、有效的应对气候变化的手段。
新出炉的这份年度报告将详细介绍 Google 付出了哪些努力来防止我们的广告平台遭到恶意利用。
作者:Duncan Lennox,VP & GM,广告隐私与安全
2023 年的一个关键趋势就是生成式 AI 的影响。这一新技术给数字广告行业带来了激动人心的显著变化,从效果优化到图片编辑。当然,生成式 AI 也带来了新的挑战,我们高度重视这些挑战,并将介绍我们为了积极应对这些挑战而正在进行的工作。
同样重要的是,生成式 AI 为改进我们的违规处置成效也提供了独特的机会。我们的团队正在利用这项变革性技术,尤其是大语言模型(LLM),以更好地保护用户在网上的安全。
我们的安全团队很早就在使用 AI 驱动的机器学习系统来进行大规模政策执行。多年来,正是得益于这样的系统,我们才得以在被用户看到之前,就检测到并屏蔽数十亿条不良广告。然而,尽管这些机器学习模型仍十分先进,但它们以往都需要经过大量的训练,往往依赖于数十万乃至数百万例违规内容的样本。
而 LLM 则可以快速审核并解读海量内容,同时还能从这些内容中捕捉到重要的细微差异。这些先进的推理功能已经让我们能够对一些较为复杂的政策,做出更大规模、更精准的违规处置决策。例如,我们制定政策来打击不可靠金融产品的声明,这其中包括宣传快速致富方法的广告。这些广告背后的恶意行为者变得越来越狡猾。他们会针对新的金融服务或产品(如投资建议或数字货币)调整策略,定制广告内容,以欺骗用户。
当然,传统的机器学习模型也被训练用于检测出这些违规行为。然而,金融趋势的快速变化和持续演进,有时也让这些模型难以区分哪些是合法内容,哪些是虚假服务,也就难以快速扩展我们的自动化违规处置系统以打击欺诈。LLM 则更善于快速了解金融服务的新趋势,并识别出那些滥用这些趋势,将快速致富欺诈伪装成合法业务的恶意行为者的模式。这让我们的团队在面对新兴的各种威胁时,能够更加机动灵敏。
利用 LLM 的力量来保障广告安全而言,我们只是刚刚开始。去年公开发布的 Gemini 是 Google 最强大的 AI 模型,我们也很高兴能开始将它先进的推理功能应用到广告安全和违规处置工作中。
2023 年,综合所有线上平台来看,诈骗和欺诈活动有增无减。恶意行为者不断变换手法来操纵数字广告,企图诈骗用户与合法商家。面对变化多端的威胁,我们迅速更新了政策,部署了快速响应违规处置团队,同时改进了我们的检测技术。
总体来看,2023 年我们屏蔽或移除了 2.065 亿条违反虚假陈述政策的广告(包括以多种手法实施诈骗的广告),以及 2.734 亿条违反金融服务政策的广告。我们还屏蔽或移除了超过 10 亿条违反“滥用广告网络”政策的广告(包括宣传恶意软件的广告)。
打击诈骗广告是一项长期工作。我们看到,恶意行为者的操作手法更加老道、规模更大,而且还使用了深度伪造等新手段来欺骗用户。我们将继续投入大量资源,在检测技术方面加大投入,并与全球反诈骗联盟(Global Anti-Scam Alliance)和英国反诈骗组织 Stop Scams UK 等机构合作,促进信息共享,共同保护全球消费者。
我们的目标是在恶意广告和欺诈帐号出现在平台上之前,就进行有效拦截和中止,或者一经检测就立即将其移除。AI 正在帮助我们改善在这方面的违规处置效率。2023 年,我们屏蔽或移除了超过 55 亿条广告,这一数字相比前一年略有上升;中止了超过 1270 万个广告主帐号,处置数量较前一年接近翻倍。同样,我们会将广告从那些违反我们政策(如露骨色情内容政策或危险的产品政策)的发布商页面和网站上移除,以此确保广告主和用户的安全。2023 年,我们针对超过 21 亿个发布商页面阻止或限制了广告投放,这一数字较 2022 年略有增加。我们在处理普遍性或严重违规行为方面也取得了进步。我们对超过 395,000 个发布商网站采取了更大范围的网站级违规处置,这一数量相比 2022 年显著增加。
从 AI 对这项工作的影响来看:在去年发布商网页级的违规处置中,有超过 90% 的违规处置都是从使用机器学习模型开始的,包括我们最新的 LLM。当然,如果广告主或发布商认为存在误判,可以就处置措施提出申诉。我们团队会进一步审核,如果发现确实有误,则会据以改进系统。
在广告安全领域,一年时间可能发生很多变化,比如生成式 AI 等新技术问世、全新的滥用趋势的出现、以及全球冲突等等。数字广告行业必须机动灵活,随时做好应对准备。正因如此,我们将持续制定新政策、强化违规处置系统、加深跨行业协作,并为用户、发布商和广告主提供更多控制。
例如在 2023 年,我们推出了广告信息公开中心,这是一个可搜索的信息库,所有经过验证的广告主发布的广告都在其中,它有助于用户快速轻松地详细了解自己在 Google 搜索、YouTube 和展示广告网络上看到的广告。我们还更新了适宜性控制选项,让广告主可以简单快速地在 YouTube 和展示广告网络上设置自己希望避免的特定主题。总体来看,我们对广告和发布商政策的更新达到 31 次。
虽然尚不知道 2024 年还会面临怎样的形势,但我们相信,依靠在政策、检测和违规处置方面的投入,我们一定能妥善应对未来的任何挑战。
Gemma 采用了与创建 Gemini 模型的相同的研究和技术,旨在进行负责任的 AI 开发。
作者:
Jeanine Banks,Developer X和开发者关系副总裁兼总经理
Tris Warkentin,Google DeepMind 总监
在 Google ,我们致力于让 AI 助力每个人。长期以来,我们对开放社区的创新贡献了许多成果,如 Transformers、TensorFlow、BERT、T5、JAX、AlphaFold 和 AlphaCode。今天,我们很高兴地介绍 Google 的新一代开放模型,以协助开发者和研究人员负责任地构建 AI。
Gemma 是先进的轻量级开放模型系列,采用了与创建 Gemini 模型相同的研究和技术。受到 Gemini 的启发,Google DeepMind 和 Google 其他团队合作开发了 Gemma,并用拉丁语中意为“宝石”的 Gemma 为其命名。在发布模型权重的同时,我们还推出了一系列工具,旨在支持开发者创新,促进合作,并指导如何负责任地使用 Gemma 模型。
从今天起,Gemma 在全球范围内开放使用。以下是有关该模型的关键细节:
Gemma 模型与我们规模最大、能力最强的 AI 模型 Gemini 共享技术和基础架构。这使得 Gemma 2B 和 7B 与其他开放模型相比,展现出同等规模最先进的性能。同时,Gemma 可以直接在开发者的笔记本电脑或台式机上运行。值得注意的是,Gemma 在关键基准测试集上大大超过了更大的模型,同时还严格遵守了我们对安全和负责任输出的标准。有关性能、数据集对比和建模方法的详细信息,请参见技术报告。
Gemma 在设计时将我们的 AI 原则放在首位。为了使 Gemma 预训练模型安全可靠,我们使用自动技术,从训练集中过滤掉特定的个人信息及其他敏感数据。此外,我们进行了大量的微调和人类反馈强化学习(RLHF),使我们的指令微调模型与负责任的行为保持一致。为了解并降低 Gemma 模型带来的风险,我们进行了强有力的评估,包括手工红队测试、自动对抗性测试,以及对危险活动的模型能力评估。我们在 Model Card 中阐述了这些评估。
我们与 Gemma 一道发布了新的 Responsible Generative AI Toolkit,帮助开发者和研究人员优先构建安全和负责任的 AI 应用。这些工具包括:
您可以基于自己的数据微调 Gemma 模型以适应特定应用需求,例如摘要或检索增强生成 (RAG)。Gemma 可支持多种工具和系统:
Gemma 为开放社区构建,旨在推动开发者和研究人员的 AI 创新。您可以通过 Kaggle 的免费访问权限、Colab notebooks 免费层、以及 Google Cloud 新用户可获得的 300 美元积分立即开始使用 Gemma。研究人员还可以申请高达 50 万美元的 Google Cloud 积分以加速他们的项目。
您可以在 ai.google.dev/gemma 了解更多关于 Gemma 的信息并访问快速入门指南。
随着 Gemma 模型系列的不断扩展,我们期待看到基于 Gemma 的多元化应用出现。敬请关注未来几周的活动和机会,与我们进行交流、学习并使用 Gemma 进行开发构建。
我们很期待看到您的创新!
作者:Shashi Thakur,Google Ads(Search Ads & Ads on Google Experiences)副总裁/总经理
从改善广告系列的创作,到在不断演进的用户搜索体验中提升广告的有效性,生成式 AI 可以为广告主赋能。去年,我们宣布了 AI 赋能广告的新时代,同时也做出承诺,确保广告主有机会在用户的搜索历程中触达潜在客户。今天,我们将分享在这方面取得的进展。
正如我们在上个月所宣布,接下来的几个月内,我们将把我们规模最大、能力最强的 AI 模型 Gemini 推广到更多 Google 核心产品中,其中就包括 Google Ads。我们一直在积极测试 Gemini 以进一步增强 Google 广告解决方案。今天,我们很高兴地向大家分享, Gemini 已经在赋能 Google Ads 中的对话式体验。这一进展为接下来要推出的诸多 Gemini 集成拉开了序幕。
美国和英国市场使用英语语言的广告主现在已经可以在 Google Ads 中使用对话式体验的 Beta 版了。在接下来的几周内,它将开始在全球范围内逐步向所有使用英语语言的广告主开放。在未来的几个月内,我们还将开放针对更多语言的使用,对此我们非常激动,也期待听到来自你们的反馈。
对话式体验的流程旨在帮助您通过一种基于聊天的方式制作更出色的搜索广告系列。它将您的专业知识与 Google AI 相结合。在开始操作时,您只需添加自家网站的网址,Google AI 就会生成相关的广告素材,包括广告创意和关键字等,从而帮助您制作优化的搜索广告系列。
过去几个月里,我们一直在与一小部分广告主一起测试这种对话式体验。我们观察到,这种功能能够帮助他们更轻松地制作出更优质的搜索广告系列。为了衡量这一点,我们采取了多种方式,广告效力指标就是其中之一。这项指标衡量的是广告文案的相关性、质量和多样性,并且会给出从“较差”到“极佳”的不同等级的评分。
“我发现这种对话式体验非常易用,它帮助我制作出了更多广告效力评分达到‘良好’或‘极佳’的优质广告,从而进一步提升了广告系列的效果。”
—— Page1 公司付费搜索经理 Tom Foster
随着搜索体验变得更加可视化,我们听到一些广告主反馈,要制作能提升广告效果的引人入胜的图片并非易事。正因如此,我们设计的这种对话式体验能够利用生成式 AI 和您着陆页的图片,为您的广告系列提供量身定制的图片建议。这项功能在接下来的几个月就会增加到产品中。广告主需要先批准素材资源(包括图片),广告系列才会发布。
所有在 Google Ads 中(包括对话式体验)由生成式 AI 所创作的图片都会标明由 AI 生成。我们使用 SynthID 为这类图片加上隐藏式水印,图片中还会包含开放标准的元数据,以表明图片是由 AI 生成的。
我们的数据显示,在 Google Ads 中使用对话式体验的小企业广告主发布广告效力评分达到“良好”或“极佳”的搜索广告系列的可能性提高了 42%。¹这一点极为重要,因为我们发现广告效力与转化之间存在很强的相关性。举例来说,广告主将自适应搜索广告的广告效力从“较差”提升到“极佳”后,转化平均增加 12%。²
与整个行业一样,我们对 AI 能够为消费者和广告主等群体带来价值的潜力充满热忱。随着 AI 的快速进化,新的应用场景和机遇层出不穷。正因如此,我们认为 AI 将持续让我们的产品变得更有用。
在我们不断探索 AI 的无尽可能的同时,我们也将一如既往地以负责任的方式开发和应用这项新技术。我们深信,要做到这一点,最好的方式就是坚持 Google 在 2018 年确立的 AI 原则。
接下来的一年,我们将针对 Google Ads 推出更多 AI 赋能的新功能,敬请关注。如果您有意向立即开始使用 AI,请参阅 AI 必备知识。
¹数据来源:Google 内部数据,全球,在 Google Ads 中使用对话式体验以英语发布的搜索广告系列对比没有使用这种体验以英语发布的搜索广告系列,2023 年 8 月 21 日 - 2023 年 10 月 22 日²数据来源:Google 内部数据
提升网络隐私安全的工作永无止境。因此,在 Chrome 里,我们持续投入功能以保护您的数据,并让您对于数据的使用拥有更多的掌控。这就包含采取措施,限制对于您跨网站活动的跟踪。
1 月 4 日起,我们将开始测试“跟踪保护”(Tracking Protection)功能, 通过默认限制网站访问第三方 Cookie,该功能将限制跨网站跟踪。我们将率先向全球 1% 的 Chrome 用户推出此功能,对于我们在 Privacy Sandbox 中提出的,在回应英国竞争与市场管理局仍存在的竞争顾虑的前提下,于 2024 年下半年面向所有用户逐步淘汰第三方 Cookie 的计划而言,这是一个重要的里程碑。
近三十年来,第三方 Cookie 一直是网络的重要组成部分。虽然它们可以用来跟踪在不同网站的活动,但网站也用它们来支持一系列在线体验,例如帮助您登录或者展示相关的广告。
通过 Privacy Sandbox ,我们将以一种负责任的方式逐步淘汰 Chrome 中的第三方 Cookie。我们打造了新的工具,帮助网站继续支持关键的用例,并为开发人员提供了过渡的时间。而推出“跟踪保护”功能时,我们会先从一小部分 Chrome 用户开始,这样,开发人员可以测试自己是否已准备好迎接没有第三方 Cookie 的网络。
“跟踪保护”功能的参与者是随机选择的,如果您被选中,您在电脑或 Android 设备上打开 Chrome 时,就会收到通知。
基本上就是这样!当您浏览网页时,Chrome 将默认限制第三方 Cookie,从而限制对您的跨网站跟踪。
如果某个网站在没有第三方 Cookie 的情况下无法正常运行,而 Chrome 察觉您遇到了问题(比如您多次刷新某个页面),我们会为您提供一个选项提示,通过点击地址栏右侧的眼睛图标,您可以暂时为该网站重新启用第三方 Cookie。
我们致力于提升互联网的隐私性,同时也将继续为商家打造合适的工具,以便能够继续从网络上免费获取高质量的内容。如果没有免费的新闻文章、视频内容、教育信息、社群网站以及其他各类信息和内容,最初让网络值得被保护的意义也就不复存在了。借助“跟踪保护”,Privacy Sandbox,以及我们在 Chrome 中推出的其他各项功能,我们将一如既往地努力,维护让人人皆可使用的一个开放的网络,一个更加私密的网络。