中国的博客,走近我们的产品、技术和文化
Google 中国的博客,走近我们的产品、技术和文化
Gemini 3 开启智能新纪元
2025年11月19日
Sundar Pichai 寄语
Google 和 Alphabet 首席执行官
大约两年前,我们开启了 Gemini 时代,这是公司迄今为止投入最大的科研和产品项目之一。自那时起,看到大家对它的喜爱程度,着实令人惊叹。现在,每月有 20 亿用户使用 AI 概览(AI Overviews)。Gemini app 的月用户量已突破 6.5 亿,超过 70% 的 Cloud 客户使用我们的 AI,1300 万开发者在使用我们的生成模型进行构建——而这只是我们所看到的巨大影响的一个缩影。
我们能够以前所未有的速度将先进的能力带给全世界,这得益于我们独有的全栈式 AI 创新研究——从业界领先的基础设施、世界一流的研究与模型工具,再到服务全球数十亿用户的产品。
每一代 Gemini 都在前一代基础上进行构建,让您能够实现更多可能。Gemini 1 在原生多模态和长上下文窗口方面的突破,扩展了可处理的信息种类及其信息量。Gemini 2 则为智能体能力奠定了基础,并在推理和思考方面推动了前沿,帮助处理更复杂的任务和想法,使得 Gemini 2.5 Pro 连续六个多月在 LMArena 上位居榜首。
而现在,我们即将推出 Gemini 3,这是我们最智能的模型,它集合了 Gemini 的所有功能,能够帮助您将任何想法变为现实。
它具备最先进的推理能力,能够理解深层次内容与细微差别——无论是感知创意中细微的线索,还是剖析复杂难题中相互交织的结构维度。Gemini 3 在理解用户请求的上下文和真实意图方面也更为出色,您只需更精简的提示就能获取所需结果。更令人惊叹的是,仅仅用了两年时间,AI 已经从单纯的文本和图像识别,发展到能够“洞察语境”。
从今天起,我们将 Gemini 全面融入谷歌的产品生态。其中包括在 搜索的 AI 模式(AI Mode)下的 Gemini 3,具备更复杂的推理能力和全新的动态体验。这是我们首次在产品发布当日就将 Gemini 引入搜索。此外,Gemini 3 今天也同步向 Gemini app 用户、AI Studio 和 Vertex AI 的开发者、以及我们全新的智能体开发平台 Google Antigravity 中同步推出。——更多信息详见下文。
正如其前几代模型一样,Gemini 3 再次推动了技术的最前沿。在这个全新的篇章中,我们将继续推动智能、智能体和个性化服务的边界,让 AI能够真正助力于每个人。
我们希望您会喜欢 Gemini 3,我们也将持续改进它,并期待看到您用它创造的成果。更多精彩,敬请期待!
作者:
Demis Hassabis,Google DeepMind 首席执行官
Koray Kavukcuoglu,Google DeepMind 首席技术官兼 Google 首席 AI 架构师
谨代表 Gemini 团队
今天,我们在通往 AGI(通用人工智能)的道路上又迈出重要一步,正式发布 Gemini 3。
它不仅是全球领先的多模态理解模型,更是我们迄今为止最强大的智能体(Agentic)和氛围编程(Vibe Coding)模型,能够提供更丰富的可视化效果和更深度的交互体验——而这一切都构建在最先进的推理能力之上。
我们现已正式开启 Gemini 3 时代,并于今日推出 Gemini 3 Pro 预览版,将其集成到 Google 的全栈产品中。用户在日常生活中即可使用它来学习、构建和规划一切事务。同时,我们还推出了 Gemini 3 Deep Think 模式——这一增强型推理模式将 Gemini 3 的性能再次提升至全新高度。该模式在向 Google AI Ultra 订阅用户开放前,会首先供安全测试人员试用。
最先进的推理能力
具备前所未有的深度与洞察力
凭借领先的推理能力和强大的多模态功能,Gemini 3 Pro 能够将任何创意变为现实。在每个关键的 AI 基准测试中,它的性能均显著超越 2.5 Pro。
它在 LMArena 排行榜上以 1501 的突破性 Elo 评分高居榜首。其在推理能力上展现出博士水平,在“人类终极考试”中(未使用任何工具的情况下得分率达 37.5%)及 GPQA Diamond 基准测试中(准确率高达 91.9%)均获得最高分。此外,它在数学领域为前沿模型树立了全新标杆,在 MathArena Apex 测试中,以 23.4% 达到了最先进水平(State-of-the-Art)。
除了文本能力,Gemini 3 Pro 在 MMMU-Pro 上取得 81% 的成绩,在 Video-MMMU 上达到 87.6%。同时,该模型在 SimpleQA Verified 基准测试中也斩获了当前最先进的 72.1% 得分,展现出其在事实准确性方面的显著进步。这意味着 Gemini 3 Pro 具备高度可靠性,能够有效解决跨越科学和数学等广泛主题的复杂问题。
Gemini 3 在一系列关键 AI 基准测试中达到了最先进水平
Gemini 3 Pro 为每一次交互带来了全新的深度和细致入微的体验。它的回复智能、简洁、直接,用真知灼见取代了陈词滥调和奉承——它会告诉您真正需要了解的信息,而不仅仅是您希望听到的。作为您真正的思考伙伴,Gemini 3 Pro 提供了理解信息和自我表达的全新途径,无论是通过生成高保真可视化代码来解析深奥的科学概念,还是进行创意头脑风暴,都能为您提供强大助力。
Gemini 3 可以编写托卡马克(tokamak)中等离子体流动的可视化代码,并创作一首诗歌来捕捉核聚变的物理学原理
Gemini 3 深度思考
Gemini 3 的“深度思考模式”(Deep Think mode)进一步拓展了智能的边界,为 Gemini 3 的推理和多模态理解能力带来了跨越式提升,能够助力您攻克更复杂的难题。
在测试中,Gemini 3 Deep Think 在“人类最终考试”(Humanity's Last Exam)中的表现(未使用工具的情况下达到 41.0%)以及在 GPQA Diamond 测试中的表现(达到 93.8%),均超越了 Gemini 3 Pro 已经令人印象深刻的成绩。此外,它还在 ARC-AGI -2 基准测试中取得了 45.1% 的突破性成绩(启用代码执行),充分展现了其解决新型挑战的能力。
Gemini 3 的“深度思考模式”(Deep Think mode)在一些最具挑战性的 AI 基准测试中表现出色
Gemini 3 助力学习、构建和规划一切
学习一切
Gemini 从设计之初,就致力于无缝整合任何主题的跨模态信息,涵盖文本、图像、视频、音频和代码。Gemini 3 以其领先的推理能力、视觉与空间理解能力、多语言性能以及 100 万令牌的上下文窗口,进一步突破了多模态推理的前沿,帮助您以最适合自己的方式进行学习。
举例来说,如果您想学习烹饪家族传统菜肴,Gemini 3 可以解读并翻译不同语言的手写菜谱,整理成一本可分享的家族食谱。又或者,当您希望研究一个新主题时,只需提供学术论文、冗长的视频讲座或教程,它便能生成用于交互式闪卡、可视化图表或其他形式的代码,帮助您快速掌握素材。它甚至可以分析您匹克球比赛的视频,识别技术短板,并生成全面提升动作技巧的训练计划。
为了帮助您更好地理解网络信息,Search 中的 AI 模式 (AI Mode) 现已整合 Gemini 3,带来全新的生成式用户界面(Generative UI)体验,例如沉浸式视觉布局、交互式工具和模拟,所有内容均可根据您的查询实时生成。
构建一切
在 2.5 Pro 成功的基础上,Gemini 3 兑现了帮助开发者将创意变为现实的承诺。它在零样本生成(Zero-shot Generation)方面表现出色,能够处理复杂的提示和指令,从而渲染出更丰富、更具交互性的网页用户界面(Web UI)。
Gemini 3 是我们迄今为止构建的最出色的氛围编程(Vibe Coding)和智能体编程(Agentic Coding)模型——让我们的产品更具自主性,同时提高开发者生产力。它在 WebDev Arena 排行榜上以令人瞩目的 1487 ELO 名列前茅。在 Terminal-Bench 2.0 测试中(一个测试模型通过终端操作计算机的工具使用能力)上也取得 54.2% 的好成绩;同时,在衡量编程智能体(coding agents)的 SWE-bench Verified(76.2%)基准测试中,其表现远超 2.5 Pro。
您现在可以通过 Google AI Studio、Vertex AI、Gemini CLI 以及我们全新的智能体开发平台 Google Antigravity 中使用 Gemini 3 进行开发和构建。同时,它也已在 Cursor、GitHub、JetBrains、Manus、Replit 等第三方平台上线。
通过代码构建、解构和混编精细的 3D 体素(voxel)艺术,将您的想象力变为现实。请在 AI Studio 中试用
推出全新的以智能体为核心的开发体验
随着 Gemini 3 模型智能的不断加速,我们有机会重新构想整个开发者体验(developer experience)。今天,我们正式发布 Google Antigravity,我们全新的智能体开发平台,让开发者能够在更高层次上,以任务为导向的方式进行开发。
Google Antigravity 利用 Gemini 3 的高级推理、工具使用和智能编码能力,将 AI 辅助从开发者工具包中的工具转变为一个活跃的伙伴。尽管 Google Antigravity 的核心仍沿用熟悉的 AI 集成开发环境(IDE),但其智能体已被提升到一个专属的界面,并被赋予直接访问编辑器、终端和浏览器的权限。现在,智能体能够代表您自主规划和执行复杂的端到端软件任务,并在此过程中自行验证代码。
除了 Gemini 3 Pro 之外,Google Antigravity 还深度整合了我们最新的用于浏览器控制的 Gemini 2.5 Computer Use 模型,以及我们广受好评的图像编辑模型 Nano Banana(Gemini 2.5 Image)。
Google Antigravity 使用 Gemini 3 来驱动航班追踪应用所需的端到端智能体工作流程。该智能体能够独立规划、编写应用程序代码,并通过基于浏览器的计算机使用来验证其执行效果
规划一切
自从 Gemini 2 开启智能体时代以来,我们取得了巨大的进展,不仅提升了 Gemini 的编码智能体(coding agent)能力,还提高了它在更长周期内可靠地提前规划能力。Gemini 3 在 Vending-Bench 2 排行榜上名列榜首,印证了这一点。该基准测试通过管理模拟自动售货机业务来测试长周期规划能力。Gemini 3 在整整一年的模拟运营过程中,保持了工具使用和决策的一致性,在没有偏离任务的前提下,带来了更高的回报。
Gemini 3 Pro 展示了更优秀的长期规划能力,与其他前沿模型相比,能够产生显著更高的回报
这意味着 Gemini 3 能更好地帮助您完成日常事务。凭借更深入的推理能力和更稳定的工具使用,Gemini 3 能在您的控制和指导下,帮您完成整个复杂、多步骤的工作流程——例如整理 Gmail 收件箱或规划完整的旅行行程。
Google AI Ultra 订阅者今天就可以在 Gemini 应用中使用 Gemini Agent 来体验这些智能体能力。我们在提升 Gemini 的智能体能力方面收获良多,我们也很快会将这些功能扩展到更多 Google 产品,非常期待看到您如何使用它。
负责任地构建 Gemini 3
Gemini 3 是我们迄今为止最安全的模型,并且接受了 Google AI 模型中最全面的一套安全评估。该模型展现了更低的谄媚性(sycophancy),更高的抗提示注入(prompt injection)能力,并强化了抵御网络攻击滥用的保护措施。
除了对我们前沿安全框架(Frontier Safety Framework)中关键领域进行内部测试外,我们还与全球前沿领域的专家合作进行了评估,向英国人工智能安全研究所(UK AISI)等机构提供了早期访问,并获得了 Apollo、Vaultis、Dreadnode 等行业专家的独立评估意见。更多信息,详见 Gemini 3 模型卡。
Gemini 的下一个时代
这仅仅是 Gemini 3 时代的开始。从今天起, Gemini 3 逐步向用户开放,供您试用体验:
适用于所有 Gemini app 的用户,以及在 Search 的 AI Mode 下的 Google AI Pro 和 Ultra 订阅用户。
适用于 AI Studio 中 Gemini API 的开发者,我们全新的智能体开发平台 Google Antigravity 以及 Gemini CLI。
适用于 Vertex AI 和 Gemini Enterprise 的企业用户。
对于 Gemini 3 “深度思考模式”(Deep Think mode),我们正在投入更多时间进行安全评估并收集安全测试人员的反馈,预计将在未来几周内向 Google AI Ultra 订阅用户开放该功能。
我们计划很快发布 Gemini 3 系列中的其他模型,以便您能够借助 AI 完成更多任务。我们期待收到您的反馈,也期待看到您使用 Gemini 进行学习、构建和规划的成果。
標籤
编程之夏,UR
创新
创意改善社会 公益温暖中国
促进智能能源利用
大学
谷歌翻译,即时相机翻译,Instant Camera Translation
谷歌十周年系列
谷歌艺术与文化
观妙中国,Shadow Art,智玩皮影
广告
广告安全
互联网,Internet
科技
女性开发者
社会
视频广告
数据中心
数字营销
搜索
网站管理员
文化研究所
艺术计划
音乐搜索
愚人节
增强型广告系列
智能隐形眼镜项目
中小企业
adexchange
Admob
admob sdk
Ads
Adsense
AdWords
android
android m
Android应用开发中国大学生挑战赛
App Inventor
Calendar
cardboard
CES
Chrome
Chrome Web Store
Chrome,Chrome实验
Chrome实验
CI
Code Jam
corporate
Creative
Cross-device
Cultural Institute
culture
Data Center
DevArt
Developer
display
diversity
Doodle
DoubleClick
G+
G2G,Culture
GA&C
gaming
Global Impact Awards
Gmail
Gogle科学挑战赛
Good to Know
Google Ads
Google AdWords
Google Analytics
Google Art Project
Google Arts & Culture
Google Code-in竞赛
Google Demo Day Asia
Google Docs
Google Doodle
Google Drive
Google Drive 云端硬盘
Google Fiber
Google Font
Google for Startups
Google Green
Google I/O
Google Image Search
Google Keep
Google partners
Google Play
Google Science Fair
Google Search
Google Top Contributor Summit
Google Translate
Google Trend
Google Trends
Google Zeitgeist 2012
Google安全系统
Google博士生奖研金
Google翻译
Google奖学金
Google杰出贡献者峰会
Google科学挑战赛
Google网站管理员
Google网站管理员,Webmaster
Google文化研究所
Google在线营销挑战赛
Google中国教育高峰会
IME 输入法
Innovation
Made with Code
maps
mobile ads
mobile ads sdk
Modoo
moonshot
native ads
Nexus
programmatic buying
Project X
Pwn20wn及Pwnium3 黑客大赛
Remarketing. Ads
Search
Security
smb
Solve for X
Street view
student
UR
VR
Web Platform Docs
web security
Webmaster
year in search 2014
YouTube
zeitgeist
博客归档
2025
11月
8月
6月
5月
4月
3月
2024
12月
11月
10月
8月
7月
6月
5月
4月
3月
2月
1月
2023
12月
11月
10月
9月
5月
4月
3月
2月
2022
11月
10月
5月
4月
2月
1月
2021
10月
9月
5月
4月
3月
2月
2020
12月
5月
4月
3月
2019
10月
8月
7月
6月
5月
4月
3月
2018
12月
10月
9月
8月
7月
6月
5月
3月
2月
1月
2017
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2016
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2015
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2014
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2013
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2012
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2011
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2010
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2009
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2008
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2007
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2006
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
Feed