Hottest Videos AI Summarized 2025-05-21

Ed Helms on Human Creativity and A.I.'s Future in the Film Industry  #technology #ai #film

1:37

1. 📝 Ed Helms on Human Creativity and A.I.'s Future in the Film Industry #technology #ai #film (62 times summarized)

暂无总结
Antonio Gracias: DOGE updates, Voter fraud, Finding 'Big Balls' | All-In Live from Miami

28:39

2. 📝 Antonio Gracias: DOGE updates, Voter fraud, Finding 'Big Balls' | All-In Live from Miami (56 times summarized)

暂无总结
Google Takes No Prisoners Amid Torrent of AI Announcements

17:08

3. 📝 Google Takes No Prisoners Amid Torrent of AI Announcements (54 times summarized)

暂无总结
How Elon Musk Attracts 10x Engineers

1:29

4. 📝 How Elon Musk Attracts 10x Engineers (50 times summarized)

暂无总结
Google I/O '25 Keynote

1:56:35

7. 📝 Google I/O '25 Keynote (14 times summarized)

谷歌 I/O '25 主题演讲 🚀

开场影片 🎬

[音乐] 这个小镇还没见过什么呢。[音乐] 一,二,一,二,三,哦

介绍 🎤

醒醒吧,孩子们,我们得了梦想家的病。14岁,他们让你跪下。如此礼貌,我们还在说请。你拥有音乐。别放手。你拥有音乐。还剩一支舞。这个世界会挺过去的。别放弃。你有一个活下去的理由。不能忘记。我们只会得到我们所给予的。我回家了,宝贝。你是最棒的。现在给我。 [掌声]

桑达尔·皮查伊:哇,酷炫的视频!看起来团队玩得很开心。大家好,早上好!欢迎来到谷歌 I/O。[欢呼和掌声] 很高兴在海岸线见到大家,也向世界各地在线加入的各位问好。我了解到今天是双子座的季节开始了。不太确定有什么大不了的;在谷歌,每天都是双子座的季节。通常,在 I/O 之前的几周,你不会听到我们太多的消息。那是因为我们会把最好的模型留到这个舞台上。但在我们的双子座时代,我们同样有可能在三月的某个随机星期二发布我们最智能的模型,或者在之前一周发布像 AlphaEvolve 这样非常酷的模型。我们希望尽快将我们最好的模型交付到你们手中和我们的产品中,因此我们的发布速度比以往任何时候都快。自从上次 I/O 以来,我们已经发布了十几个模型和研究突破,并发布了 20 多个主要的 AI 产品和功能。我对模型快速进步感到特别兴奋。你可以在这里看到阶跃函数的变化。自第一代双子座 Pro 以来,Elo 分数(一种衡量进步的指标)提高了 300 多分。

今天,双子座 2.5 Pro 横扫 LMArena 排行榜的所有类别。[掌声] 它在许多基准测试中都是最先进的,而且我们在编码方面也取得了快速进展。我们更新后的 2.5 Pro 在 WebDev arena 上排名第一,现在超过了之前的版本 142 Elo 分。由于你们大家,它在顶级编码平台上受到了很多喜爱。在领先的 AI 代码编辑器 Cursor 上,双子座是今年增长最快的模型,每分钟产生数十万行被接受的代码添加。现在,至少在某些圈子里,最后一个里程碑可能最令人印象深刻。几周前,双子座完成了《精灵宝可梦 蓝》。[掌声] 它赢得了所有八个徽章,走过了胜利之路,击败了四天王和冠军,使我们离实现 API,人工智能宝可梦智能更近了一步。[笑声] [掌声]

所有这些进步都得益于我们世界领先的基础设施,这是我们 AI 全栈方法的基石。我们的第七代 TPU Ironwood 是第一个专门为大规模思考和推理而设计的。它比上一代性能提高了 10 倍,每个 pod 包含惊人的 42.5 exaflops 的计算能力。真是太棒了。它将在今年晚些时候提供给谷歌云客户。[掌声] 我们的基础设施实力,一直到 TPU,帮助我们交付速度快得多的模型。在 LMArena 排行榜上的顶级模型中,双子座在前三名中占据了最高的每秒生成输出令牌数,同时模型价格也在大幅下降。价格和性能之间存在着艰难的权衡,但我们一次又一次地能够以最具成本效益的价格点交付最好的模型。谷歌不仅在引领帕累托前沿,而且从根本上改变了前沿本身。

双子座 ♊️

结果:更多智能可供所有人随时随地使用。世界正在以前所未有的速度响应和采用 AI。作为衡量进步的一个指标,去年这个时候,我们每月在我们的产品和 API 中处理 9.7 万亿个令牌。现在,我们每月处理 480 万亿个令牌。这在短短一年内增长了约 50 倍。[掌声] 我们还看到我们的开发者 API 工具被广泛采用。今天,超过 700 万开发者已经使用双子座 API 在谷歌 AI Studio 和 Vertex AI 上进行构建,自上次 I/O 以来增长了 5 倍以上。自去年以来,双子座在 Vertex AI 上的使用量增长了 40 多倍。AI 采用正在我们的产品中增加。双子座应用程序现在拥有超过 4 亿月活跃用户,我们看到了强劲的增长和参与度,特别是 2.5 模型。对于那些在双子座应用程序中使用 2.5 Pro 的人来说,使用量增加了 45%。稍后您将听到更多关于双子座应用程序的信息。

我们还在搜索中看到了令人难以置信的势头。今天,AI 概述每月拥有超过 15 亿用户。这意味着谷歌搜索正在将生成式 AI 带给比世界上任何其他产品更多的人。除了 AI 概述之外,AI 模式是搜索的下一个重大步骤。稍后您将听到更多关于此的信息。所有这些进步意味着我们正处于 AI 平台转变的新阶段,数十年的研究正在成为世界各地人们的现实。我想分享三个研究如何改变我们今天产品的例子:Project Starline、Astra 和 Mariner。几年前,我们在 I/O 上首次推出了 Project Starline,我们突破性的视频技术。目标是创造一种即使你相隔很远,也能感觉和某人在同一个房间里的感觉。我们一直在进行技术进步,今天,我们准备宣布我们的下一个篇章。推出谷歌 Beam,一个以 AI 为先的全新视频通信平台。

Beam 使用一种新的最先进的视频模型,将 2D 视频流转换为逼真的 3D 体验。在幕后,一组六个摄像头从不同的角度捕捉你。借助 AI,我们可以将这些视频流合并在一起,并在 3D 光场显示器上渲染你。以接近完美的头部跟踪精度达到毫米级,并以每秒 60 帧的速度实时进行。结果:一种更自然、更身临其境的对话体验。我们很高兴将这项技术带给其他人。与惠普合作,第一批谷歌 Beam 设备将在今年晚些时候提供给早期客户。惠普将在几周后分享更多信息。敬请关注。[掌声] 多年来,我们一直在将 Starline 的底层技术引入谷歌 Meet。这包括实时语音翻译,以帮助人们打破语言障碍。这是一个例子,说明当你在南美预订度假租赁,而你不会说当地语言时,这会多么有用。让我们来看一下。你好,卡米拉。让我打开语音翻译。[翻译成西班牙语] 你会玩得很开心,而且我认为你会喜欢参观这座城市。房子在一个非常好的社区,可以俯瞰山脉。听起来很棒[翻译成西班牙语] 附近有一辆公共汽车,但我建议租一辆车,这样你就可以参观大自然并享受它。听起来很棒[翻译成西班牙语] [掌声] 桑达尔·皮查伊:你可以看到它与说话者的语气、模式甚至表情多么匹配。我们甚至更接近于进行跨语言的自然和自由流畅的对话。今天,我们正在谷歌 Meet 中直接引入这种实时语音翻译。英语和西班牙语翻译现在可供订阅者使用,更多语言将在未来几周内推出,实时翻译将在今年晚些时候提供给企业。[掌声] 另一个在 I/O 舞台上首次亮相的早期研究项目是 Project Astra。它探索了通用 AI 助手的未来能力,该助手可以理解你周围的世界。我们正在开始将其引入我们的产品。今天,双子座 Live 拥有 Project Astra 的摄像头和屏幕共享功能,因此你可以谈论你看到的任何东西。人们正在以多种方式使用它,无论是练习面试还是训练马拉松。我们一直在感谢我们信任的测试人员和一些不太信任的人的反馈。来看一下。那是一辆不错的敞篷车。双子座:我认为你可能把垃圾车误认为是敞篷车了。还有什么我可以帮你的吗?这栋瘦长的建筑在我家附近做什么?双子座:那是一盏路灯,不是建筑物。为什么这些棕榈树这么矮?我担心它们。双子座:它们不矮。它们实际上很高。酷炫的敞篷车。双子座:又是垃圾车。还有什么?为什么人们一直把包裹送到我的草坪上?双子座:那不是包裹,那是一个公用设施箱。为什么这个人无论我走到哪里都跟着我?双子座:没有人跟着你。那只是你的影子。[掌声] 桑达尔·皮查伊:双子座很擅长告诉你什么时候错了。我们正在从今天开始向 Android 和 iOS 上的所有人推出此功能。[掌声] 接下来,我们还有一个研究原型,Project Mariner,一个可以与网络交互并完成任务的代理。退一步说,我们认为代理是将高级 AI 模型的智能与工具访问相结合的系统。他们可以在你的控制下代表你采取行动。计算机使用是一项重要的代理能力。它使代理能够与浏览器和其他软件交互。Project Mariner 是测试计算机使用能力的一个早期步骤。我们在 12 月发布了它作为一个早期研究原型,并且自那以后取得了很大进展。首先,我们正在引入多任务处理,它现在可以同时监督多达 10 个任务。其次,它正在使用一个名为 Teach and Repeat 的功能。你可以向它展示一次任务,它就会学习未来类似任务的计划。我们正在通过双子座 API 将 Project Mariner 的计算机使用能力提供给开发者。像 Automation Anywhere 和 UI Path 这样的受信任的测试人员已经开始使用它进行构建,它将在今年夏天更广泛地提供。计算机使用是我们构建代理生态系统所需的一组更广泛的工具的一部分,例如我们的开放式代理到代理协议,以便代理可以相互通信。我们在 Cloud Next 上启动了它,得到了 60 多个技术合作伙伴的支持,并希望看到这个数字增长。然后是 Anthropic 引入的模型上下文协议,以便代理可以访问其他服务,今天,我们很高兴地宣布我们的双子座 SDK 现在与 MCP 工具兼容。[掌声] 这些技术将协同工作,使代理更有用,我们正在开始将代理能力引入 Chrome、搜索和双子座应用程序。让我向你展示我们在双子座应用程序中感到兴奋的事情。我们称之为代理模式。如果你想在奥斯汀为你和两个室友找到一套公寓。你们每个人都有 1,200 美元的月预算。你想要一台洗衣机、烘干机或至少附近有一家自助洗衣店。通常,你必须花费大量时间滚动浏览无尽的列表。使用代理模式,双子座应用程序在幕后开始工作。它从 Zillow 等网站上找到符合你标准的列表,并在需要时使用 Project Mariner 来调整非常具体的过滤器。如果你想查看一套公寓,双子座使用 MCP 访问列表,甚至代表你安排参观。它会继续浏览新的列表,只要你需要,让你有时间做你想做的事情,比如计划乔迁派对。这对像 Zillow 这样的公司来说非常棒,可以带来新客户并提高转化率。双子座应用程序中代理模式的实验版本将很快提供给订阅者。这是一个新兴领域,我们很高兴探索如何最好地将代理的好处带给用户和更广泛的生态系统。我们将研究转化为现实的最好方法是使其在你自己的现实中真正有用。这就是个性化将真正发挥作用的地方。我们正在努力通过我们称之为个人上下文的东西来实现这一点。在你的允许下,双子座模型可以以一种私密、透明且完全在你的控制下的方式使用你谷歌应用程序中的相关上下文。让我向你展示一个 Gmail 中的例子。你可能熟悉我们 AI 驱动的智能回复功能。它们非常受欢迎。现在,想象一下,如果这些回复听起来像你。这就是个性化智能回复背后的想法。假设我的朋友写信给我寻求建议。他要去犹他州进行公路旅行,他记得我以前做过这次旅行。现在,如果我说实话,我可能会回复一些简短且无用的东西。对不起,菲利克斯。但是有了个性化智能回复,我可以成为一个更好的朋友。那是因为双子座可以完成几乎所有的工作,在云端硬盘中查找我的笔记,扫描过去的电子邮件以查找酒店预订,并在谷歌文档中找到我的行程。锡安国家公园之旅。双子座匹配了我上次电子邮件中的典型问候语,捕捉了我的语气、风格和最喜欢的词语选择,然后它会自动生成回复。我喜欢它如何包含诸如每天保持驾驶时间在五个小时以下之类的细节。它使用了我最喜欢的形容词“令人兴奋”。看起来很棒。也许你想对它进行一些更改并点击发送。这将在这个夏天在 Gmail 中提供给订阅者。[掌声] 你可以想象个人上下文在搜索、文档、双子座等中会多么有用。今天,我已经谈到了智能、代理和个性化。这些是我们取得进展的一些前沿领域,你将在主题演讲中听到更多例子。但首先,我想邀请一位可以分享更多关于驱动我们未来创新的智能的人。

生成媒体 🎨

去年,我把他介绍为德米斯爵士。今年,我们可以在他的头衔列表中添加诺贝尔奖获得者。出来吧,德米斯。[掌声] 德米斯·哈萨比斯:大家好。很高兴回到 I/O。我们正经历着一个非凡的历史时刻,AI 正在使一个令人惊叹的新未来成为可能。对我们来说,这是不懈进步的一年。正如桑达尔所说,人们喜欢与双子座 2.5 互动。我们看到你用它进行 vibe-code,在一个商店里构建游戏和应用程序。你已经使用它强大的推理能力来处理从解压科学论文到理解 YouTube 视频的所有事情。你告诉我们你发现使用双子座是多么的协作、有见地和真正有帮助。看到你们都在用它做和构建的令人敬畏的事情,我们感到非常兴奋。双子座 2.5 Pro 是我们有史以来最智能的模型,也是世界上最好的基础模型。就在两周前,我们发布了更新后的 2.5 Pro 的预览版,以便你可以立即上手并开始使用它进行构建。你所创造的东西给我们留下了深刻的印象,从将草图变成交互式应用程序,到模拟整个 3D 城市。新的 2.5 Pro 在流行的编码排行榜 WebDev arena 上名列前茅,现在它结合了 Learn LM,我们与教育专家一起构建的模型系列,2.5 Pro 也是学习的领先模型。它在 LMArena 的所有排行榜上都排名第一。双子座 Flash 是我们最高效的工作模型。它在开发者中非常受欢迎,他们喜欢它的速度和低成本。今天,我很高兴地宣布我们将发布更新版本的 2.5 Flash。新的 Flash 在几乎所有维度上都更好,在推理、代码和长上下文的关键基准测试中都有所改进。事实上,它在 LMArena 排行榜上仅次于 2.5 Pro。我很高兴地说,Flash 将在 6 月初全面上市,Pro 很快也会上市。[掌声] 我们正在根据你的反馈进行最后的调整,但你现在可以在 AI Studio、Vertex AI 和双子座应用程序中试用预览版。与往常一样,我们正在努力不懈地推动最先进的技术,我们对我们最新的研究进展感到兴奋。为了告诉你更多,我想欢迎 Tulsee 上台。但首先,让我们看看你今天用双子座构建的东西。[音乐] 你能……嗯……让一堆像五彩纸屑一样的圆圈从我的鼠标里爆炸出来吗?双子座:我已经更新了草图。好的。我们接下来应该构建什么?这里有另外 30 个想法供你参考。[音乐] [掌声] Tulsee Doshi:谢谢,Demis。我很高兴能分享我们正在进行的改进,以便让像你们这样的开发者更容易使用双子座 2.5 进行构建,所有这些都基于你的反馈,具有改进的功能、增强的安全性和透明度、更好的成本效率和更多的控制。首先,除了 Demis 提到的新的 2.5 Flash 之外,我们还推出了新的文本到语音的预览版。这些现在具有首创的多扬声器支持,支持两种声音,建立在原生音频输出之上。双子座:这意味着该模型可以用更具表现力的方式进行对话。它可以捕捉我们说话方式中非常细微的差别。(耳语)它甚至可以无缝地切换到耳语,就像这样。Tulsee Doshi:这适用于超过 24 种语言。它甚至可以轻松地在语言之间切换。双子座:所以该模型可以开始用英语说话,但是……[说印地语] 然后切换回来,所有这些都使用相同的声音。Tulsee Doshi:非常棒,对吧?[掌声] 你可以从今天开始在双子座 API 中使用这种文本到语音的功能。[掌声] Live API 还将在今天晚些时候提供原生音频对话的 2.5 Flash 预览版,因此你可以构建具有更自然双子座的对话体验。它甚至能够区分说话者和背景声音,因此它知道何时做出回应。Logan 和 Paige 将在开发者主题演讲中向你展示更多。其次,我们加强了对安全威胁(如间接提示注入)的保护,因此双子座 2.5 是我们迄今为止最安全的模型!在 2.5 Pro 和 Flash 中,我们都通过双子座 API 和 Vertex AI 包含了思想摘要。思想摘要采用模型的原始思想,并将它们组织成清晰的格式,其中包含标题、关键细节和有关模型操作(如工具调用)的信息。这为你提供了更高的模型思考透明度,这对于高延迟任务尤其有用,同时也易于调试和使用。你还要求我们提高效率,因此今天的 2.5 Flash 更加高效,减少了模型在相同性能下需要使用的令牌数量,从而在我们的评估中实现了 22% 的效率提升。最后,我们推出了具有思考预算的 2.5 Flash,让你控制成本和延迟,而不是质量,并且反响很好,因此我们将思考预算引入 2.5 Pro,它将在未来几周内与我们普遍可用的模型一起推出。通过思考预算,你可以更好地控制模型在响应之前用于思考的令牌数量,或者你可以简单地将其关闭。现在,正如你从 Demis 那里听到的,双子座 2.5 Pro 在编码方面非常出色,因此现在,让我向你展示如何将你拥有的任何想法变为现实。因此,如果你曾经去过纽约市的美国自然历史博物馆,它有一系列令人惊叹的展览,因此为了今天向你展示这一点,我让 2.5 Pro 在谷歌 AI Studio 中为我编写了一个简单的 Web 应用程序,以分享一些照片并了解更多信息。这是我目前拥有的,但我希望使其更具交互性。我仍在集思广益地进行设计,但我有一些想法。你以前见过类似的东西,对吧?有人带着潦草地写在餐巾上的绝妙想法来找你。作为一名 PM,我通常是这个“某人”。现在,标准的二维 Web 设计是一回事,但我想让它成为 3D。我了解到跳入 3D 并不容易。它需要学习各种新事物:设置场景、相机、照明等等。幸运的是,2.5 Pro 可以帮助我。在这里,我要做的是添加我刚刚展示给你的球体图像,并且我要添加一个提示,要求 2.5 Pro 根据图像更新我的代码。我们将让 2.5 Pro 开始工作,正如你所看到的,它开始思考并继续根据我所要求的内容创建一个计划,并将其应用于我现有的代码库。因为双子座是多模态的,它可以理解抽象的球体草图,并编写漂亮的 3D 动画,将它们应用于我现有的应用程序。这需要大约两分钟,因此为了节省时间,我们将以烘焙节目的风格进行操作,并且我将跳转到我在主题演讲之前运行的另一个选项卡,其中包含相同的提示。这是 2.5 Pro 生成的内容。哇![掌声] 我们直接从粗略的草图到代码,更新了我的多个文件,你可以实际看到它思考了 37 秒,你可以看到它思考的更改,然后是它更新的文件。我们所有这些都在 AI Studio 中完成,因此一旦我完成原型设计,我可以简单地部署代码以及我的双子座 API 密钥。这是我们在 Chrome 中的最终应用程序。看看这些动画!我不需要具备 three.js 库的先进知识或弄清楚复杂的 3D 数学来构建它。我知道手动完成这将花费很长时间,相反,我能够仅根据草图创建它。我可以通过多模态使这种体验更加丰富。因此,我使用 2.5 Flash 在每张照片中添加一个问题,邀请你了解更多信息。但是如果它说话呢?这就是双子座原生音频的用武之地。双子座:那是一只穿山甲,它的鳞片由角蛋白制成,就像你的指甲一样!Tulsee Doshi:哇,现在,我们在说话了。你可以听到如何将富有表现力的音频直接添加到你的应用程序中。在我分享更多内容之前,我将留下这个演示,其中包含 2.5 Pro 专门为我们编写的另一个有趣的布局![掌声] 我们已经在谷歌 AI Studio 中为任何人提供了在此演示之上构建的入门代码。所以去试试吧。这只是双子座 2.5 如何改变我们构建方式以及你如何利用令人难以置信的功能将视觉、语音和编码集成到你自己的应用程序中的一个例子。2.5 Pro 可在你最喜欢的 IDE 平台上使用,并在谷歌产品(如 Android Studio、Firebase Studio、双子座代码助手和我们的异步编码代理 Jules)中使用。[掌声] 只需提交一个任务,Jules 就会处理剩下的事情:修复错误、进行更新。它与 GitHub 集成并独立工作。Jules 可以在大型代码库中处理过去需要数小时的复杂任务,例如更新旧版本的 Node.js。它可以计划步骤、修改文件等等,只需几分钟。今天,我很高兴地宣布 Jules 现在处于公开测试阶段,因此任何人都可以通过 jules.google 注册。[掌声] 正如 Demis 所说,我们一直在创新新方法来改进我们的模型,包括使它们更高效和性能更好。我们首先通过开创扩散技术彻底改变了图像和视频生成。扩散模型学习通过逐步细化噪声来生成输出。今天,我们将扩散的力量带给文本,并推出了我们最新的研究模型。这有助于它擅长编辑等任务,包括在数学和代码的上下文中。因为它不仅仅是从左到右生成,它可以非常快速地迭代解决方案并在生成过程中纠正错误。

Android XR 👓

双子座扩散是一种最先进的实验性文本扩散模型,它利用这种并行生成来实现极低的延迟。例如,我们今天发布的双子座扩散版本比我们迄今为止最快的模型 2.0 Flash Lite 快五倍,同时匹配其编码性能。以这个数学例子为例。准备好了吗?开始!如果你眨眼了,你就错过了。[掌声] 现在早些时候,我们加快了速度,但这次,我们将稍微放慢速度。看到模型如何得到 39 这个答案的过程真是太酷了。该模型目前正在与一小群人进行测试。我们将继续研究不同的方法,降低我们所有双子座模型中的延迟,更快的 2.5 Flash Lite 即将推出。现在,有关双子座的未来,请回到 Demis。[掌声] [音乐] Demis Hassabis:谢谢,Tulsee。我们一直在忙于探索双子座 2.5 中思维能力的前沿。正如我们从 AlphaGo 的经验中所知,当我们给这些模型更多思考时间时,响应会得到改善。今天,我们通过引入一种我们称之为 DeepThink 的新模式,使 2.5 Pro 变得更好。它将模型性能推向极限,从而获得突破性的结果。DeepThink 使用我们最新的尖端思维和推理研究,包括并行技术。到目前为止,我们已经看到了令人难以置信的性能。它在 USAMO 2025 上获得了令人印象深刻的分数,目前这是最难的数学基准之一。它在 LiveCodeBench 上领先,这是一个竞争级别编码的困难基准。由于双子座从一开始就是原生多模态的,因此它在衡量这一点的主要基准 MM-MU 上表现出色也就不足为奇了。因为我们正在用 2.5 Pro DeepThink 定义前沿,所以我们正在花费额外的时间进行更多的前沿安全评估,并从安全专家那里获得进一步的意见。作为其中的一部分,我们将通过双子座 API 将其提供给受信任的测试人员,以在广泛提供之前获得他们的反馈。你将在今天晚些时候从 Josh 那里听到更多关于我们 2.5 Pro DeepThink 计划的信息。在过去的十年中,我们为现代 AI 时代奠定了许多基础。从我们开创性的发明 Transformer 架构(如今所有大型语言模型都以此为基础)到像 AlphaGo 和 AlphaZero 这样的代理系统,我们继续加倍投入我们基础研究的广度和深度,以发明人工智能所需的下一个重大突破。双子座已经是最好的多模态基础模型,但我们正在努力扩展它,使其成为我们所说的世界模型。这是一个可以通过模拟世界的各个方面来制定计划和想象新体验的模型,就像大脑一样。这是我一直热衷的事情,自从我早期开发像 Theme Park 这样的模拟游戏 AI 以来,我就一直在思考虚拟世界。我们一直在朝着这个方向迈进,通过我们开创性的工作,训练代理掌握像围棋和星际争霸这样的复杂游戏,到最近我们的 Genie 2 模型,它能够生成你可以与之交互的 3D 模拟环境,只需一个图像提示。你已经可以看到这些能力正在出现,在双子座可以使用其世界知识和推理来表示自然事物的方式中。在 Veo 中,我们最先进的视频模型,它对直观的物理学(如重力、光和材料的行为方式)有深刻的理解。令人难以置信的是,Veo 在帧之间保持准确性和一致性。即使提示变得有点创意,比如这个人用救生筏制成,它也知道该怎么做。理解物理环境对于机器人技术也至关重要。AI 系统将需要世界模型才能在现实世界中有效运行。我们微调了一个专门的模型,双子座机器人技术,它教机器人做有用的事情,比如抓取、遵循指令和即时适应新任务。对于今天在这里的你们,你们可以在 AI 沙盒中玩机器人。[掌声] 使双子座成为一个完整的世界模型是解锁一种新型 AI 的关键一步,这种 AI 在你的日常生活中很有帮助,它很智能并且了解你所处的环境,并且可以代表你在任何设备上制定计划并采取行动。这是我们对双子座应用程序的最终愿景,将其转变为一个通用 AI 助手,一个个性化、主动且强大的 AI,也是我们在通往 AGI 之路上的关键里程碑之一。这始于我们去年在 Project Astra 中首次探索的功能,例如视频理解、屏幕共享和记忆。在过去的一年中,我们一直在将这些功能集成到双子座 Live 中,以便更多人今天体验。当然,我们继续不懈地改进和探索前沿的新创新。例如,我们已将语音输出升级为使用原生音频更加自然;我们改进了记忆;并添加了计算机控制。让我们来看一下。我在这里使用 Project Astra 的最新研究原型。我们将看看它如何帮助我修理自行车。嘿,上网查找 Huffy 山地自行车的用户手册。我找到了你的用户手册。你想知道什么?好的,太酷了。现在滚动直到你找到关于刹车的部分。当然。现在正在寻找该页面。我想我把这个螺丝拧坏了。你能在 YouTube 上找到一个关于如何修复它的视频吗?当然。我现在正在打开 YouTube。这看起来是一个不错的视频。哦,太好了。谢谢。你能浏览我与自行车店的电子邮件,找到我需要的六角螺母的尺寸吗?当然。根据 Bicycle Habitat 的电子邮件,你的链轮需要一个 3/8 英寸的六角螺母。我已经为你突出显示了正确的箱子。看来我需要一个备用张紧螺丝。你能打电话给最近的自行车店,看看他们有什么库存吗?是的。现在打电话给他们。我会告诉你他们有什么库存。我想我的刹车片正在磨损。你能再次查看手册,看看它是否在任何地方谈到它们吗?根据手册,如果你查看第 24 页。嘿!你想吃午饭吗?是的。给我五分钟。你能说完你刚才说的话吗?正如我刚才所说,如果你查看第 24 页,第 2 节,你将看到如何更换刹车片。嘿,关于那个电话有什么更新吗?是的,我刚和自行车店通完电话。他们确认他们有你的张紧螺丝库存。你想让我下订单吗?你能给我看一些我可以放在自行车上的狗篮子的例子吗?当然,我可以帮你。请稍等。这里有一些选择。我认为 Zuka 在这些里面看起来会很棒。[掌声] Demis Hassabis:一个通用的 AI 助手将为我们执行日常任务。它将处理我们平凡的管理工作,并提出令人愉快的新建议,使我们更有效率并丰富我们的生活。我们现在正在从受信任的测试人员那里收集关于这些新功能的反馈,并努力将它们带给双子座 Live、搜索中的新体验和开发者的 Live API,以及像 Android XR 眼镜这样的新外形。你将在今天晚些时候听到更多关于此的信息。我的整个职业生涯,其核心一直是使用 AI 来推进知识和加速科学发现。在 Google DeepMind,我们长期以来一直在几乎所有科学分支中应用 AI。仅在过去一年中,我们在从数学到生命科学的广泛领域取得了一些巨大的突破。我们构建了 AlphaProof,它可以解决银牌级别的数学奥林匹克问题;Co-Scientist,它可以与研究人员合作,帮助他们开发和测试新的假设;我们刚刚发布了 AlphaEvolve,它可以发现新的科学知识,并加速 AI 训练本身。在生命科学领域,我们构建了 AMIE,一个可以帮助临床医生进行医疗诊断的研究系统;AlphaFold 3,它可以预测所有生命分子的结构和相互作用;Isomorphic Labs,它建立在我们的 AlphaFold 工作之上,以 AI 彻底改变药物发现过程,并将有一天帮助解决许多全球性疾病。在短短几年内,AlphaFold 已经对科学界产生了巨大的影响。它已成为生物学和医学研究的标准工具,全球有超过 250 万研究人员在他们的关键工作中使用它。随着我们继续朝着 AGI 取得进展,我一直认为,如果以安全和负责任的方式完成,它有可能加速科学发现,并成为有史以来最有益的技术。退一步说,令我惊讶的是,即使在几年前,你今天看到的尖端技术也会显得简直是魔术。看到这些技术为搜索和双子座等产品中的新体验提供动力,并且汇聚在一起帮助人们的日常生活,这令人兴奋。例如,我们最近与 Aira 合作,Aira 是一家帮助盲人和低视力社区的公司,通过视频将他们连接到人类视觉翻译人员来导航世界。使用 Astra 技术,我们构建了一个原型,以帮助更多人获得这种类型的帮助。我们正在从用户那里获得持续的反馈,而 Aira 的翻译人员正在积极监督安全性和可靠性。[掌声] 通过这项工作和我们所有开创性的工作,我们正在构建更个性化、主动和强大的 AI,丰富我们的生活,加速科学进步的步伐,并迎来发现和奇迹的新黄金时代![音乐] 我记得小时候玩到天黑,以确保我仍然可以在看不见的情况下弹吉他。我大概在四岁左右被诊断出患有视网膜色素变性。我的视力正在积极恶化,但音乐一直是我可以继续做的事情,随着我的视觉现实的逼近。当我演奏音乐时,我感到自由。如果 Project Astra 可以帮助我更加独立,那将是你知道的最伟大的事情。例如,巡回演出,我喜欢它,因为我可以走出去,去我从未去过的地方,结识新朋友,但这肯定变得越来越困难。你好。你好。你能告诉我当你四处扫描时,你在这个休息室里看到了什么吗?我看到你面对的方向墙上有一个标志。该标志写着“Wi-Fi 网络。The Grey Eagle,密码是现场音乐。”非常感谢。你能帮我找到一个麦克风支架吗?当然。我可以帮忙。你介意我打开手电筒吗?我看到一堵墙,上面有几根盘绕的电缆,还有看起来像麦克风支架的东西,在视频的右上角。我可以做的最强大的事情就是登上舞台,拿起我的吉他并演奏。这有助于人们理解,不仅仅是盲人或非盲人,残疾和能力。如果 Project Astra 可以一路帮助我,我全力支持。祝你在演出中玩得开心。[音乐] [掌声] 桑达尔·皮查伊:谢谢,Demis。很高兴看到 Project Astra 帮助提高可访问性的可能性。这是 AI 如何推进我们永恒的使命,即组织世界的信息并使其普遍可访问和有用的另一个令人兴奋的例子。没有哪个产品比谷歌搜索更能体现我们的使命。

结束语 🔚

这就是我们几十年前开始投资 AI 的原因,以及我们如何以人类好奇心的规模提供其好处。我们的双子座模型正在帮助谷歌搜索变得更智能、更具代理性和个性化。一个很好的进步例子是我们的 AI 概述。自从去年在 I/O 上推出以来,它们已经扩展到每月超过 15 亿用户,遍布 200 多个国家和地区。当人们使用 AI 概述时,我们看到他们对结果更满意,并且他们搜索的频率更高。在我们最大的市场(如美国和印度)中,AI 概述正在推动显示它们的查询类型增长超过 10%。特别令人兴奋的是,这种增长随着时间的推移而增加。这是过去十年中搜索中最成功的发布之一。[掌声] AI 概述也是谷歌 Lens 中视觉搜索增长的最强劲驱动力之一。Lens 同比增长 65%,今年已经进行了超过 1000 亿次视觉搜索。人们正在提出更多查询。他们也在提出更复杂的查询。借助我们最新的双子座模型,我们的 AI 概述具有你期望从搜索中获得的质量和准确性,并且是行业中最快的。对于那些想要端到端 AI 搜索体验的人,我们正在推出一个全新的 AI 模式。这是对搜索的完全重新构想。借助更高级的推理,你可以向 AI 提出更长、更复杂的查询,例如这样。事实上,用户一直在提出更长的查询。是传统搜索长度的两到三倍,你可以通过后续问题进一步深入。所有这些都可以在搜索中作为新的选项卡使用。我一直在大量使用它,它完全改变了我使用搜索的方式,我很高兴地分享 AI 模式将从今天开始向美国的所有人推出。[掌声] AI 模式是我们首先将我们的前沿功能引入搜索的地方,从本周开始,双子座 2.5,我们最智能的模型系列,将进入搜索。为了分享更多信息,请欢迎 Liz。[音乐] [掌声] Liz Reid:谢谢,桑达尔。在短短一年内,人们使用搜索的方式发生了深刻的变化。多年来,人们来到谷歌提出这样的问题。现在他们也在提出看起来更像这样的问题。他们正在提出更长的问题、更难的问题,正如你刚才从桑达尔那里听到的,提出了更多的问题。他们正在体验 AI 驱动的搜索可以做什么。当我们把我们的双子座模型的高级功能与搜索对网络和世界信息的无与伦比的理解结合在一起时。今天,你将看到你如何提出任何问题。一个更智能、更具代理性和个性化的搜索将处理你最棘手的问题,并帮助你完成任务。这就是谷歌搜索的未来,一个超越信息而走向智能的搜索。你已经开始看到这一点通过 AI 概述变为现实,AI 模式将其提升到新的水平。AI 模式是搜索通过双子座 2.5 作为核心进行转换。这是我们最强大的 AI 搜索,能够处理任何问题。正如桑达尔宣布的那样,我们很高兴地宣布 AI 模式将从今天开始向美国的所有人推出![掌声] 你会发现它作为搜索中的一个新选项卡,或者直接从你的搜索栏中找到它。AI 模式将加载我们所有最好的 AI 功能和能力,但它不仅仅是这些;它是对未来的一瞥。随着时间的推移,我们将把 AI 模式的许多尖端功能和能力直接转移到核心搜索体验中。从今天开始,我们将为 AI 概述提供与 AI 模式相同的模型,因此你可以将你最棘手的问题直接带到搜索框中。今天,我们将带你参观 AI 模式。你将看到它是如何工作的,以及它是如何变得更好的。通过个人上下文、更深入的研究、复杂的分析和可视化、实时多模态和新的购物方式。这很多,因为 AI 模式可以做很多事情,所以让我们深入了解一下。首先,通过 AI 模式,你可以提出你脑海中的任何问题。