谷歌押注下一代AI浪潮：Gemini 3.5 Flash聚焦智能体，而非聊天机器人

编者按：这可能是AI从“回答问题”到“代替你干活”的转折点。谷歌刚刚发布的Gemini 3.5 Flash，不再只是一个聊天机器人，而是一个能独立写代码、管项目、甚至从零搭建操作系统的“智能Agent”。它能在无人干预下连续工作数小时，速度比同类模型快4到12倍，且已经在银行、金融科技领域落地。但Agent能力越强，风险也越大——谷歌正面临一起因AI聊天引发用户自杀未遂的诉讼。当AI学会“动手做事”，人该何时踩刹车？以下是编译全文，保留原文信息与HTML结构。

谷歌在周二发布了Gemini 3.5 Flash，这是一款全新的AI模型，谷歌称其为迄今为止在编程和自主AI代理领域最强的模型。该模型在谷歌年度开发者大会Google I/O上亮相，能够独立执行编程流程、管理研究项目，并且在内部测试中，完全从零开始构建了一个操作系统。

这一发布标志着谷歌从将AI定位为对话工具，向将其打造为代理工具的转变。它不再仅仅是回答问题，而是在极少人类输入的情况下，对实际工作进行规划、构建和迭代优化。

DeepMind首席技术官Koray Kavukcuoglu在发布会前一天对记者表示：“3.5 Flash在质量和低延迟方面实现了令人难以置信的结合。它在几乎所有基准测试上，都超越了我们的最新前沿模型3.1 Pro。”这些测试涵盖编程、代理任务和多模态推理。

他补充道，这款模型比其他前沿模型快4倍，这一速度对编程和代理任务来说是理想的。但谷歌通过开发3.5 Flash的优化版本，将速度提升了12倍，且保持相同质量，“将性能推向了新高度”。

根据Kavukcuoglu的说法，速度是3.5 Flash能用于代理工作的核心，因为在长期运行的任务中，需要多个AI代理同时运行。在I/O大会上，谷歌工程师Varun Mohan展示了代理如何被派去独立处理各个组件，再汇聚到公司的代理开发平台和IDE Antigravity中，构建出一个完整的操作系统。

Kavukcuoglu表示，3.5 Flash是与Antigravity共同开发的，以便代理能拥有一个“可以生存、工作和执行的原生环境”。

在I/O大会上，谷歌发布了Antigravity 2.0，这是一款围绕“代理优先”开发理念设计的独立桌面应用。

这些进展不止停留在演示中。谷歌称，3.5 Flash的代理能力已经在合作伙伴中产生实际影响，比如银行和金融科技公司利用它自动完成需要数周的工作流程，或者数据科学团队在复杂的数据环境中挖掘洞见。

该模型可以自主运行数小时，不过谷歌高级总监兼产品负责人Tulsee Doshi表示，当遇到需要人类判断的决策点或权限问题时，它会暂停并请求用户输入。

当谷歌发布即将推出的3.5 Pro模型时，两款模型将协同工作。

Doshi告诉TechCrunch：“3.5 Pro会成为你的编排者、规划者，然后它实际上可以利用3.5 Flash作为各种子代理。我认为这归根结底取决于：你究竟在哪里需要推理能力，哪里需要那些能够推动推理的大型模型，而面对哪些任务时，仅需要好的暴力工具使用能力即可？”

目前，3.5 Flash是Gemini应用和全球搜索中AI模式的默认模型。在I/O大会上，谷歌还宣布了搜索将引入代理功能，允许用户直接在平台上创建、定制和管理AI代理。新模型还将驱动Gemini Spark，这是谷歌的新款个人AI代理，设计为全天候运行，帮助消费者管理他们的数字生活。

为普通消费者提供这种级别的AI能力必然会受到审视。谷歌目前正面临一起诉讼，起因是一名男子在与Gemini连续数周聊天后，险些制造大规模伤亡事件并自杀。

当强大的自主代理被更广泛地提供给用户时，其潜在危害只会增加。谷歌表示，Gemini 3.5已加强了网络和CBRN（化学、生物、放射性和核）安全防护，且能更好地校准对敏感问题的回应，而非直接拒绝作答。

Gemini 3.5 Flash现已通过Antigravity、Gemini API、Gemini Enterprise，以及Gemini应用和搜索中的AI模式全面开放使用。

本文由吉伊网原创发布，未经许可，不得转载！
本文链接：http://www.jkiyi.com/kx/40246.html