谷歌押注下一代AI浪潮:Gemini 3.5 Flash聚焦智能体,而非聊天机器人

编者按: 这可能是AI从“回答问题”到“代替你干活”的转折点。谷歌刚刚发布的Gemini 3.5 Flash,不再只是一个聊天机器人,而是一个能独立写代码、管项目、甚至从零搭建操作系统的“智能Agent”。它能在无人干预下连续工作数小时,速度比同类模型快4到12倍,且已经在银行、金融科技领域落地。但Agent能力越强,风险也越大——谷歌正面临一起因AI聊天引发用户自杀未遂的诉讼。当AI学会“动手做事”,人该何时踩刹车?以下是编译全文,保留原文信息与HTML结构。
谷歌在周二发布了Gemini 3.5 Flash,这是一款全新的AI模型,谷歌称其为迄今为止在编程和自主AI代理领域最强的模型。该模型在谷歌年度开发者大会Google I/O上亮相,能够独立执行编程流程、管理研究项目,并且在内部测试中,完全从零开始构建了一个操作系统。
这一发布标志着谷歌从将AI定位为对话工具,向将其打造为代理工具的转变。它不再仅仅是回答问题,而是在极少人类输入的情况下,对实际工作进行规划、构建和迭代优化。
DeepMind首席技术官Koray Kavukcuoglu在发布会前一天对记者表示:“3.5 Flash在质量和低延迟方面实现了令人难以置信的结合。它在几乎所有基准测试上,都超越了我们的最新前沿模型3.1 Pro。”这些测试涵盖编程、代理任务和多模态推理。
他补充道,这款模型比其他前沿模型快4倍,这一速度对编程和代理任务来说是理想的。但谷歌通过开发3.5 Flash的优化版本,将速度提升了12倍,且保持相同质量,“将性能推向了新高度”。
根据Kavukcuoglu的说法,速度是3.5 Flash能用于代理工作的核心,因为在长期运行的任务中,需要多个AI代理同时运行。在I/O大会上,谷歌工程师Varun Mohan展示了代理如何被派去独立处理各个组件,再汇聚到公司的代理开发平台和IDE Antigravity中,构建出一个完整的操作系统。
Kavukcuoglu表示,3.5 Flash是与Antigravity共同开发的,以便代理能拥有一个“可以生存、工作和执行的原生环境”。
在I/O大会上,谷歌发布了Antigravity 2.0,这是一款围绕“代理优先”开发理念设计的独立桌面应用。
这些进展不止停留在演示中。谷歌称,3.5 Flash的代理能力已经在合作伙伴中产生实际影响,比如银行和金融科技公司利用它自动完成需要数周的工作流程,或者数据科学团队在复杂的数据环境中挖掘洞见。
该模型可以自主运行数小时,不过谷歌高级总监兼产品负责人Tulsee Doshi表示,当遇到需要人类判断的决策点或权限问题时,它会暂停并请求用户输入。
当谷歌发布即将推出的3.5 Pro模型时,两款模型将协同工作。
Doshi告诉TechCrunch:“3.5 Pro会成为你的编排者、规划者,然后它实际上可以利用3.5 Flash作为各种子代理。我认为这归根结底取决于:你究竟在哪里需要推理能力,哪里需要那些能够推动推理的大型模型,而面对哪些任务时,仅需要好的暴力工具使用能力即可?”
目前,3.5 Flash是Gemini应用和全球搜索中AI模式的默认模型。在I/O大会上,谷歌还宣布了搜索将引入代理功能,允许用户直接在平台上创建、定制和管理AI代理。新模型还将驱动Gemini Spark,这是谷歌的新款个人AI代理,设计为全天候运行,帮助消费者管理他们的数字生活。
为普通消费者提供这种级别的AI能力必然会受到审视。谷歌目前正面临一起诉讼,起因是一名男子在与Gemini连续数周聊天后,险些制造大规模伤亡事件并自杀。
当强大的自主代理被更广泛地提供给用户时,其潜在危害只会增加。谷歌表示,Gemini 3.5已加强了网络和CBRN(化学、生物、放射性和核)安全防护,且能更好地校准对敏感问题的回应,而非直接拒绝作答。
Gemini 3.5 Flash现已通过Antigravity、Gemini API、Gemini Enterprise,以及Gemini应用和搜索中的AI模式全面开放使用。
本文由吉伊网原创发布,未经许可,不得转载!
本文链接:http://www.jkiyi.com/kx/40246.html