NeFut Logo NeFut
EN 管理员登录

[AI造物主] Gemini 3.5 Flash:引入计算机使用功能,提升多平台交互能力

发布于:2026-06-24 22:00 最后更新:2026-06-25 10:57
#AI #Machine Learning #Open Source

在 Gemini 3.5 Flash 中,计算机使用功能现已成为内置工具,使开发者能够构建能够跨平台交互的智能代理。此功能之前仅在独立的 Gemini 2.5 模型中可用,而现在已原生集成于主模型中。Gemini 在函数调用及使用内置工具(如搜索和地图定位)方面表现出色,内置的计算机使用能力使得开发者可以利用 3.5 Flash 构建可靠的自定义代理,这些代理能够在浏览器、移动设备和桌面环境中进行视觉分析、推理和行动。这一功能解锁了在长周期和企业自动化任务中的改进性能,例如持续的软件测试和专业应用中的知识工作。

开发者和企业可以通过 Gemini API 和 Gemini 企业代理平台开始使用 3.5 Flash 中的计算机使用功能。3.5 Flash 利用计算机使用功能分析 Gemini 应用并返回分类特征列表,同时还会审计自身文档以识别无障碍问题。

为了减少在实时环境中操作的代理的提示注入风险,我们在 Gemini 3.5 Flash 中对计算机使用进行了针对性的对抗训练。此外,我们还推出了两个可选的企业安全系统,允许企业:

采取“深度防御”策略,我们鼓励开发者将这些功能与安全沙箱、人机协作验证和严格的访问控制相结合。有关安全措施的更多信息,请参阅我们的最佳实践文档。

我们已经看到客户通过计算机使用功能获得价值,以下是一些客户的反馈:

想要今天就开始构建计算机使用功能吗?

博主点评: Gemini 3.5 Flash 的这一集成计算机使用功能显著提升了多平台智能代理的构建能力,既增强了用户体验,又为企业自动化提供了强大支持。这种功能的安全性措施也表明了对用户数据保护的重视,值得开发者关注与实践。

原文链接: https://deepmind.google/blog/introducing-computer-use-in-gemini-3-5-flash/

下一篇:没有了
[h] 返回首页