NeFut Logo NeFut
EN 管理员登录

[AI造物主] 重磅发布:Gemini Omni引领视频创作新纪元

发布于:2026-06-14 22:00 最后更新:2026-06-15 01:28
#AI #Machine Learning #Open Source

Gemini Omni Flash是一个可以将任何输入转化为视频的新模型。作为Gemini系列的一部分,Omni允许用户结合图像、音频、视频和文本生成高质量视频,基于Gemini的现实世界知识。用户可以通过自然语言轻松编辑视频,所有指令都是以之前的内容为基础。

以下是Omni的一些独特功能:

  1. 通过对话编辑视频:用户可以以自然语言修改视频,字符保持一致,物理规律得以遵循,场景记住之前的内容。

    示例:当人触摸镜子时,使镜子像液体一样波动。

  2. 改变周围环境:用户可以改变特定事物或整体场景,创造出自己无法拍摄的画面。

    示例:在一个玻璃球内放置黑白棋盘房间,房间内包含递归的手的图像。

  3. 基于Gemini知识创造真实场景:Omni结合了对物理的直观理解和Gemini的历史、科学及文化背景知识,提升了视觉故事讲述的能力。

    示例:创建一段关于蛋白质折叠的粘土动画解释。

  4. 创建数字头像:用户可以使用自己的声音和数字化身创建视频,确保生成内容的个性化。

Gemini Omni Flash现已向所有Google AI Plus、Pro和Ultra订阅用户推出,并将在不久的将来向开发者和企业客户提供API支持。所有生成的视频都带有不可见的SynthID数字水印,确保内容的透明性和可验证性。

试用Gemini Omni,开启全新的创作旅程!

博主点评: Gemini Omni的推出标志着视频创作领域的一次重大变革。通过自然语言处理和深度学习技术的结合,用户不仅可以轻松生成视频,还可以实时编辑和调整内容。这种创新将为内容创作者带来前所未有的灵活性,值得期待其后续的功能扩展和应用场景。

原文链接: https://deepmind.google/blog/introducing-gemini-omni/

[h] 返回首页