Gemini Omni Flash是一个可以将任何输入转化为视频的新模型。作为Gemini系列的一部分,Omni允许用户结合图像、音频、视频和文本生成高质量视频,基于Gemini的现实世界知识。用户可以通过自然语言轻松编辑视频,所有指令都是以之前的内容为基础。
以下是Omni的一些独特功能:
-
通过对话编辑视频:用户可以以自然语言修改视频,字符保持一致,物理规律得以遵循,场景记住之前的内容。
示例:
当人触摸镜子时,使镜子像液体一样波动。 -
改变周围环境:用户可以改变特定事物或整体场景,创造出自己无法拍摄的画面。
示例:
在一个玻璃球内放置黑白棋盘房间,房间内包含递归的手的图像。 -
基于Gemini知识创造真实场景:Omni结合了对物理的直观理解和Gemini的历史、科学及文化背景知识,提升了视觉故事讲述的能力。
示例:
创建一段关于蛋白质折叠的粘土动画解释。 -
创建数字头像:用户可以使用自己的声音和数字化身创建视频,确保生成内容的个性化。
Gemini Omni Flash现已向所有Google AI Plus、Pro和Ultra订阅用户推出,并将在不久的将来向开发者和企业客户提供API支持。所有生成的视频都带有不可见的SynthID数字水印,确保内容的透明性和可验证性。
试用Gemini Omni,开启全新的创作旅程!
博主点评: Gemini Omni的推出标志着视频创作领域的一次重大变革。通过自然语言处理和深度学习技术的结合,用户不仅可以轻松生成视频,还可以实时编辑和调整内容。这种创新将为内容创作者带来前所未有的灵活性,值得期待其后续的功能扩展和应用场景。