可灵AI正式全球上线3.0系列模型,目前正面向黑金会员开放使用,预计将于近期全量上线。此次发布的可灵视频3.0、可灵视频3.0 Omni及可灵图片3.0、可灵图片3.0 Omni模型,覆盖图片生成、视频生成、编辑及后期等影视级全流程链路,标志着AI正式进入影视与创意内容的核心生产环节,可灵AI也正式迈入3.0时代。
全新All-in-One产品和技术理念 多模态输入输出一体化助力原生创作
可灵3.0系列模型基于All-in-One产品和技术理念构建,形成一个多模态输入与输出高度统一的一体化视频模型体系。它并非将功能简单叠加,而是通过统一架构,将影像创作中的理解、生成与编辑整合为一个连续流程,让创作首次在单一模型内完成闭环。
在这一体系下,创作者可以同时使用文字、图片、声音与视频作为输入,并直接获得可用的专业影像级输出结果,创作过程不再被拆分为多个工具与步骤。
围绕创作者最关心的稳定性与表达力,可灵3.0系列模型在多个关键环节上做了系统级增强。长期困扰行业的一致性问题获得突破性进展:通过整合视频主体上传、音色绑定及全球首创的“图生视频+主体参考”等一系列技术能力,能够使得人物形象、动作与声音在复杂镜头切换中保持稳定,文字清晰、品牌标识可识别,即便在多语言场景下,视觉风格与角色特征也能高度统一。
在叙事层面,模型支持最长15秒的连续生成,并引入智能分镜与自定义镜头控制,让创作者能够直接组织镜头节奏与叙事结构,不再依赖碎片化拼接,从而让镜头具备情绪递进与画面张力。

可灵视频3.0 智能分镜
音画能力也被进一步拉齐到影视创作标准。视频3.0与视频3.0 Omni均支持原生音画同出,覆盖多语种与多种地方口音,人物口型、情绪与表演更加自然,整体画面真实感显著提升,人物演绎更具表演张力。图片模块则支持4K超清输出,分镜图与系列组图的引入,使静态画面本身也具备完整的叙事能力。
从单点生成到系统化调度,可灵3.0系列模型不只是一次模型升级,而是创作方式的变化。它将原本需要多人协作、多轮修正才能完成的导演级表达,压缩进更直接、更可控的创作流程中,让更多创作者能够以接近专业制作的方式完成影像表达。
行业资讯、企业动态、峰会活动可发送邮件至news#citmt.cn(把#换成@)。
海报生成中...