腾讯混元视频生成能力对外开放
http://www.5ipr.cn   2024-12-05 09:17:53   快科技   

快科技12月5日消息,腾讯混元大模型宣布文生视频功能上线,一句话就能生成视频。此次开源的视频生成大模型,参数量130亿,是当前最大的视频开源模型。
  快科技12月5日消息,近日,腾讯混元大模型宣布文生视频功能上线,一句话就能生成视频。

  此次开源的视频生成大模型,参数量130亿,是当前最大的视频开源模型。

  用户只需要输入一段描述,即可生成视频,目前的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。

  目前该模型已上线腾讯元宝APP,用户可在AI应用中的“AI视频”板块申请试用。

  企业客户通过腾讯云提供服务接入,目前API同步开放内测申请。

  通过腾讯元宝APP-AI应用-AI视频即可使用该功能(前期需申请)

  在与国内外多个顶尖模型的评测对比显示,混元视频生成模型在文本视频一致性、运动质量和画面质量多个维度效果领先,在人物、人造场所等场景下表现尤为出色。

  腾讯混元生成视频大模型可以实现超写实画质、生成高度符合提示词的视频画面,画面流畅不易变形。

  比如,在冲浪、跳舞等大幅度运动画面的生成中,腾讯混元可以生成非常流畅、合理的运动镜头,物体不易出现变形;光影反射基本符合物理规律,在镜面或者照镜子场景中,可以做到镜面内外动作一致。

  同时,模型还可以实现在画面主角保持不变的情况下自动切镜头,这是业界大部分模型所不具备的能力。

TAG:

分享到:
收藏