阿里巴巴达摩院发布开源文本转视频AI-中国震撼圆桌-厉害了我的国-爱国者网

阿里巴巴达摩院发布开源文本转视频AI

图片[1]-阿里巴巴达摩院发布开源文本转视频AI-中国震撼圆桌-厉害了我的国-爱国者网

该模型基于多阶段文本到视频生成扩散模型,输入描述文本,返回符合文本描述的视频,支持英文输入。

整体模型参数约17亿,模型需要硬件配置大约是 16GB 内存和 16GB GPU显存。可在 Hugging Face (http://huggingface.co/spaces/damo-vilab/modelscope-text-to-video-synthesis) 或 Model Scope (http://modelscope.cn/studios/damo/text-to-video-synthesis/summary/) 试用。

项目地址

请登录后发表评论

    没有回复内容