力压Seedance!阿里HappyHorse两周后上线:4月30日开放API

五花石 网络资讯 1

4月15日消息,阿里ATH旗下创新事业部研发的视频生成模型HappyHorse-1.0,近日已悄然在Arena.ai平台上线开放测试,目前正处于正式发布前的最后优化阶段。

官方表示,早期评测结果显示该模型在视频编辑任务中表现突出,目前已进入发布前的最后优化阶段,预计将在两周后正式推出版本更新。

经阿里内部消息确认,该模型将于4月30日开放API。目前已向社区开放早期体验入口,邀请用户参与测试与反馈。

上周,该模型突然以匿名身份空降全球权威AI平台Artificial Analysis Video Arena的盲测榜单,在文生视频和图生视频(无音频)两个赛道同时压过字节跳动Seedance 2.0和快手可灵3.0,强势登顶。

该模型采用150亿参数的40层单流自注意力Transformer架构,实现了原生音视频同步生成。

简单来说,其他视频模型需要先生成无声视频,再配乐对口型,几道工序下来,不仅费时费力,还容易出错。

而快乐马把视频和音频的生成彻底合并进了一个流程,画面和声音是一起出来,一次前向推理直接输出带声音的成片,不需要任何后期拼接。

此外,该模型还原生支持英语、普通话、粤语、日语、韩语、德语和法语七种语言的唇形同步。