首页 > 知识 > 

阿里巴巴发布AtomoVideo,兼容多款文生图模型的高保真图像视频框架

2025-03-10 00:44:48  来源:舍本求末网

据披露,阿里阿里巴巴研发部门近期推出了一款名为 AtomoVideo 的巴巴高保真 I2V(即 Image to Video)框架,可将静态图像转化成精美的发布视频内容。其主要特点有:

1. 高保真度:生成视频与输入图片在细节和风格上保持一致;

2. 运动连贯:视频流畅无跳跃,兼容架保证时间上的多款连续性;

3. 视频帧预测:通过精确的预测来支持长时延视频序列生成;

4. 兼容性强:适配现有各式各样的 T2I(Text-to-image)模型;

5. 高语义控制力:能够针对客户特殊需求,打造个性化的文生视频内容。

AtomoVideo运用预设的图模 T2I 模型,在每个空间卷积层和注意力层后新增一维时空卷积和注意力模块。型的像视现有的高保 T2I 模型参数固定不变,它们只会训练新增的真图时空层,而输入的频框串联图像信息由 VAE 编码解析,这代表的阿里是低层次信息,有利于提高视频对输入图像的巴巴还原度。此外,发布团队还使用 Cross-Attention 的兼容架方法融入高级图像语义,以加强图像语义可控性。

目前,该项目仅发布了论文和演示视频,尚未开放线上试用途径。另外,阿里巴巴已开启 GitHub 账号,但现在只是作为官方网站的托管地,并不包含相关代码分享。

  文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    休闲

    记者:国足首发11人防守力度是最差的,看看会不会再发生什么吧

    10月10日讯 国足vs澳大利亚即将在今天下午17:10打响,双方首发已经公布,国足方面韦世豪、张玉宁、费南多首发,首次入选国足的21岁蓉城后卫胡荷韬迎来首秀。对于国足首发,记者陈华在社媒评论道:“看

    焦点

    当大模型被塞进PC:如何提升算力利用效率?

    ChatGPT 的爆火掀起了 AI大模型热潮,也进一步拉动了算力需求的爆发,面对呈指数级增长的算力需求,如何用得起、用得上、用得好算力成为大家普遍关心的问题。那么,在大规模 AI 模型训练中,如何保证

    热点

    生活家电品牌需要制定不同地域不同需求的招商计划

    目前,生活家电行业招商形势保持着良好的趋势,生活家电品牌应该时刻关注每个时期的招商行情,找准市场定位,制定不同时期的招商目标与计划,紧握每一个地区的招商空间,制定适宜当地发展需要的招商计划是必不可少的

    娱乐

    马明宇:胡荷韬鲁莽犯规是比赛转折点若领先进入半场可能会拿1分

    10月11日讯世预赛亚洲区第三阶段C组第3轮,国足客场1-3遭澳大利亚逆转。赛后,前国脚马明宇在社媒谈到了这场比赛。马明宇说道:“国足打澳大利亚,我觉得国足整体表现非常不错,这个球胡荷韬犯规送任意球)