时间:2023-12-24|浏览:248
用戶喜愛的交易所
已有账号登陆后会弹出下载
中国科技巨头阿里巴巴(纳斯达克股票代码:BABA)的子公司阿里云宣布推出一款基于人工智能(AI)的新型文本到视频生成器。新的人工智能模型被称为 I2VGen-xl,在生成高文本到视频方面表现出了出色的能力。 - 根据 GitHub 的可用数据,来自各种来源的优质视频。
除了视觉上引人注目的视频外,该模型的创作被描述为“语义准确”,减少了错误、幻觉或阿谀奉承的可能性。“VGen 可以根据输入文本、图像、所需的动作、所需的主题甚至GitHub 声明中写道。VGen 被描述为开源视频生成代码库,允许用户训练他们的文本到视频模型。
通过使用 Python 执行简单的命令,VGen 用户可以训练自定义模型并在无缝过程中执行推理,以提高效率。该存储库支持具有运动可控性的合成视频合成以及具有人类反馈和缩放 T2V 的指令,同时具有多个针对多个场景的预训练模型声明中写道:“它还提供了各种常用的视频生成工具,例如可视化、采样、训练、推理、使用图像和视频进行联合训练、加速等。”VGen 通过其大规模训练实现了其高级功能根据公告,数据包括 60 亿个文本到图像对和 3500 万个文本到视频对。
该模型深层训练数据池的影响在于其多功能性和在多个用例中提高的准确性。该模型开发团队已经发布了技术论文和官方网页,向研究人员介绍该模型。
用户可以访问预先训练的模型和代码来生成 1280×720 像素视频,使其与现有产品相媲美。该团队表示,未来将推出专门用于生成人体视频的新模型以及用于生成人体视频的更新版本阿里巴巴凭借新兴技术向前迈进阿里巴巴进军人工智能领域,推出了大型语言模型(LLM)——统一前文,以与 Meta(纳斯达克股票代码:META)的 Llama 2 竞争。 Animate Anybody”产品旨在通过其专有的 ReferenceNet 框架从静态照片生成视频。 2023 年初,阿里巴巴与 Web3 公司 Avalanche 合作,尽管阿里巴巴此前对区块链技术持立场,但它还是进入了虚拟世界。
此后,中美之间激烈的半导体冷战减缓了阿里巴巴在人工智能和量子计算领域的进展,因为该公司向内寻找新的解决方案。
阿里巴巴推出了一款新的基于人工智能的视频生成工具,以与先行者竞争。观看:人工智能确实不是生成性的,它是合成的 width="560" height="315" frameborder="0" allowedfullscreen="allowfullscreen">区块链新手?
查看 CoinGeek 的区块链初学者部分,