广告区域

米博体育

米博体育

2024年02月24日

首部文生视频动画要来了!AI行情或进一步扩散!

【新闻事件】

据央视频消息,中国首部文生视频AI系列动画片《千秋诗颂》启播暨中央广播电视总台人工智能工作室揭牌仪式将在今日举行。

【行业逻辑】

1、视频生成能力显著突破,向着AGI目标再进一步。东吴证券研报指出,相比行业原有视频生成模型gen2、pika等,Sora在语义理解能力、复杂场景理解能力、一致性以及生成视频时长等方面取得明显突破。1)模型层面,Sora是一种扩散模型,从一个看起来像静态噪音的视频开始生成视频,通过多个步骤去除噪音,逐渐转换视频。Sora可以一次性生成整个视频,也可以扩展生成的视频。与GPT模型类似,Sora也采用了transformer架构模型性能随着模型规模扩大而提高。新技术路径验证有望加速行业发展,算力需求有望增加。2)训练数据层面,Sora将视频和图像表示为更小的数据单元集合patch(类似于GPT中的token),通过统一数据表示方式,可在比以往更广泛的视觉数据上训练模型,包括不同的持续时间、分辨率和宽高比,最终生成的视频在这些维度也具有更高的灵活性OpenAI未将Sora单纯视作视频模型,而是将其作为“世界模拟器”,在物理世界模拟上已开始出现涌现效应,我们认为其亦有望为AI3D等其他多模态领域提供经验借鉴,多模态大模型有望加速发展。

2023年12月09日

输入文字命令可生成视频,文生视频工具Pika将搅动全球视频产业链?

  来源:环球时报

  【环球时报记者 倪浩 环球时报驻美国特约记者 冯亚仁】编者的话:在对话框中输入文字“马斯克穿着太空服,3D动画”,一个3D动画版的“宇航员”马斯克就惟妙惟肖地出现在屏幕上,他身后喷着火焰的SpaceX火箭正腾空而起。这是突然走红的文生视频工具Pika发布的Pika1.0版本的宣传视频中展示的场景。不仅如此,Pika1.0还允许用户修改已有的视频,比如让一只瞪大眼睛的大猩猩戴上墨镜,或者更换正在行走的女孩的衣服。这些都只需要输入文字命令就可以完成。这样的功能让Pika迅速吸引了全球科技圈的关注,有人认为Pika或将影响未来的视频产业链,也有人对这家刚成立半年、团队只有4人的公司提出质疑。那么Pika能否带来一场视频行业的技术变革呢?