米博体育
专题:春季假期重要国际财经新闻回顾
人工智能在去年给人类带来巨大冲击,不少声音指出在创意等方面人类尚无法被其取代。这一想法再次遭到挑战。当地时间2月15日,人工智能巨头,ChatGPT母公司OpenAI宣布,正在研发“文生视频”模型Sora,可创建长达60秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色,也可以根据静态图像制作动画。根据OpenAI官网,Sora不仅了解用户提出的要求,还了解这些东西在物理世界中的存在方式。
目前,Sora仍在开发中,正在接受安全测试,尚未向公众开放使用。OpenAI CEO奥特曼在社交平台上向公众征集他们想看到的视频,表示公司将制作并发布。
2月16日,北京大学人工智能专业博士@北大AI鱼博士 发微博,从技术角度解读了OpenAI最新发布的Sora:
OpenAI最新发布的Sora视频生成模型技术报告揭示了其背后的强大训练思路和详细的技术特性。Sora模型不仅展现了三维空间的连贯性、模拟数字世界的能力、长期连续性和物体持久性,还能与世界互动,如同真实存在。其训练过程获得了大语言模型的灵感,采用扩散型变换器模型,通过将视频转换为时空区块的方式,实现了在压缩的潜在空间上的训练和视频生成。这种独特的训练方法使得Sora能够创造出质量显著提升的视频内容,无需对素材进行裁切,直接为不同设备以其原生纵横比创造内容。Sora的推出,无疑为视频生成领域带来了革命性的进步,其技术细节值得每一位从业者细致研究。
来源:华尔街见闻 葛佳明
MusicFX的出现可能颠覆音乐产业,降低音乐创作的门槛,但随之而来的是AI生成内容对版权、所有权和如何证实音乐原创性的挑战。
谷歌继续向音乐领域发起挑战,人人都能作曲的时代似乎又近了一步。
12月14日,谷歌推出AI音乐创作工具“MusicFX”,仅需几句话,用户即可生成原创的音乐作品。
谷歌在介绍中指出,这一名为“MusicFX”的创作工具结合了谷歌此前发布的MusicLM模型和DeepMind的水印技术SynthID,以便在事后识别出它们是否由AI制作而成,一定程度上可以解决创作人对于版权问题的担忧。
来源:环球时报
【环球时报记者 倪浩 环球时报驻美国特约记者 冯亚仁】编者的话:在对话框中输入文字“马斯克穿着太空服,3D动画”,一个3D动画版的“宇航员”马斯克就惟妙惟肖地出现在屏幕上,他身后喷着火焰的SpaceX火箭正腾空而起。这是突然走红的文生视频工具Pika发布的Pika1.0版本的宣传视频中展示的场景。不仅如此,Pika1.0还允许用户修改已有的视频,比如让一只瞪大眼睛的大猩猩戴上墨镜,或者更换正在行走的女孩的衣服。这些都只需要输入文字命令就可以完成。这样的功能让Pika迅速吸引了全球科技圈的关注,有人认为Pika或将影响未来的视频产业链,也有人对这家刚成立半年、团队只有4人的公司提出质疑。那么Pika能否带来一场视频行业的技术变革呢?