龙年第一件王炸级大事!
美国时间 2 月 15 日,美国人工智能研究公司 openai 正式推出首个文生视频模型“Sora”。Sora允许用户创建长达一分钟的真实视频,所有这些视频内容都基于他们编写的提示词。
换句话说,只要编写好的文案,Sora就可以自动生成一个最长可达60秒的真实视频。这无疑颠覆了现阶段时长不超过4s的普遍“时长”。
在OpenAI官网发布的信息中,OpenAI并不止于将Sora定位为一个文生视频的大模型,OpenAI将Sora定位为模拟世界的视频生成模型。通过训练Sora,OpenAI正在教授人工智能理解和模拟运行中的物理世界,目标是训练模型帮助人类解决需要现实世界交互的问题。
根据OpenAI的介绍性博客文章,Sora能够创建具有多个角色、特定运动类型以及主题和背景的准确细节的复杂场景。该模型可以理解物体在物理世界中如何存在,以及准确地解释道具并生成引人注目的角色来表达充满活力的情感。目前官网上已经更新了48个视频 demo,比如,画家可以在画布上留下新的笔画,并且这些笔画随着时间的推移会持续存在。再比如,视频中人可以吃汉堡并在汉堡上留下咬痕。
值得注意的是,Sora视频构图、色彩等方面都十分出色,无论是一镜到底还是多机位都可以无缝切换,甚至还有“演员”的表情神态,这是此前的文生视频产品所不具备的。该模型甚至还可以根据提示、静止图像填补现有视频中的缺失帧来生成视频。这一分钟视频在网上广为流传,可以视为Sora的代表作,其展示的信息量极大,从主要人物到背景人物,从远处的街景以及地面,看起来十分逼真,镜头切换也非常流畅自然。从这张全景画面截图,可以看到和主人公同时走动的路人,湿漉漉的地面,眼花缭乱的霓虹灯和招牌。Sora推出不久,360创始人周鸿祎对Sora给予了极高的评价,他在社交平台发文:Sora的诞生意味着AGI(通用人工智能)实现可能从10年缩短至一两年。在过去一年的科技圈里,AI大模型可谓风头一时,回顾2023年ChatGPT横空出世,AIGC、人工智能、元宇宙、数字人等话题迅速成为热点话题。随着以AI技术引发的数字化浪潮,使用优质低成本的数字人虚拟人传播品牌IP,成为2023年社交平台最火热的现象之一。Sora面世之前,诸如Pika、Runway等所有的 AI 视频生成公司都在进行着此消彼长的同质化竞争:过多关注更高画质、更高成功率、更低成本,而非更大时长以及世界模型。在时长不超过 4s 的范围内,虽然可以做到画质极度精美,但物体本身的运动幅度极低,且会变形。更别提达到长达60s 的视频生成了,Sora 的出现本身就是一项颠覆行业的创举,甚至可以用碾压来形容。资本端同时传来新消息。在完成最新交易后,OpenAI的估值已飙升至800亿美元以上。CB Insights的数据显示,OpenAI目前是世界上最有价值的科技初创企业之一,仅次于字节跳动和SpaceX。在全球视野纷纷投向Sora之际,OpenAI 表示,它仍处于 red-teaming 阶段,现在还未对公众开放使用。我们可以预见到,当 Sora 投入使用时,将会大大帮助跨境电商品牌商家有效缩减制作电商广告和商品描述视频的成本和工作量,特别是TikTok卖家,令人头疼的内容生产难题也将不再成为难题,而是能打开新的流量窗口,给卖家带来拓展全球生意的无限可能。