智能大屏峰会|故事接龙宋东桓:AIGC在营销与影视领域的实践及应用
| 勾正科技 流媒体网| 2024-04-12
【流媒体网】摘要:特别快的变化、特别大的影响和特别小的圈子。

       点击查看专题:

       第五届中国智能大屏行业发展峰会

  2024年4月11日,由勾正科技、流媒体网联合举办的“第五届中国智能大屏行业发展峰会”在北京隆重举行。

  此次峰会以“智赢今朝 见未曾见”为主题,邀请智能大屏行业的专家、学者,媒体领域先锋和广告行业领军人物,聚焦智能大屏发展趋势、跨屏营销的“助推剂”和AGI实践应用三大话题,共同探寻行业的高质量增长之道。

  会上,故事接龙StoryStorm Al内容社区发起人宋东桓做了题为《AIGC在营销与影视领域的实践及应用》的演讲。

  以下为演讲全文:

  今天想给大家介绍一下我们在AIGC领域内容端的一些实践。AIGC出现之后,出现了特别快的变化、特别大的影响和特别小的圈子。

  变化、影响与圈子

  常见的AIGC能力有五种:文本、画图、视频、声音和3D,还有一些交互能力,比如数字人、AR/VR、交互等。

  AIGC在专业端的应用方面,比如runway,视频转视频的功能已经比较完善、比较成熟了,但是它还有一个问题就是角色单一。

  stability.ai是做开源的,包括抖音里面也有把视频转变成别的风格,其实也是利用了同样的技术。

  还有一些应用起来比较有意思的,比如看起来它也是视频导视频,但是它是利用单镜头视觉动作捕捉技术去把人的一个动作,包括表情捕捉出来。以前我们需要穿戴非常沉重的设备,或者需要在光学动捕的影棚当中,单天租赁的费用很贵。但是现在我们只需要去用一个普通的视频,甚至是以前的视频素材就可以把人的所有动态都捕捉下来,再去匹配一个3D资产放回到原来的视频当中。所以wonder Studio从事的是从角色抓取到资产匹配,再到放回原视频当中做合成,一步一步完成这个事情,它的成本跟原来的成本比,其实已经不只是百倍之差了。

  还有一个非常值得关注的东西,像AI 3D,去年比较火的Nerf、高斯喷射、单镜头视觉动捕、文问生3D、图生3D、AR这些技术,都是在AI领域当中应用比较广泛的,不仅仅局限于大家看到的文生图,图再生视频这么一个流程,流程现在其实已经很多了。

  举个例子来说,以前我们要想去做一个高精度的3D场景,成本是偏高的,现在只要一台相机,甚至是一个手机,就已经可以轻松地的去复制我们现在所在的这个会场了。

  为什么说“特别快的变化”呢?比如左边这个图是用Midjourney V3模型,这个模型大概是2022年7月-11月的时候,当时生图的能力和极限;右边这个图是从去年12月份到现在V6的一个模型,我们能看到它的进步速度是非常快的。

  “特别大的影响”是什么呢?有数据统计说,像小红书和B站这种比较垂类的平台,上面已经有了10%以上的AIGC内容,甚至这个数据还在快速提升,包括AIGC教学、AIGC图片、AIGC短片等。

  Suno V3出来之后,端到端直接生成音乐已经变得非常方便了。我们不知道Suno V3每天音乐生成的数据量,但是天工AI的数据量我们是知道的,每天生成的数据量是200万首AI音乐。如果对比另外一个数据,就是中国音著协所有音乐创作者、版权创作者的音乐版权库只有1500万首音乐作品。如果这么去对比,就能够判断出来,内容产量和最终版权之间的衔接会有很大的变化。

  不知道大家有没有看过一些AI短片,包括央视《中国神话》系列AI短片,称之为AI短剧集。但是我们自己看来一直是有点心虚的,我们一直觉得它实际上是一个创作端的事情,就是我们和创作者之间互相交流用的东西,我们认为它离普通用户去直接消费的制作端还有一定的距离。

  那这个创作端是怎么样的呢?我们常见的架构叫Diffusion+Unet,它是用Diffusion这个模型,用生图能力,里面会有动作驱动,比如我先进行识别,识别之后再去赋予它的驱动,它是一个动态的。

  Sora出来之后,从图片到实拍再到视频接续,在DiT架构下面让我们看到了制作的可能性。虽然说Sora的制作成本我们盲算下来大概是每分钟2500美元,还不是一个完全民用的设计,再加上素材成片比,如果要拍一个3分钟的片子,最终可能要准备20万人民币左右的算力成本。

  上图是我们常见的传统制片流程,比如说我要拍一个3分钟的广告片,可能会有前期、中期、后期的流程,这个流程当中的每一个环节要花几十万、几百万都是很正常的事情。

  但是AI短片的流程基本上就是分四步:写故事、出分镜、图生视频、剪辑配音包装。这里面可以降低的经济成本、时间成本和沟通成本,或者说情绪价值成本都是非常大的。

  我们社区大概有几百个AIGC创作者,我们社区的平均时长是怎么样?个人创作每分钟视频=10小时工作时长,商业项目每分钟视频=50小时工作时长。

  最后,“特别小的圈子”是怎么样的呢?

  比如目前大语言模型在国内发展也没有那么广,也就是数千万应用者;AI画图到现在,其实也就是数千万应用者的量级,没有特别大;AI音乐到了数百万的量级;AI视频是数十万的量级,虽然说有数十万应用者,但是垂直在做片的人数其实也就是几万人。

  关于我们

  故事接龙StoryStorm(www.storystorm.cn)在2023年启动,是一个基于AIGC技术驱动的内容创作平台。用户可以在这里创作小说、漫画、视频、音乐以及游戏。用户社群以教学、工坊、比赛、放映等活动构成内容生产的循环。

  我们以“服务超级个体,共创内容社区"为理念,聚焦AIGC技术在泛文娱流程中的应用。未来我们会进一步拓宽培训范围,在文本、图像、声音、视频、3D、数字人等泛文娱领域尝试工作流创新,探索更多A1技术落地的可能。

  具体来说,教育培训方面,去年8月份开始的「AI短片工坊」活动,收获AI短片千余部。与北影节AIGC短片单元、FIRST电影节「惊喜影展」、蓝星球科幻电影周等节展合作,为创投单元入围导演提供先导片创作支持。

  内容制作方面,与灵境智元、天图万境、取经人、金耀视效、进昂亚洲等友商深度合作,在虚拟制片、数字人、动画制作、互动叙事等方面探索A1制作流程。

  创作大赛方面,我们与方特影业、AITOP100、行知探索、成都八光分文化、温州社科联AIGCxChina等公司和机构联合发起了十余次AI短片、音乐大赛。

  以系列培训工坊活动为例,除了目前的AI短片工坊、漫画工坊,未来还将包括AI音乐工坊、数字人工坊、交互叙事工坊、3D/AR工坊等活动。

  最后我想说,要让用户真正去接受AI内容,其实还需要探索更多方式,不能自嗨。我们需要摆正心态,在混合视觉、互动叙事等方面去做相关的探索和摸索,尤其需要跟传统影视和平台方做数据的反馈,才能形成一个闭环。

责任编辑:房家辉

分享到:
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!