视频营销大时代,人才缺百万,AI编导已就位
采写/吴刚、万天南
编辑/陈纪英
用“机器”代替编导等短视频专业人才,靠谱吗?
随着直播短视频的红利呼啸而至,网红达人、MCN机构、品牌商家蜂拥而来。短视频市场需求暴涨,专业人才稀缺昂贵、生产工具滞后、优质内容供给不足、营销转化效果低下等痛点越发凸显。
如何低成本批量产生短视频内容,成为了越来越多中小品牌商面临的共同挑战。
日前,阿里设计团队上线了一款短视频生产工具“云剪”,专门为电商场景定制短视频解决方案——利用基础的图文视频等素材,可以简化批量生产短视频素材,试图帮助中小商家低成本搭上短视频营销的高列。
短视频营销风起,百万人才缺口待补位
品牌、平台,永远逐流量和用户而居——短视频,作为用户聚集的“闹市区”,是品牌、商家不舍错过的必争之地。
中国互联网信息中心的报告显示,截至2021年6月底,中国短视频用户规模达到8.88亿,占网民整体的87.8%;其中,90后的短视频用户占比达到了51.5%,短视频,也成为了品牌连接、触达、转化年轻客群的桥梁。
用户接踵而至,流量澎湃而来,短视频营销,成为了商家、品牌争相涌入的营销主场。
Quest mobile报告显示,2021年上半年,互联网广告收入中,短视频以503亿元的营收体量,力压新闻资讯的255亿元、网络社交的184亿元登顶,在整个互联网广告大盘中占比高达42.6%,贡献了近半壁江山。
有视频营销第一股之称的剧星传媒,2018年短视频业务的营收仅为4.1亿,到了2019年,该数值刷新为29亿,同比增长7倍有余。
行业爆发,专业人才和优质内容供给短缺却越发凸显。
2020年,巨量大学负责人于洁楠曾测算,国内的短视频营销人才缺口可能达到百万量级。
剧星传媒CEO俞湘华颇有同感,“一方面发展太快,所以缺人才;另一方面教育滞后导致专业人才稀缺”。
他清晰记得,公司刚刚涉足短视频业务时,很多员工缺乏对广告营销和市场传播的专业化、系统化认知,要靠公司从0到1培养。待到新手培养成熟,可以独当一面后,却轻易被同行高薪挖走。
专业的短视频制作机构尚且缺人,商家、品牌对于短视频制作人才的饥渴更上层楼。
淘宝店主王方(化名)就是其一。他主要售卖USB外接录音设备,曾一度考虑搭建短视频内容团队拉动销量,但试错了一圈发现,难以找到合适的视频人才,“比如说,流量思维很重要,电商短视频不是会拍就可以的,关键是要有人看,要能符合算法衡量标准,要能拉动销售,同时懂得这几点的人太少了”。
另一重压力来自不堪重负的人力成本。
一个初创的小型电商品牌,要想搭建短视频团队,最为简单的人员配置通常也要4-5人,编导1人,内容策划1人,拍摄1人,剪辑1人,运营1人。而据猎聘发布的《短视频领域就业大数据报告》显示,短视频中高端人才平均年薪30万,已经超过金融互联网房地产等传统高薪行业。于大量长尾商家品牌来说,上述成本不堪重负。
人才流失风险也如影随形。知名博主李子柒曾因独特的中国风视频风靡海内外,今年却和MCN机构微念产生股权纠纷,一度断更数月,微念因此遭遇重创。
短视频内容人才找不到、用不起、留不住,在分秒必争的商业洪流里,大多数商家们只能眼睁睁看着短视频营销的列车疾驰而过。
AI编导真的能给出更优解吗?
一大批短视频制作工具,已经陆续上线,大致可以分为三类。
视频长剪短工具,比如从1~2小时的长视频里,剪辑出数十个精彩的高光片段,但一方面,长剪短方案要依赖于优质的长视频或者直播素材,其次,这一方案难以过滤掉长视频中没有价值的小片段,比如打招呼和闲聊废话等,后期仍需人工优化才能用于投放。
其次,模板填充制作短视频,包含了基础的音乐卡点,画面特效和精美转场,但这种解决方案得到的视频样式比较僵化,难以达成多样化和丰富性。
以及更早上线的幻灯片拼接方案,利用大量图文拼凑出短视频,但制作效果通常比较粗劣,效果难如人意。
如何解决上述痛点?
云剪技术团队发现,在视频生产流程里,存在大量重复劳动的环节,以最耗人力的剪辑环节为例,剪辑师拿到拍摄好的素材,匹配写好的脚本,之后再把素材里的废话、错字、停顿、语速等一一调整修正,美颜美化、调色调光等,最后才能剪成一个能用的短视频。
“很多环节,是可以通过机器学习完成的”,项目负责人黄玉龙告诉《财经故事荟》。
2021年4月,经过观察与试错,项目组上线了支撑专业机构的云剪专业版,7月又推出了契合商家端应用的云剪电商版。
云剪电商版的使用门槛很低,商家只需输入素材——包括店铺头图视频、商品详情页等,整个过程完全自动,无需人工介入,云剪就能进行智能剪辑,快速生成短视频,大幅提升了短视频的生产效率。相比于传统视频创作工具如Finalcut、Premiere等,云剪的使用门槛更低。
纵观市场,B站的必剪、快手的快影、抖音的剪映这几年也相继问世。不过,这些工具主要适用于娱乐场景。
但云剪则以拉动转化为第一目标,通盘考虑“人、货、场”三要素,注重商品卖点和用户需求的匹配,在视频中抛出场景痛点,强化商品卖点,最终辅助用户消费决策,助攻商家提高营收转化。
比如,商家上传了连衣裙的素材,云剪会主动通过设问生成:“夏天穿连衣裙想遮肉?试试这款泡泡袖连衣裙吧“等文案。
再比如针对“日式米饭调料”,可以生成“天气热吃不下饭? 拌饭料让你胃口大开!口感香醇好滋味!赶快加入购物车吧!”这样的视频。
云剪短视频工具还可以针对不同商品的不同卖点,匹配不同营销场景,实现话术文案、镜头语言、内容节奏、视频风格的多样化,以及为商家生成可供选择的多元化微脚本。
在传统短视频制作流程里,视频转化效果好坏主要取决于编导个人能力。但风险在于,如果编导不具备流量思维,或者不了解商品属性和市场需求等,就会导致短视频转化效果差,商家营销费用打水漂。
云剪则基于多年积累的商品卖点分析、当下社会热点追踪等,生成相应的微脚本,以供编导、拍摄团队优中选优。
功能正在持续完善的云剪,逐渐成为品牌和商家降本增效的加速器。
如今,云剪电商版内测一月有余,已为5万多个商家提供服务,每天生产上万条商品短视频,其中在淘宝微详情场实现平均引导成交金额提升一倍有余。
对商家来说,高昂的短视频人力成本,也有望大幅缩减。以一个批量生产短视频的项目团队为例,原本需要配置5个剪辑师、1个编导、1个摄影师,但在应用云剪后,只需留下1位剪辑师,就能完成同等工作量,每月至少可以降低三四万的人力成本。
技术大闯关
第一道关卡,是如何准确提取商品卖点,精准匹配消费场景,自动生成合适脚本,同时杜绝脚本平铺直叙,吸引力弱、风格不可控等痛点。
在短视频里,实现“人、货、场”的精准匹配并非易事。假设有500万商品,每个商品有20个属性,每个属性生成10个脚本,那就是500万×20×10,也就是说,可以组合出几十亿个脚本。这里第一个挑战就是如何生成这几十亿个剧本。第二个挑战,是怎么保证几十亿脚本中没有错误,毕竟数据量级越大,一点点错误都会不断被放大。
为此,云剪项目团队构建了电商认知图谱,建模消费者诉求与商品多个属性之间的关系,使用了数千万语料进行预训练,在微调部分对生成脚本内容和形式进行针对性控制和持续优化,可生成更为通顺流畅,语义可控,吸引力强的短视频脚本。据悉,目前脚本的正确率可达到90%以上。
第二重关卡,则是多状态的视频理解,即从商家提供的商品主视频和直播视频出发,准确理解其每个视频片段中的行为语义,并关联到状态标签,而物品的多状态以及画面的多相似性,极大增加了文本与视觉主体的对齐难度。
比如,一件外套在镜头里是侧面正面还是反面,是拿在手上还是在试穿,素材视频里有无乱入图像等,系统都需要对标人的基本认知习惯,挑选出最能展现商品亮点的素材。
基于上述问题,技术团队提出了一种电商视频多模态预训练方案,在表示阶段对商品类别与商品状态进行显示建模,同时在预训练阶段针对性设计了不同目标的跟踪任务,能够有效地解决电商场景下,视觉主体与文案脚本难以对齐的问题,从而提高短视频输出的准确率和质量稳定性。
第三重关卡,抽象的语义概念与具象的镜头语言,也需要精准匹配,文本和图像之间的关系挖掘和语义对齐必不可少。
为此,技术团队创新提出了自适应的图推理及过滤图文检索算法,该跨模态图文检索算法,针对短视频脚本特有的抽象描述意象的特点,通过自适应的图结构进行图像区域之间关系的推理和聚合,利用细粒度的跨模态过滤机制文本对齐无关的信息,有效提高了模型对于抽象脚本的文本的检索能力,检索结果的首序正确率高达89.94%。
而此项技术是作为视频业务在多模态领域的首次创新,并发布相关论文《Adapted GraphReasoning and Filtration for Description-Image Retrieval》,收录于SIGIR2021(注:SIGIR2021是人工智能领域智能信息检索方向最权威的国际会议)。
举例来讲,图像上是“蓝天下一片农田和一辆拖拉机”,应用上述技术后,可以生成“农业发展蒸蒸日上”的脚本,后者是对画面的抽象概括和意义阐释,而非直白机械地一一列举画面中的物体。
“当然,目前的云剪做不出100分的完美视频,也无法完全取代专业人才,但我们能帮商家做出一个70分的短视频,而且耗时仅要几分钟,成本低。”
在黄玉龙的设想里,云剪未来的应用场景并不限于淘宝,希望未来在更多涉及短视频营销的领域也有机会一试身手。
毕竟,短视频营销才刚至中局,极光大数据显示,截至2020年12月,视频制作行业渗透率仅19.6%,同比增速保持在138.1%左右,视频生产工具的用户规模还将继续在高速路上一路飞驰。
或许就如同傻瓜相机以及手机照相功能,替代专业单反,普及向大众市场一样,优质短视频内容制作,未来将不再是极少数专业人才的专属,有了优质工具的助力,也许,短视频制作会成为人人可为的标配能力。