阿里云探访,新零售电商想要百尺竿头的一次技术尝试

2023-10-21 18:50

本文主要是介绍阿里云探访,新零售电商想要百尺竿头的一次技术尝试,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

移动互联网时代以来,人工智能(AI)技术不断发展和完善,已逐步从实验室走向实用,不断展现出巨大的商业潜力。其中计算机视觉AI技术已成为发展最快应用最广的AI技术,并开始在各行各业落地开花,推动各行业不断升级,逐步走向智能时代。例如,在深度学习技术的推动下,人脸识别已经落地到多个行业场景中,比如刷脸支付,安防监控等。电商行业也是视觉AI技术典型的应用场景,如何提升用户的购物体验,如何为用户快速匹配其最需要的商品,如何帮助商家快速吸引用户的注意,如何帮助平台降低运营成本。视觉AI技术在一个个具体问题中大展身手,不断推动行业升级。本文将会通过解析AlibabaWood视频生产工具的算法来介绍视觉AI技术在新零售电商领域中的应用。

新零售视觉5G时代,视频将逐步成为信息传播和分享的主要媒介,视频内容必将成为展示商品的主要途径。通过调研发现,电商,社交,直播等平台以及普通用户对视频内容进行创作需求强烈。在电商平台,投放商品视频展示可以增加信息传播途径提升引流曝光,使得商品展示更吸睛,提升点击以及购买转化。针对同一商品,是否投放视频展示对各关键指标影响非常大,如下图所示。

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

						  图1 单一商品图像款对比视频款

但是,制作营销视频的门槛并不低,专业视频制作团队成本高,周期长。这对于对于需要快速上线大量新品的头部品牌或者是大量的中小商家来说并不划算。短视频制作的门槛已经成为新零售电商的一个痛点。为了解决这一问题,阿里云利用达摩院的视觉AI技术推出了AlibabaWOOD制作短视频制作工具,任何人都可以通过AlibabaWOOD一键生成电商营销短视频。极大的提升了营销视频制作效率,使得商家可以迅速提升店铺的视频覆盖率。

AlibabaWOOD介绍

AlibabaWOOD是阿里云为了提升电商营销视频制作效率和质量而推出的工具。传统的批量视频制作通常依赖于设计师提前制作的固定模板,因此,大批量生产的视频通常千篇一律,缺乏感染力。为了解决这一问题,AlibabaWOOD充分利用目前最先进的AI技术,抛弃了死板的视频模板,而是通过智能分析用户输入的音视频素材以及用户需求,一键生成符合投放场景的营销短视频,从分析、设计到最后的编码输出用时不超过一分钟,远远超过人类制作视频的速度。并且,得益于AI技术的应用,AlibabaWOOD可以做到视频风格和内容千人千面,无论是时尚风、科技风还是土味视频,AlibabaWOOD都可以从容应对。下图展示了AlibabaWOOD智能生成视频的核心流程,下一章节也会对其中的核心AI技术进行解析。

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

		   图2 AlibabaWOOD智能视频生成流程

AlibabaWOOD核心AI技术解析

素材解析能力

• 素材质量评估/理解

AlibabaWood利用最新的深度学习技术以及线上海量的电商图像视频数据,自研了素材质量评估模型和素材内容理解模型,质量评估模型可以快速准确的滤除不适合制作视频的图像视频素材,保证输出视频的质量。而内容理解模型能够为智能编排模块提供全方位的素材标签,方便为素材精确匹配智能特效,如下图所示:

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

                        图3 素材质量评估

• 故事线生成
作为智能编排核心技术,故事线生成模型充分利用素材标签以及美学和吸引力评分,结合影视行业规范等先验知识,可以针对不同类型的图像视频素材推荐不同的素材排序故事线,如下图所示。使得生成的视频运镜更加合理,并更具吸引力和感染力。

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

                               图5 故事线生成示例

• 视频摘要
通过学习大量在线营销视频摘要模式,AlibabaWood适配不同视频类别的视频剪辑手法,能够对用户输入的视频素材进行镜头分割,并根据投放场景选择最佳视频片段进行剪辑。

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

                               图6 视频摘要示例

智能特效

• 音画联动
视频节奏感可以提升观看视频的舒适性。通过智能分析音频节奏点和视频内容的视觉“节奏点”,然后通过视频插帧技术实现视频播放速率的非线性变换,从而实现音视频节奏点的完美匹配,使得视频中的人物能够随音乐舞动,极大的提升了视频内容的吸引力。

• 静转动
为了增强静态素材主体内容的吸引力,AlibabaWood在自研图像分割能力的基础上推出静转动等智能特效,这一能力可以自动识别模特展示图像,然后对模特主体进行抠图,再对前景和背景内容加入滑动变焦效果,将静态图像转化为动态的视频内容,使得内容展示更加生动,并凸显主体信息。下一代静转动技术可以使得运镜效果更符合透视原理,并让图像中模特的肢体真正动起来。

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

                      图8 图像分割示例

多镜头静转动.mp4

                       图9 静转动示例

• 转场等特效智能推荐
AlibabaWood联合设计师打造了可以根据素材内容自动匹配的转场动画特效体系。使得生成的视频动效更加丰富、更加个性化,真正做到千人千面。

Alibabawood产品效果展示

淘宝商品1.mp4

617685864154 (1).mp4

打造自己的AlibabaWOOD!

阿里云视觉AI开发者创意应用赛向社会各界免费开放所有视觉AI技术接口,邀请全社会的企业打造属于自己的AlibabaWood。开发者可以任意使用达摩院的技术打磨自己的产品,或者将自己的产品在大赛中展出,作为主办方,阿里云将会为优秀的作品对接创业资源和孵化环境,更有总计近百万的奖金和奖品等你来拿。

这篇关于阿里云探访,新零售电商想要百尺竿头的一次技术尝试的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/256276

相关文章

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

金融业开源技术 术语

金融业开源技术  术语 1  范围 本文件界定了金融业开源技术的常用术语。 本文件适用于金融业中涉及开源技术的相关标准及规范性文件制定和信息沟通等活动。

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时

系统架构设计师: 信息安全技术

简简单单 Online zuozuo: 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo :本心、输入输出、结果 简简单单 Online zuozuo : 文章目录 系统架构设计师: 信息安全技术前言信息安全的基本要素:信息安全的范围:安全措施的目标:访问控制技术要素:访问控制包括:等保

前端技术(七)——less 教程

一、less简介 1. less是什么? less是一种动态样式语言,属于css预处理器的范畴,它扩展了CSS语言,增加了变量、Mixin、函数等特性,使CSS 更易维护和扩展LESS 既可以在 客户端 上运行 ,也可以借助Node.js在服务端运行。 less的中文官网:https://lesscss.cn/ 2. less编译工具 koala 官网 http://koala-app.

Spring的设计⽬标——《Spring技术内幕》

读《Spring技术内幕》第二版,计文柯著。 如果我们要简要地描述Spring的设计⽬标,可以这么说,Spring为开发者提供的是⼀个⼀站式的轻量级应⽤开发框架(平台)。 作为平台,Spring抽象了我们在 许多应⽤开发中遇到的共性问题;同时,作为⼀个轻量级的应⽤开发框架,Spring和传统的J2EE开发相⽐,有其⾃⾝的特点。 通过这些⾃⾝的特点,Spring充分体现了它的设计理念:在

java线程深度解析(六)——线程池技术

http://blog.csdn.net/Daybreak1209/article/details/51382604 一种最为简单的线程创建和回收的方法: [html]  view plain copy new Thread(new Runnable(){                @Override               public voi

java线程深度解析(二)——线程互斥技术与线程间通信

http://blog.csdn.net/daybreak1209/article/details/51307679      在java多线程——线程同步问题中,对于多线程下程序启动时出现的线程安全问题的背景和初步解决方案已经有了详细的介绍。本文将再度深入解析对线程代码块和方法的同步控制和多线程间通信的实例。 一、再现多线程下安全问题 先看开启两条线程,分别按序打印字符串的

(function() {})();只执行一次

测试例子: var xx = (function() {     (function() { alert(9) })(); alert(10)     return "yyyy";  })(); 调用: alert(xx); 在调用的时候,你会发现只弹出"yyyy"信息,并不见弹出"10"的信息!这也就是说,这个匿名函数只在立即调用的时候执行一次,这时它已经赋予了给xx变量,也就是只是