XGeneration：从文本到新媒体

2024-06-21 07:48

文章标签 xgeneration 文本媒体

本文主要是介绍XGeneration：从文本到新媒体，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

1. 背景
在这里插入图片描述
内容的再生产：能否自动/半自动对商家的商品广告/媒体内容进行再生产？以满足平台运营的需要。

XGeneration是：

自动化程度高，对商家运营要求低
适配多种电商场景的内容再生产解决方案

3. 电商NLG实践
XGeneration-NLG：

l 基本可控短文本生成：RQ1，RQ2

l Word2text model: PKM, PSCN for RQ1

l KG2text model: G2T for RQ2

l Metaphor Generation
基本可控短文本生成：
Item (attributes)-> description：
在这里插入图片描述
Token(word) -> text : 给词造句（属性正确 for RQ1）：

在这里插入图片描述
Graph（KG） -> text ：规划造句（逻辑正确 for RQ2）:

Word2text model: PKM
Definition：给出关键词，生成描述文本。

Baseline：BART Pros. 大规模预训练生成，good in scalability；Cons. Poor in keyword acc。

Proposed model:：PKM BART+keyword masking+keyword loss

Dataset：300w 全行业标定文案
在这里插入图片描述
实验结果：

Word2text model: PSCN
Definition：给出关键词，生成描述文本

Baseline：PKM Cons. 缺乏对混合语义/隐含语义关键词的控制

Proposed model:：PSCN PKM+孪生隐含控制词编码器+attention on 隐含控制隐变量

Dataset：Lexical Linguistic Controlled Product Description dataset，12149个items。
在这里插入图片描述
实验结果：

KG2text model: G2T

利用给定的子图结构，生成对应的描述文案：

在这里插入图片描述

在AGENDA数据集和DuIE数据集上的结果：

修辞生成Metaphor Generation：

Definition：给出本体和喻体，生成比喻句。

Proposed model: MeGTSC 基础BART+cave续写解释

Dataset：3w 标定的比喻句
在这里插入图片描述
实验结果：

MixPoet：当前诗歌生成领域的SOTA模型。

S_1^R：Data2Text领域SOTA模型。

XGeneration-NLG：
on 商品展示介绍：手淘首页海报文案、淘宝直播助理/虚拟主播。
在这里插入图片描述
on 对话机器人：店小蜜售前导购、天猫精灵天气播报/音乐推荐、盒马/优酷/…/智能客服

3.新媒体探索
XGeneration-Video：

l 短视频脚本生成

l 短视频智能剪辑

短视频脚本生成
短视频制作中30%的制作时间是用于脚本创作，10人团队中2人负责脚本创作。自动生成/辅助生成脚本可以极大提效视频内容生产。
在这里插入图片描述

方案：给定商品，利用其主要属性/POI，做层次解码，先解码出分镜，再解码出每个分镜的台词。

核心技术贡献：

属性+知识分离编码+串流解码：提高低频知识的利用率；

解码器内增加句子级别结构控制：保证语句之间逻辑顺畅。

效果：

合理性：80+%，通顺性：80+%，食品行业覆盖率：90+%；

脚本采纳率为64%，商家使用后反馈的主观评分为6~7分（满分10分）；

年货节创意中心短视频制作时间节省60%；

公域视频通过率98.6%；

2021天猫年货节中累计投放4772条视频，累计观看时长超过2275+个小时。
在这里插入图片描述
短视频智能剪辑

关键技术：

痛点/卖点生成 2.多模态检索

效果：相比于（商家制作的）商品主视频，平均VV提升100%，3S播放率提升7%，引导成交笔数、单笔/总金额均达到2倍以上提升。

4. 总结
一个问题：电商内容再生产问题

两个方案：NLG实践（RQ1,RQ2） + 新媒体探索（脚本+短视频）

这篇关于XGeneration：从文本到新媒体的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1080629。 23002807@qq.com

相关文章

[word] word设置上标快捷键 #学习方法#其他#媒体

[word] word设置上标快捷键 #学习方法#其他#媒体

word设置上标快捷键办公中，少不了使用word，这个是大家必备的软件，今天给大家分享word设置上标快捷键，希望在办公中能帮到您！ 1、添加上标在录入一些公式，或者是化学产品时，需要添加上标内容，按下快捷键Ctrl+shift++就能将需要的内容设置为上标符号。 word设置上标快捷键的方法就是以上内容了，需要的小伙伴都可以试一试呢！

阅读更多...

RedHat运维-Linux文本操作基础-AWK进阶

RedHat运维-Linux文本操作基础-AWK进阶

你不用整理，跟着敲一遍，有个印象，然后把它保存到本地，以后要用再去看，如果有了新东西，你自个再添加。这是我参考牛客上的shell编程专项题，只不过换成了问答的方式而已。不用背，就算是我自己亲自敲，我现在好多也记不住。 1. 输出nowcoder.txt文件第5行的内容 2. 输出nowcoder.txt文件第6行的内容 3. 输出nowcoder.txt文件第7行的内容 4. 输出nowcode

阅读更多...

基于CTPN（tensorflow）+CRNN（pytorch）+CTC的不定长文本检测和识别

基于CTPN（tensorflow）+CRNN（pytorch）+CTC的不定长文本检测和识别

转发来源：https://swift.ctolib.com/ooooverflow-chinese-ocr.html chinese-ocr 基于CTPN（tensorflow）+CRNN（pytorch）+CTC的不定长文本检测和识别环境部署 sh setup.sh 使用环境： python 3.6 + tensorflow 1.10 +pytorch 0.4.1 注：CPU环境

阅读更多...

Linux文本三剑客sed

Linux文本三剑客sed

sed和awk grep就是查找文本当中的内容，最强大的功能就是使用扩展正则表达式 sed sed是一种流编辑器，一次处理一行内容。如果只是展示，会放在缓冲区（模式空间），展示结束后，会从模式空间把结果删除一行行处理，处理完当前行，才会处理下一行。直到文件的末尾。 sed的命令格式和操作选项： sed -e '操作符 ' -e '操作符' 文件1 文件2 -e表示可以跟多个操作

阅读更多...

nlp基础-文本预处理及循环神经网络

nlp基础-文本预处理及循环神经网络

1 认识文本预处理 1 文本预处理及其作用定义：文本送给模型之前，提前要做的工作作用：指导模型超参数的选择、提升模型的评估指标举个例子：思路常识，打造成 X Y关于Y：10分类标签是否均衡关于X：数据有没有脏数据数据长度（512）样本不够！文本预处理工作结束的标志：准备出来X和Y 能送给模型 2 文本预处理的主要环节 1 文本处理的基本方法分词：按照一定规

阅读更多...

文本三剑客—sed命令

文本三剑客—sed命令

sed命令一、概念 sed是一种流编辑器，一次处理一行内容。处理方式：一行一行处理，处理完当前行，才会处理下一行，直到文件末尾。如果只是展示，会放在缓冲区（模式空间），展示结束之后，会从模式空间把操作结果删除。二、sed的命令格式和操作选项 1、命令格式 sed -e ‘操作符1;操作符2’ 文件1 文件2 sed -e ‘操作符’ -e ‘操作符’ 文件1 文件2 -e

阅读更多...

NLP中文本的嵌入层

NLP中文本的嵌入层

在自然语言处理（NLP）任务中，模型学习的不是原始的文本字符串，而是这些字符串通过分词和索引化过程转换成的单词索引。实际学习的内容是这些单词索引对应的嵌入向量及其在模型中的权重。原始文本到模型输入的过程原始文本：例如：“hello world” 分词（Tokenization）：将文本字符串分割成单词、子词或字符。例如：["hello", "world"] 构建词汇表（Voc

阅读更多...

解析PDF文件中的图片为文本

解析PDF文件中的图片为文本

解析PDF文件中的图片为文本 1 介绍解析PDF文件中的图片，由两种思路，一种是自己读取PDF文件中的图片，然后用OCR解析，例如：使用PyMuPDF读取pdf文件，再用PaddleOCR或者Tesseract-OCR识别文字。另一种使用第三方框架，直接读取文字，例如：OCRmyPDF。读取pdf的包PyMuPDF可以获取PDF中的文本、布局和图片等，并且内嵌了Tesseract-OCR

阅读更多...

PDF 文本复制自动去换行符，去格式

PDF 文本复制自动去换行符，去格式

一、参考内容 GitHub：PDF 文本复制自动去换行符，去格式

阅读更多...

自媒体素材管理系统设计

自媒体素材管理系统设计

设计自媒体素材管理系统时，我们需要考虑多个方面以确保系统的高效性、易用性和安全性。以下是一个自媒体素材管理系统设计的详细概述：一、系统概述自媒体素材管理系统是一个用于存储、管理和检索自媒体内容（如图片、音频、视频等）的计算机系统。该系统旨在提高自媒体工作者的工作效率，简化素材管理流程，并确保素材的安全性和可用性。二、系统设计要点 1. 系统架构分层架构：系统采用典型的

阅读更多...