属性归因和对齐在商品企划中的应用

2024-06-21 07:38

文章标签 应用属性商品对齐归因企划

本文主要是介绍属性归因和对齐在商品企划中的应用，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

在这里插入图片描述

公众号系统之神与我同在

业务背景：

在电商运营中，分析哪些变量会对顾客是否购买产生影响是十分重要的。然而我们对顾客进行商品描述和对工厂进行商品描述时所采用的语言是完全不同的，顾客看到的是关键词“仙女、超仙、气质”等等，而我们对工厂的要求就要具体到衣服的面料，工艺等等。也就是说，生产语言和营销语言之间存在描述的鸿沟！
在这里插入图片描述
PART1：属性归因
相关研究：

对于属性归因的相关研究有下：

·GAM广义加性模型——优点：具有很强的可解释性，缺点：对复杂任务的拟合能力较弱。
·LIME——优点：模型无关，简单模型解释复杂模型，缺点：拟合准确率不高，二次误差,时间复杂度高。
·Lstm+attention+adversarial——优点：考虑了混淆变量的影响。
·Lstm+attention+Res——优点：考虑了混淆变量的影响。
形式化因果关系：

问题描述：属性归因要解决的问题则是，如何找到商品中哪些属性影响了买家的决策。

在实际业务场景下，我们将变量分为如下三种：

·类文本变量cpv（类目-属性-属性值）简称T：解释变量。
·混淆变量（简称C），包括：品牌，人气，库存，淘宝卖家交易数据，店铺人气，店铺·评分，店铺销量、商品好评率，价格等。
·目标变量ipv（item page view）简称Y：被解释变量。

我们使用网站用户的搜索数据进行训练，来预测ipv，目标是降低混淆变量的干扰，预测准确。

衡量准确性的指标为加权准确率(Weighted Mean Absolute Percentage Error)：

在这里插入图片描述
为了达到该目标，目前推出了三个版本的模型：

V1：Transformer+Attention+Residualization
在这里插入图片描述
该模型分为两部分：使用cpv预测ipv和使用混淆变量预测ipv，然后将两部分进行加和。其中loss=loss(ipv)+loss(ipv’)

模型的acc和loss如下：
在这里插入图片描述
V1的缺陷：

加性模型会受到变量自身方差的影响，会出现两个描述基本相同的商品，最终ipv相差很大的情况。
在这里插入图片描述
基于V1的缺陷，对目标函数进行如下修正：

ipv由两部分组成：

1.商品被用户看到的概率（曝光率）
2.用户看到商品后，点击商品的概率（点击率）

基于数据观察，提出假设：ipv由曝光率*点击率决定，cpv 中一部分决定了曝光率，混淆变量一部分在曝光后影响点击，cpv 中一部分直接影响流量，混淆变量中一部分直接影响流量。

[公式]

其中，X为混淆变量，Gate表示门控机制，E代表cpv的encoding，f是FNN层。

V2：Transformer+Attention+Residualization+GateNN
在这里插入图片描述
模型V2的acc和loss如下：

V3： Transformer+Attention+Res+GateNN+mutil_learning

V3中加入了多目标学习，约束模型的学习方向。并且加入另外两个策略：

1.额外信息：query命中cpv的次数，query命中越多的cpv，相对越重要。
2.采用指数衰减的学习率，通过query count在训练初期纠正模型训练的方向。

在这里插入图片描述
V2和V3在不同变量的重要性得分对比如下：

V3的acc和loss如下：

V3模型的结果：

PART2：属性对齐
相关研究：

目前许多属性对齐是基于神经机器翻译的词对齐来实现的。
在这里插入图片描述

研究的热点：如何在Transformer上改进解释效果?

痛点：缺少平⾏语料和弱监督信号，如何从数据本身挖掘？

属性分类-冷启动数据准备：
在这里插入图片描述

商品属性分类：

商品属性对⻬—数据集构造：

数据来源于宝贝详情+标题NER，将数据分为两部分：生产属性集source和营销属性集target。
在这里插入图片描述
属性对齐模型有如下三个版本：

属性对齐模型 – V1版：Vanilla bi-LSTM Encoder + Decoder
在这里插入图片描述
问题：

对问题的分析：

·RNN的编码方式耦合了输入顺序
·本质：CPV不严格是序列关系
·Over/under translation problem
·需要追踪之前的注意力分布做模型约束

改进：

·编码器替换为Transformer
·平均池化作为全局语义向量
·考虑到解释性，折中使用单层
·引入Coverage机制作为多目标loss
·分类标签修正，增加差异性

属性对齐模型 – V2版：Transformer Encoder + Decoder
在这里插入图片描述
属性对齐模型 – V3版：V2 + Coverage constraint

矩阵分解+后处理：

1.矩阵分解：对营销属性x，取score Top2生产属性y，组成pair对(x, y)作为候选。以叶子类目为单位，聚合所有pair对。
2.排序规则：
在这里插入图片描述
3.对⻬结果导出:

CPV对⻬表1：⽣产 → 营销

CPV对⻬表2：营销 → ⽣产
在这里插入图片描述

后续改进：1.针对丰富度、差异性不⾜的类⽬优化，2.pipeline形式的误差累积。

PART3：场景应⽤
应用：
在这里插入图片描述

多场景赋能：

这篇关于属性归因和对齐在商品企划中的应用的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1080601。 23002807@qq.com

相关文章

线程池ThreadPoolExecutor应用过程

线程池ThreadPoolExecutor应用过程

《线程池ThreadPoolExecutor应用过程》：本文主要介绍如何使用ThreadPoolExecutor创建线程池,包括其构造方法、常用方法、参数校验以及如何选择合适的拒绝策略,文章还讨论... 目录ThreadPoolExecutor构造说明及常用方法为什么强制要求使用ThreadPoolExec

阅读更多...

Java利用Spire.XLS for Java自动化设置Excel的文档属性

Java利用Spire.XLS for Java自动化设置Excel的文档属性

《Java利用Spire.XLSforJava自动化设置Excel的文档属性》一个专业的Excel文件,其文档属性往往能大大提升文件的可管理性和可检索性,下面我们就来看看Java如何使用Spire... 目录Spire.XLS for Java 库介绍与安装Java 设置内置的 Excel 文档属性Java

阅读更多...

mysql_mcp_server部署及应用实践案例

mysql_mcp_server部署及应用实践案例

《mysql_mcp_server部署及应用实践案例》文章介绍了在CentOS7.5环境下部署MySQL_mcp_server的步骤,包括服务安装、配置和启动,还提供了一个基于Dify工作流的应用案例... 目录mysql_mcp_server部署及应用案例1. 服务安装1.1. 下载源码1.2. 创建独立

阅读更多...

HTML5的input标签的`type`属性值详解和代码示例

HTML5的input标签的`type`属性值详解和代码示例

《HTML5的input标签的`type`属性值详解和代码示例》HTML5的`input`标签提供了多种`type`属性值,用于创建不同类型的输入控件,满足用户输入的多样化需求,从文本输入、密码输入、... 目录一、引言二、文本类输入类型2.1 text2.2 password2.3 textarea（严格

阅读更多...

input的accept属性让文件上传安全高效

input的accept属性让文件上传安全高效

《input的accept属性让文件上传安全高效》文章介绍了HTML的input文件上传`accept`属性在文件上传校验中的重要性和优势,通过使用`accept`属性,可以减少前端JavaScrip... 目录前言那个悄悄毁掉你上传体验的“常见写法”改变一切的 html 小特性：accept真正的魔法：让

阅读更多...

C#借助Spire.XLS for .NET实现在Excel中添加文档属性

C#借助Spire.XLS for .NET实现在Excel中添加文档属性

《C#借助Spire.XLSfor.NET实现在Excel中添加文档属性》在日常的数据处理和项目管理中,Excel文档扮演着举足轻重的角色,本文将深入探讨如何在C#中借助强大的第三方库Spire.... 目录为什么需要程序化添加Excel文档属性使用Spire.XLS for .NET库实现文档属性管理Sp

阅读更多...

Nginx内置变量应用场景分析

Nginx内置变量应用场景分析

《Nginx内置变量应用场景分析》Nginx内置变量速查表,涵盖请求URI、客户端信息、服务器信息、文件路径、响应与性能等类别,这篇文章给大家介绍Nginx内置变量应用场景分析,感兴趣的朋友跟随小编一... 目录1. Nginx 内置变量速查表2. 核心变量详解与应用场景3. 实际应用举例4. 注意事项Ng

阅读更多...

Java中的随机数生成案例从范围字符串到动态区间应用

Java中的随机数生成案例从范围字符串到动态区间应用

《Java中的随机数生成案例从范围字符串到动态区间应用》本文介绍了在Java中生成随机数的多种方法,并通过两个案例解析如何根据业务需求生成特定范围的随机数,本文通过两个实际案例详细介绍如何在java中... 目录Java中的随机数生成：从范围字符串到动态区间应用引言目录1. Java中的随机数生成基础基本随

阅读更多...

利用Python操作Word文档页码的实际应用

利用Python操作Word文档页码的实际应用

《利用Python操作Word文档页码的实际应用》在撰写长篇文档时,经常需要将文档分成多个节,每个节都需要单独的页码,下面：本文主要介绍利用Python操作Word文档页码的相关资料,文中通过代码... 目录需求：文档详情：要求：该程序的功能是：总结需求：一次性处理24个文档的页码。文档详情：1、每个

阅读更多...

vue监听属性watch的用法及使用场景详解

vue监听属性watch的用法及使用场景详解

《vue监听属性watch的用法及使用场景详解》watch是vue中常用的监听器,它主要用于侦听数据的变化,在数据发生变化的时候执行一些操作,：本文主要介绍vue监听属性watch的用法及使用场景... 目录1. 监听属性 watch2. 常规用法3. 监听对象和route变化4. 使用场景附Watch 的

阅读更多...