属性归因和对齐在商品企划中的应用

2024-06-21 07:38

本文主要是介绍属性归因和对齐在商品企划中的应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

公众号 系统之神与我同在

业务背景:

在电商运营中,分析哪些变量会对顾客是否购买产生影响是十分重要的。然而我们对顾客进行商品描述和对工厂进行商品描述时所采用的语言是完全不同的,顾客看到的是关键词“仙女、超仙、气质”等等,而我们对工厂的要求就要具体到衣服的面料,工艺等等。也就是说,生产语言和营销语言之间存在描述的鸿沟!
在这里插入图片描述
PART1:属性归因
相关研究:

对于属性归因的相关研究有下:

·GAM广义加性模型——优点:具有很强的可解释性,缺点:对复杂任务的拟合能力较弱。
·LIME——优点:模型无关,简单模型解释复杂模型,缺点:拟合准确率不高 ,二次误差,时间复杂度高。
·Lstm+attention+adversarial——优点:考虑了混淆变量的影响。
·Lstm+attention+Res——优点:考虑了混淆变量的影响。
形式化因果关系:

问题描述:属性归因要解决的问题则是,如何找到商品中哪些属性影响了买家的决策。

在实际业务场景下,我们将变量分为如下三种:

·类文本变量cpv(类目-属性-属性值)简称T:解释变量。
·混淆变量(简称C),包括:品牌,人气,库存,淘宝卖家交易数据, 店铺人气,店铺·评分,店铺销量、商品好评率,价格等。
·目标变量ipv(item page view)简称Y:被解释变量。

我们使用网站用户的搜索数据进行训练,来预测ipv,目标是降低混淆变量的干扰,预测准确。

衡量准确性的指标为加权准确率(Weighted Mean Absolute Percentage Error):

在这里插入图片描述
为了达到该目标,目前推出了三个版本的模型:

V1:Transformer+Attention+Residualization
在这里插入图片描述
该模型分为两部分:使用cpv预测ipv和使用混淆变量预测ipv,然后将两部分进行加和。其中loss=loss(ipv)+loss(ipv’)

模型的acc和loss如下:
在这里插入图片描述
V1的缺陷:

加性模型会受到变量自身方差的影响,会出现两个描述基本相同的商品,最终ipv相差很大的情况。
在这里插入图片描述
基于V1的缺陷,对目标函数进行如下修正:

ipv由两部分组成:

1.商品被用户看到的概率(曝光率)
2.用户看到商品后,点击商品的概率(点击率)

基于数据观察,提出假设:ipv由曝光率*点击率决定,cpv 中一部分决定了曝光率,混淆变量一部分在曝光后影响点击,cpv 中一部分直接影响流量,混淆变量中一部分直接影响流量。

[公式]

其中,X为混淆变量,Gate表示门控机制,E代表cpv的encoding,f是FNN层。

V2:Transformer+Attention+Residualization+GateNN
在这里插入图片描述
模型V2的acc和loss如下:
在这里插入图片描述
V3: Transformer+Attention+Res+GateNN+mutil_learning

V3中加入了多目标学习,约束模型的学习方向。并且加入另外两个策略:

1.额外信息:query命中cpv的次数,query命中越多的cpv,相对越重要。
2.采用指数衰减的学习率,通过query count在训练初期纠正模型训练的方向。

在这里插入图片描述
V2和V3在不同变量的重要性得分对比如下:
在这里插入图片描述
在这里插入图片描述
V3的acc和loss如下:
在这里插入图片描述
V3模型的结果:
在这里插入图片描述
PART2:属性对齐
相关研究:

目前许多属性对齐是基于神经机器翻译的词对齐来实现的。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
研究的热点:如何在Transformer上改进解释效果?

痛点:缺少平⾏语料和弱监督信号,如何从数据本身挖掘?

属性分类-冷启动数据准备:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
商品属性分类:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

商品属性对⻬—数据集构造:

数据来源于宝贝详情+标题NER,将数据分为两部分:生产属性集source和营销属性集target。
在这里插入图片描述
属性对齐模型有如下三个版本:

属性对齐模型 – V1版:Vanilla bi-LSTM Encoder + Decoder
在这里插入图片描述
问题:
在这里插入图片描述
对问题的分析:

·RNN的编码方式耦合了输入顺序
·本质:CPV不严格是序列关系
·Over/under translation problem
·需要追踪之前的注意力分布做模型约束

改进:

·编码器替换为Transformer
·平均池化作为全局语义向量
·考虑到解释性,折中使用单层
·引入Coverage机制作为多目标loss
·分类标签修正,增加差异性

属性对齐模型 – V2版:Transformer Encoder + Decoder
在这里插入图片描述
属性对齐模型 – V3版:V2 + Coverage constraint
在这里插入图片描述
矩阵分解+后处理:

1.矩阵分解:对营销属性x,取score Top2生产属性y,组成pair对(x, y)作为候选。以叶子类目为单位,聚合所有pair对。
2.排序规则:
在这里插入图片描述
3.对⻬结果导出:

CPV对⻬表1:⽣产 → 营销

CPV对⻬表2:营销 → ⽣产
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
后续改进:1.针对丰富度、差异性不⾜的类⽬优化,2.pipeline形式的误差累积。

PART3:场景应⽤
应用:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
多场景赋能:
在这里插入图片描述

这篇关于属性归因和对齐在商品企划中的应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1080601

相关文章

JavaScript中的isTrusted属性及其应用场景详解

《JavaScript中的isTrusted属性及其应用场景详解》在现代Web开发中,JavaScript是构建交互式应用的核心语言,随着前端技术的不断发展,开发者需要处理越来越多的复杂场景,例如事件... 目录引言一、问题背景二、isTrusted 属性的来源与作用1. isTrusted 的定义2. 为

Python调用另一个py文件并传递参数常见的方法及其应用场景

《Python调用另一个py文件并传递参数常见的方法及其应用场景》:本文主要介绍在Python中调用另一个py文件并传递参数的几种常见方法,包括使用import语句、exec函数、subproce... 目录前言1. 使用import语句1.1 基本用法1.2 导入特定函数1.3 处理文件路径2. 使用ex

Java如何通过反射机制获取数据类对象的属性及方法

《Java如何通过反射机制获取数据类对象的属性及方法》文章介绍了如何使用Java反射机制获取类对象的所有属性及其对应的get、set方法,以及如何通过反射机制实现类对象的实例化,感兴趣的朋友跟随小编一... 目录一、通过反射机制获取类对象的所有属性以及相应的get、set方法1.遍历类对象的所有属性2.获取

将Python应用部署到生产环境的小技巧分享

《将Python应用部署到生产环境的小技巧分享》文章主要讲述了在将Python应用程序部署到生产环境之前,需要进行的准备工作和最佳实践,包括心态调整、代码审查、测试覆盖率提升、配置文件优化、日志记录完... 目录部署前夜:从开发到生产的心理准备与检查清单环境搭建:打造稳固的应用运行平台自动化流水线:让部署像

Linux中Curl参数详解实践应用

《Linux中Curl参数详解实践应用》在现代网络开发和运维工作中,curl命令是一个不可或缺的工具,它是一个利用URL语法在命令行下工作的文件传输工具,支持多种协议,如HTTP、HTTPS、FTP等... 目录引言一、基础请求参数1. -X 或 --request2. -d 或 --data3. -H 或

在Ubuntu上部署SpringBoot应用的操作步骤

《在Ubuntu上部署SpringBoot应用的操作步骤》随着云计算和容器化技术的普及,Linux服务器已成为部署Web应用程序的主流平台之一,Java作为一种跨平台的编程语言,具有广泛的应用场景,本... 目录一、部署准备二、安装 Java 环境1. 安装 JDK2. 验证 Java 安装三、安装 mys

Python中构建终端应用界面利器Blessed模块的使用

《Python中构建终端应用界面利器Blessed模块的使用》Blessed库作为一个轻量级且功能强大的解决方案,开始在开发者中赢得口碑,今天,我们就一起来探索一下它是如何让终端UI开发变得轻松而高... 目录一、安装与配置:简单、快速、无障碍二、基本功能:从彩色文本到动态交互1. 显示基本内容2. 创建链

Node.js 中 http 模块的深度剖析与实战应用小结

《Node.js中http模块的深度剖析与实战应用小结》本文详细介绍了Node.js中的http模块,从创建HTTP服务器、处理请求与响应,到获取请求参数,每个环节都通过代码示例进行解析,旨在帮... 目录Node.js 中 http 模块的深度剖析与实战应用一、引言二、创建 HTTP 服务器:基石搭建(一

java中VO PO DTO POJO BO DO对象的应用场景及使用方式

《java中VOPODTOPOJOBODO对象的应用场景及使用方式》文章介绍了Java开发中常用的几种对象类型及其应用场景,包括VO、PO、DTO、POJO、BO和DO等,并通过示例说明了它... 目录Java中VO PO DTO POJO BO DO对象的应用VO (View Object) - 视图对象

Go信号处理如何优雅地关闭你的应用

《Go信号处理如何优雅地关闭你的应用》Go中的优雅关闭机制使得在应用程序接收到终止信号时,能够进行平滑的资源清理,通过使用context来管理goroutine的生命周期,结合signal... 目录1. 什么是信号处理?2. 如何优雅地关闭 Go 应用?3. 代码实现3.1 基本的信号捕获和优雅关闭3.2