基于电商常识图谱的知识表示与应用

2024-06-21 07:38

本文主要是介绍基于电商常识图谱的知识表示与应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述
公众号 系统之神与我同在
1.电商常识图谱的背景:
电商知识图谱要求用一套数据体系联系用户和商品,通过定义拆解用户需求和多粒度的商品理解,来提升搜索与推荐的匹配效率与体验。

一个电商知识图谱中包括许多常识关系:

·isA
·搭配
·不同类型之间的映射关系:风格对应款式、时间需要款式、场景需要品类…
在这里插入图片描述
2.电商常识挖掘的方法:

电商常识挖掘采用的方法是一种阅读理解式的关系抽取。对于一个问题:什么样的连衣裙是减龄的? 通过阅读理解的方式,经由Content:(淘宝攻略)…娃娃领连衣裙穿起来很减龄, 假两件的款型为衣衣增添个性 …,抽取出查询:<风格: 减龄,关系: 风格对应领型,领型: 娃娃领,限制: 品类-连衣裙>。

采用阅读理解的方式进行抽取具有以下几个特点:

·在question中将品类限制和头实体(概念)进行联合encode
·充分利用如今取得极大进展的机器阅读理解技术
·生成的question可以天然地提供给众包和外包进行标注,提高知识审核的效率

电商常识阅读理解数据集包含65k个问题,420k条作为内容的产品描述,95k个不同的答案,举例如下:
在这里插入图片描述
在该数据集上不同的模型表现为:
在这里插入图片描述
3.电商常识的表示方法

电商常识表示的难点在于:

1.常识图谱关系稀疏,比事实类图谱密度低约100倍,常用的知识表示模型对稀疏图谱的表征效果不佳。
在这里插入图片描述
2.电商图谱特有的数据结构,如品类树型结构,品类约束下的n-ary结构(四元组)等,常用的三元组模型不适合直接套用。
在这里插入图片描述
对于常识图谱关系稀疏的问题,通过如下两种方法来解决:

·引入外部语义增强:BERT
·结构特征增强:Graph Embedding

对于电商图谱特有的数据结构:

·针对不同数据结构单独建模,多任务共享embedding联合训练
·树型结构: Poincare Embedding
·n-ary结构:品类映射Decoder
在这里插入图片描述
在进行实验时,为了保证实验的公平性,采取了如下做法:

·增加虚拟节点和虚拟边,将一条四元组拆分成语义等价的七条三元组(1+6)
·保持四元组的必要性:信息冗余
在这里插入图片描述
在三个方面链接实验的预测结果:

·整体性能
·分数据结构的性能
·虚拟边的帮助

实验结果如下:
在这里插入图片描述
4.电商常识的应用方法

拿电商常识在淘宝推荐上的应用来举例:

1.解决query和title之间的语义存在gap的问题:query中经常会出现偏口语、非正式(12% in Taobao)的语言,而title则是相对正式和标准的商家语言。

电商常识则可以进行Query改写:直接利用高准电商常识关系数据,将偏口语非正式的query词改写成商家语言,得以召回相关的商品。例如Query: 漏肚子连衣裙,Rewrite Query: 露脐连衣裙。

2.为模型提供识别搜索相关性的能力:query中口语化的表述和title中偏标准的描述之间的映射可以被电商常识关系关联起来;将知识表示算法学到的表征隐式建模到相关性模型中。
在这里插入图片描述
3.推荐商品召回:通过电商常识关系建模不同表述和维度的side info,使得side info语义相关的商品在向量空间的距离更近。电商常识则可以将能链接到常识图谱中的side info对应的KGE表征建模到图表征学习模型中。
在这里插入图片描述
在这里插入图片描述

这篇关于基于电商常识图谱的知识表示与应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1080600

相关文章

线程池ThreadPoolExecutor应用过程

《线程池ThreadPoolExecutor应用过程》:本文主要介绍如何使用ThreadPoolExecutor创建线程池,包括其构造方法、常用方法、参数校验以及如何选择合适的拒绝策略,文章还讨论... 目录ThreadPoolExecutor构造说明及常用方法为什么强制要求使用ThreadPoolExec

mysql_mcp_server部署及应用实践案例

《mysql_mcp_server部署及应用实践案例》文章介绍了在CentOS7.5环境下部署MySQL_mcp_server的步骤,包括服务安装、配置和启动,还提供了一个基于Dify工作流的应用案例... 目录mysql_mcp_server部署及应用案例1. 服务安装1.1. 下载源码1.2. 创建独立

Java中ArrayList与顺序表示例详解

《Java中ArrayList与顺序表示例详解》顺序表是在计算机内存中以数组的形式保存的线性表,是指用一组地址连续的存储单元依次存储数据元素的线性结构,:本文主要介绍Java中ArrayList与... 目录前言一、Java集合框架核心接口与分类ArrayList二、顺序表数据结构中的顺序表三、常用代码手动

Nginx内置变量应用场景分析

《Nginx内置变量应用场景分析》Nginx内置变量速查表,涵盖请求URI、客户端信息、服务器信息、文件路径、响应与性能等类别,这篇文章给大家介绍Nginx内置变量应用场景分析,感兴趣的朋友跟随小编一... 目录1. Nginx 内置变量速查表2. 核心变量详解与应用场景3. 实际应用举例4. 注意事项Ng

Java中的随机数生成案例从范围字符串到动态区间应用

《Java中的随机数生成案例从范围字符串到动态区间应用》本文介绍了在Java中生成随机数的多种方法,并通过两个案例解析如何根据业务需求生成特定范围的随机数,本文通过两个实际案例详细介绍如何在java中... 目录Java中的随机数生成:从范围字符串到动态区间应用引言目录1. Java中的随机数生成基础基本随

利用Python操作Word文档页码的实际应用

《利用Python操作Word文档页码的实际应用》在撰写长篇文档时,经常需要将文档分成多个节,每个节都需要单独的页码,下面:本文主要介绍利用Python操作Word文档页码的相关资料,文中通过代码... 目录需求:文档详情:要求:该程序的功能是:总结需求:一次性处理24个文档的页码。文档详情:1、每个

Java中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例解析

《Java中的分布式系统开发基于Zookeeper与Dubbo的应用案例解析》本文将通过实际案例,带你走进基于Zookeeper与Dubbo的分布式系统开发,本文通过实例代码给大家介绍的非常详... 目录Java 中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例一、分布式系统中的挑战二

Java 缓存框架 Caffeine 应用场景解析

《Java缓存框架Caffeine应用场景解析》文章介绍Caffeine作为高性能Java本地缓存框架,基于W-TinyLFU算法,支持异步加载、灵活过期策略、内存安全机制及统计监控,重点解析其... 目录一、Caffeine 简介1. 框架概述1.1 Caffeine的核心优势二、Caffeine 基础2

使用Node.js和PostgreSQL构建数据库应用

《使用Node.js和PostgreSQL构建数据库应用》PostgreSQL是一个功能强大的开源关系型数据库,而Node.js是构建高效网络应用的理想平台,结合这两个技术,我们可以创建出色的数据驱动... 目录初始化项目与安装依赖建立数据库连接执行CRUD操作查询数据插入数据更新数据删除数据完整示例与最佳

PHP应用中处理限流和API节流的最佳实践

《PHP应用中处理限流和API节流的最佳实践》限流和API节流对于确保Web应用程序的可靠性、安全性和可扩展性至关重要,本文将详细介绍PHP应用中处理限流和API节流的最佳实践,下面就来和小编一起学习... 目录限流的重要性在 php 中实施限流的最佳实践使用集中式存储进行状态管理(如 Redis)采用滑动