基于电商常识图谱的知识表示与应用

2024-06-21 07:38

本文主要是介绍基于电商常识图谱的知识表示与应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述
公众号 系统之神与我同在
1.电商常识图谱的背景:
电商知识图谱要求用一套数据体系联系用户和商品,通过定义拆解用户需求和多粒度的商品理解,来提升搜索与推荐的匹配效率与体验。

一个电商知识图谱中包括许多常识关系:

·isA
·搭配
·不同类型之间的映射关系:风格对应款式、时间需要款式、场景需要品类…
在这里插入图片描述
2.电商常识挖掘的方法:

电商常识挖掘采用的方法是一种阅读理解式的关系抽取。对于一个问题:什么样的连衣裙是减龄的? 通过阅读理解的方式,经由Content:(淘宝攻略)…娃娃领连衣裙穿起来很减龄, 假两件的款型为衣衣增添个性 …,抽取出查询:<风格: 减龄,关系: 风格对应领型,领型: 娃娃领,限制: 品类-连衣裙>。

采用阅读理解的方式进行抽取具有以下几个特点:

·在question中将品类限制和头实体(概念)进行联合encode
·充分利用如今取得极大进展的机器阅读理解技术
·生成的question可以天然地提供给众包和外包进行标注,提高知识审核的效率

电商常识阅读理解数据集包含65k个问题,420k条作为内容的产品描述,95k个不同的答案,举例如下:
在这里插入图片描述
在该数据集上不同的模型表现为:
在这里插入图片描述
3.电商常识的表示方法

电商常识表示的难点在于:

1.常识图谱关系稀疏,比事实类图谱密度低约100倍,常用的知识表示模型对稀疏图谱的表征效果不佳。
在这里插入图片描述
2.电商图谱特有的数据结构,如品类树型结构,品类约束下的n-ary结构(四元组)等,常用的三元组模型不适合直接套用。
在这里插入图片描述
对于常识图谱关系稀疏的问题,通过如下两种方法来解决:

·引入外部语义增强:BERT
·结构特征增强:Graph Embedding

对于电商图谱特有的数据结构:

·针对不同数据结构单独建模,多任务共享embedding联合训练
·树型结构: Poincare Embedding
·n-ary结构:品类映射Decoder
在这里插入图片描述
在进行实验时,为了保证实验的公平性,采取了如下做法:

·增加虚拟节点和虚拟边,将一条四元组拆分成语义等价的七条三元组(1+6)
·保持四元组的必要性:信息冗余
在这里插入图片描述
在三个方面链接实验的预测结果:

·整体性能
·分数据结构的性能
·虚拟边的帮助

实验结果如下:
在这里插入图片描述
4.电商常识的应用方法

拿电商常识在淘宝推荐上的应用来举例:

1.解决query和title之间的语义存在gap的问题:query中经常会出现偏口语、非正式(12% in Taobao)的语言,而title则是相对正式和标准的商家语言。

电商常识则可以进行Query改写:直接利用高准电商常识关系数据,将偏口语非正式的query词改写成商家语言,得以召回相关的商品。例如Query: 漏肚子连衣裙,Rewrite Query: 露脐连衣裙。

2.为模型提供识别搜索相关性的能力:query中口语化的表述和title中偏标准的描述之间的映射可以被电商常识关系关联起来;将知识表示算法学到的表征隐式建模到相关性模型中。
在这里插入图片描述
3.推荐商品召回:通过电商常识关系建模不同表述和维度的side info,使得side info语义相关的商品在向量空间的距离更近。电商常识则可以将能链接到常识图谱中的side info对应的KGE表征建模到图表征学习模型中。
在这里插入图片描述
在这里插入图片描述

这篇关于基于电商常识图谱的知识表示与应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1080600

相关文章

Java架构师知识体认识

源码分析 常用设计模式 Proxy代理模式Factory工厂模式Singleton单例模式Delegate委派模式Strategy策略模式Prototype原型模式Template模板模式 Spring5 beans 接口实例化代理Bean操作 Context Ioc容器设计原理及高级特性Aop设计原理Factorybean与Beanfactory Transaction 声明式事物

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

sqlite3 相关知识

WAL 模式 VS 回滚模式 特性WAL 模式回滚模式(Rollback Journal)定义使用写前日志来记录变更。使用回滚日志来记录事务的所有修改。特点更高的并发性和性能;支持多读者和单写者。支持安全的事务回滚,但并发性较低。性能写入性能更好,尤其是读多写少的场景。写操作会造成较大的性能开销,尤其是在事务开始时。写入流程数据首先写入 WAL 文件,然后才从 WAL 刷新到主数据库。数据在开始

zoj3820(树的直径的应用)

题意:在一颗树上找两个点,使得所有点到选择与其更近的一个点的距离的最大值最小。 思路:如果是选择一个点的话,那么点就是直径的中点。现在考虑两个点的情况,先求树的直径,再把直径最中间的边去掉,再求剩下的两个子树中直径的中点。 代码如下: #include <stdio.h>#include <string.h>#include <algorithm>#include <map>#

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识