《搜索和推荐中的深度匹配》——2.5 延伸阅读

2024-06-02 04:18

本文主要是介绍《搜索和推荐中的深度匹配》——2.5 延伸阅读,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

重磅推荐专栏: 《Transformers自然语言处理系列教程》
手把手带你深入实践Transformers,轻松构建属于自己的NLP智能应用!

Query重构是解决搜索中查询文档不匹配的另一种方法,即将Query转换为另一个可以进行更好匹配的Query。Query转换包括Query的拼写错误更正。例如,【1】提出了一种源渠道模型,【2】 提出了一种用于该任务的判别方法。Query转换还包括Query分段【3】【4】【5】。受统计机器翻译 (SMT) 的启发,研究人员还考虑利用翻译技术来处理Query文档不匹配问题,假设Query使用一种语言而文档使用另一种语言。【6】利用基于单词的翻译模型来执行任务。【7】 提出使用基于短语的翻译模型来捕获查询中单词和文档标题之间的依赖关系。主题模型也可用于解决不匹配问题。一种简单而有效的方法是使用term匹配分数和主题匹配分数的线性组合【8】。概率主题模型也用于平滑文档语言模型(或Query语言模型)【9】【10】。 【11】对搜索中语义匹配的传统机器学习方法进行了全面调查。

在推荐方面,除了引入的经典潜在因子模型外,还开发了其他类型的方法。例如,可以使用预先定义的启发式在原始交互空间上进行匹配,例如基于项目的 CF【12】和统一的基于用户和基于项目的 CF【13】。用户-项目交互可以组织为二部图,在该图上执行随机游走以估计任意两个节点(一个用户和一个项目、两个用户或两个项目)之间的相关性【14】【15】。还可以使用概率图模型【16】对用户-项目交互的生成过程进行建模。为了结合各种辅助信息,例如用户配置文件和上下文,除了引入的 FM 模型外,还利用了张量分解【17】和集体矩阵分解【18】。我们向读者推荐了两篇关于传统推荐匹配方法的调查论文【19】【20】。

引文

【1】Brill, E. and R. C. Moore (2000). “An improved error model for noisy channel spelling correction”. In: Proceedings of the 38th Annual Meeting on Association for Computational Linguistics. ACL ’00. Hong Kong: Association for Computational Linguistics. 286–293.
【2】Wang, Z., G. Xu, H. Li, and M. Zhang (2011). “A fast and accurate method for approximate string search”. In: Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies – Volume 1. HLT ’11. Portland, OR, USA: Association for Computational Linguistics. 52–61. url: http://dl.acm.org/citation.cf m?id=2002472.2002480.
【3】Bendersky, M., W. B. Croft, and D. A. Smith (2011). “Joint annotation of search queries”. In: Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language
Technologies – Volume 1. HLT ’11. Portland, OR, USA: Association for Computational Linguistics. 102–111. url: http://dl.acm.org/ citation.cf m?id=2002472.2002486.
【4】Bergsma, S. and Q. I. Wang (2007). “Learning noun phrase query segmentation”. In: Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computa- tional Natural Language Learning (EMNLP-CoNLL). Prague, Czech Republic: Association for Computational Linguistics. 819–826. url: https://www.aclweb.org/anthology/D07-1086.
【5】Guo, J., G. Xu, H. Li, and X. Cheng (2008). “A unified and discrimina-
tive model for query refinement”. In: Proceedings of the 31st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. SIGIR ’08. Singapore, Singapore: ACM. 379–386.
【6】Berger, A. and J. Lafferty (1999). “Information retrieval as statistical translation”. In: Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. SIGIR ’99. Berkeley, CA, USA: ACM. 222–229.
【7】Gao, J., J.-Y. Nie, G. Wu, and G. Cao (2004). “Dependence language
model for information retrieval”. In: Proceedings of the 27th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. SIGIR ’04. Sheffield, UK: ACM. 170–177.
【8】Hofmann, T. (1999). “Probabilistic latent semantic indexing”. In: Pro- ceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. SIGIR ’99. Berkeley, CA, USA: ACM. 50–57.
【9】Wei, X. and W. B. Croft (2006). “LDA-based document models for ad- hoc retrieval”. In: Proceedings of the 29th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. SIGIR ’06. Seattle, Washington, DC, USA: ACM. 178– 185.
【10】Yi, X. and J. Allan (2009). “A comparative study of utilizing topic mod- els for information retrieval”. In: Proceedings of the 31th European
Conference on IR Research on Advances in Information Retrieval. ECIR ’09. Toulouse, France: Springer-Verlag. 29–41.
【11】Li.H. and J. Xu (2014). “Semantic matching in search”. Foundations and Trends in Information Retrieval. 7(5): 343–469.
【12】Sarwar, B., G. Karypis, J. Konstan, and J. Riedl (2001). “Item-based collaborative filtering recommendation algorithms”. In: Proceedings of the 10th International Conference on World Wide Web. WWW
’01. Hong Kong, Hong Kong: ACM. 285–295.
【13】Wang, J., A. P. de Vries, and M. J. T. Reinders (2006). “Unifying user- based and item-based collaborative filtering approaches by similarity fusion”. In: Proceedings of the 29th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. SIGIR ’06. Seattle, Washington, DC, USA: ACM. 501– 508.
【14】Eksombatchai, C., P. Jindal, J. Z. Liu, Y. Liu, R. Sharma, C. Sugnet, M. Ulrich, and J. Leskovec (2018). “Pixie: A system for recommending 3+ Billion items to 200+ Million users in real-time”. In: Proceedings of the 2018 World Wide Web Conference on World Wide Web,
WWW 2018, Lyon, France. 1775–1784.
【15】He, X., M. Gao, M.-Y. Kan, and D. Wang (2017b). “BiRank: Towards ranking on bipartite graphs”. IEEE Transactions on Knowledge and
Data Engineering. 29(1): 57–71.
【16】Salakhutdinov, R. and A. Mnih (2007). “Probabilistic matrix factor- ization”. In: Proceedings of the 20th International Conference on
Neural Information Processing Systems. NIPS’07. Vancouver, British Columbia, Canada: Curran Associates Inc. 1257–1264. url: http:// dl.acm.org/citation.cf m?id=2981562.2981720.
【17】Karatzoglou, A., X. Amatriain, L. Baltrunas, and N. Oliver (2010). “Multiverse recommendation: N-dimensional tensor factorization for context-aware collaborative filtering”. In: Proceedings of the Fourth
ACM Conference on Recommender Systems. RecSys ’10. Barcelona,
Spain: ACM. 79–86.
【18】He, X., M.-Y. Kan, P. Xie, and X. Chen (2014). “Comment-based multi-view clustering of web 2.0 items”. In: Proceedings of the 23rd International Conference on World Wide Web. WWW ’14. Seoul, Korea: ACM. 771–782.
【19】Adomavicius, G. and A. Tuzhilin (2005). “Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions”. IEEE Transactions on Knowledge and Data Engineering. 17(6): 734–749.
【20】Shi, Y., M. Larson, and A. Hanjalic (2014). “Collaborative filtering
beyond the user-item matrix: A survey of the state of the art and
future challenges”. ACM Computing Surveys. 47(1): 3:1–3:45.

这篇关于《搜索和推荐中的深度匹配》——2.5 延伸阅读的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1023010

相关文章

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。

hdu1240、hdu1253(三维搜索题)

1、从后往前输入,(x,y,z); 2、从下往上输入,(y , z, x); 3、从左往右输入,(z,x,y); hdu1240代码如下: #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#inc

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟&nbsp;开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚&nbsp;第一站:海量资源,应有尽有 走进“智听

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

防近视护眼台灯什么牌子好?五款防近视效果好的护眼台灯推荐

在家里,灯具是属于离不开的家具,每个大大小小的地方都需要的照亮,所以一盏好灯是必不可少的,每个发挥着作用。而护眼台灯就起了一个保护眼睛,预防近视的作用。可以保护我们在学习,阅读的时候提供一个合适的光线环境,保护我们的眼睛。防近视护眼台灯什么牌子好?那我们怎么选择一个优秀的护眼台灯也是很重要,才能起到最大的护眼效果。下面五款防近视效果好的护眼台灯推荐: 一:六个推荐防近视效果好的护眼台灯的

智能交通(二)——Spinger特刊推荐

特刊征稿 01  期刊名称: Autonomous Intelligent Systems  特刊名称: Understanding the Policy Shift  with the Digital Twins in Smart  Transportation and Mobility 截止时间: 开放提交:2024年1月20日 提交截止日

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

hdu 4517 floyd+记忆化搜索

题意: 有n(100)个景点,m(1000)条路,时间限制为t(300),起点s,终点e。 访问每个景点需要时间cost_i,每个景点的访问价值为value_i。 点与点之间行走需要花费的时间为g[ i ] [ j ] 。注意点间可能有多条边。 走到一个点时可以选择访问或者不访问,并且当前点的访问价值应该严格大于前一个访问的点。 现在求,从起点出发,到达终点,在时间限制内,能得到的最大