比较购物搜索之相似关键词的设计与实现——货比百家(huobibaiija.com)

本文主要是介绍比较购物搜索之相似关键词的设计与实现——货比百家(huobibaiija.com),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这段时间一直忙着货比百家比较购物搜索(huobibaijia.com)的SEO工作,经过网站结构调整、关键词布局和外链建设,百度对网站已经稳定收录,站长工具查询:"百度 在最近1天内 共收录了网站( www.huobibaijia.com 1010 个页面",总收录数量:7万2400。(2011-09-20)

在实现购物搜索应用的时候,时常会遇到,类似淘宝搜索结果页面"你是不是想找:",etao搜索结果页搜索框下"热门搜索"之类的需求,也即根据当前的搜索关键词,查询相类似的关键词。

从seo和网站已有结构考虑,热门关键词用独立的页面展示,URL设计如:http://www.huobibaijia.com/hot-5176/

和http://www.huobibaijia.com/nvxie-50006843/hot-5176/。相似关键词实现效果如:


说下实现细节,首先需要一个关键词库,这个可以统计用户搜索关键词,也可以搜集商城的热门关键词。写了简单的程序,统计了淘宝、淘宝商城的热门关键词10多万个作为关键词库。

 

相似查询,不得不提TF-IDF了。TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。 TFIDF实际上是:TF * IDF,TF词频(Term Frequency),IDF反文档频率(Inverse Document Frequency)。

 

Lucene也提供了个相似比较的接口,MoreLikeThis接口。废话不说了,直接上代码。

 

热门关键词推荐代码:

	public List<Hotkey> searchMoreLikeThis(String wd, int top)throws IOException, Exception {MoreLikeThisQuery query = new MoreLikeThisQuery(wd,new String[] { "wd" }, analyzerUtil.ikAnalyzer);TopDocs topDocs = getSearcher().search(query, top);int totalHits = topDocs.totalHits;ScoreDoc scoreDocs[] = topDocs.scoreDocs;top = top < totalHits ? top : totalHits;List<Hotkey> list = new ArrayList<Hotkey>();for (int i = 0; i < top; i++) {Document doc = getSearcher().doc(scoreDocs[i].doc);Hotkey hotkey = doc2Object(doc);int freq = taobaoItemSearcher.docFreq(hotkey.getWd());//...此处暂时隐蔽^_^list.add(doc2Object(doc));}return list;}
 

 

有兴趣的朋友看看网站,提提建议。技术、网站运营、SEO等有兴趣的朋友,多多交流。

网址: http://www.huobibaijia.com/

也可以加QQ:909546261,疑义相与析。

 


这篇关于比较购物搜索之相似关键词的设计与实现——货比百家(huobibaiija.com)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/340069

相关文章

C++对象布局及多态实现探索之内存布局(整理的很多链接)

本文通过观察对象的内存布局,跟踪函数调用的汇编代码。分析了C++对象内存的布局情况,虚函数的执行方式,以及虚继承,等等 文章链接:http://dev.yesky.com/254/2191254.shtml      论C/C++函数间动态内存的传递 (2005-07-30)   当你涉及到C/C++的核心编程的时候,你会无止境地与内存管理打交道。 文章链接:http://dev.yesky

在线装修管理系统的设计

管理员账户功能包括:系统首页,个人中心,管理员管理,装修队管理,用户管理,装修管理,基础数据管理,论坛管理 前台账户功能包括:系统首页,个人中心,公告信息,论坛,装修,装修队 开发系统:Windows 架构模式:B/S JDK版本:Java JDK1.8 开发工具:IDEA(推荐) 数据库版本: mysql5.7 数据库可视化工具: navicat 服务器:SpringBoot自带 ap

通过SSH隧道实现通过远程服务器上外网

搭建隧道 autossh -M 0 -f -D 1080 -C -N user1@remotehost##验证隧道是否生效,查看1080端口是否启动netstat -tuln | grep 1080## 测试ssh 隧道是否生效curl -x socks5h://127.0.0.1:1080 -I http://www.github.com 将autossh 设置为服务,隧道开机启动

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测 目录 时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测基本介绍程序设计参考资料 基本介绍 MATLAB实现LSTM时间序列未来多步预测-递归预测。LSTM是一种含有LSTM区块(blocks)或其他的一种类神经网络,文献或其他资料中LSTM区块可能被描述成智能网络单元,因为

vue项目集成CanvasEditor实现Word在线编辑器

CanvasEditor实现Word在线编辑器 官网文档:https://hufe.club/canvas-editor-docs/guide/schema.html 源码地址:https://github.com/Hufe921/canvas-editor 前提声明: 由于CanvasEditor目前不支持vue、react 等框架开箱即用版,所以需要我们去Git下载源码,拿到其中两个主

DDei在线设计器-API-DDeiSheet

DDeiSheet   DDeiSheet是代表一个页签,一个页签含有一个DDeiStage用于显示图形。   DDeiSheet实例包含了一个页签的所有数据,在获取后可以通过它访问其他内容。DDeiFile中的sheets属性记录了当前文件的页签列表。   一个DDeiFile实例至少包含一个DDeiSheet实例。   本篇最后提供的示例可以在DDei文档直接预览 属性 属性名说明数

android一键分享功能部分实现

为什么叫做部分实现呢,其实是我只实现一部分的分享。如新浪微博,那还有没去实现的是微信分享。还有一部分奇怪的问题:我QQ分享跟QQ空间的分享功能,我都没配置key那些都是原本集成就有的key也可以实现分享,谁清楚的麻烦详解下。 实现分享功能我们可以去www.mob.com这个网站集成。免费的,而且还有短信验证功能。等这分享研究完后就研究下短信验证功能。 开始实现步骤(新浪分享,以下是本人自己实现

基于Springboot + vue 的抗疫物质管理系统的设计与实现

目录 📚 前言 📑摘要 📑系统流程 📚 系统架构设计 📚 数据库设计 📚 系统功能的具体实现    💬 系统登录注册 系统登录 登录界面   用户添加  💬 抗疫列表展示模块     区域信息管理 添加物资详情 抗疫物资列表展示 抗疫物资申请 抗疫物资审核 ✒️ 源码实现 💖 源码获取 😁 联系方式 📚 前言 📑博客主页:

探索蓝牙协议的奥秘:用ESP32实现高质量蓝牙音频传输

蓝牙(Bluetooth)是一种短距离无线通信技术,广泛应用于各种电子设备之间的数据传输。自1994年由爱立信公司首次提出以来,蓝牙技术已经经历了多个版本的更新和改进。本文将详细介绍蓝牙协议,并通过一个具体的项目——使用ESP32实现蓝牙音频传输,来展示蓝牙协议的实际应用及其优点。 蓝牙协议概述 蓝牙协议栈 蓝牙协议栈是蓝牙技术的核心,定义了蓝牙设备之间如何进行通信。蓝牙协议

比较学习难度:Adobe Illustrator、Photoshop和新兴在线设计平台

从入门设计开始,几乎没有人不知道 Adobe 公司两大设计软件:Adobe Illustrator和 Photoshop。虽然AI和PS很有名,有一定设计经验的设计师可以在早期探索和使用后大致了解AI和PS的区别,但似乎很少有人会系统地比较AI和PS。目前,设计软件功能多样,轻量级和网页设计软件已成为许多设计师的需求。对于初学者来说,一篇有针对性的AI和PS比较总结文章具有非常重要的指导意义。毕竟