本文主要是介绍数位之墙的主题式汇整和机器自动聚合,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
数位之墙的主题式汇整和机器自动聚合
Zhengyun_ustc 20070315
发现数位之墙竟然在半年前曾经这么说过,呵呵,很像我们最开始谈起的概念,只不过不再是搜索引擎人员来做“搜罗”,而是机器自动生成的,从而发现所有热点,并进一步精耕细作为一个一个有趣的话题,继而串连起来形成专题。百度新闻、Google新闻的原理也就是这样。只不过,新闻的自然语言处理还是相对简单的,毕竟文字规整,内容聚焦性强,发散性弱。网民零散的语言则更发散,更无厘头,文字风格更迥异,所以对自然语言处理提出了更高的要求。
《Web 2.0 革命(二)新媒体初成》[作者摘要:号称是新媒体,却只放二手内容。]:
然而,为了提升「网站总页面浏览量」而必须进行的「内容生产」,却非科技背景发家的矽谷工程师所擅长。于是搜索引擎经营者开始思索内容要从哪里来的问题。
第一个解决方法,就是开始编辑「互联网杂志」。传统的杂志有记者和编辑,经过每期编辑会议决定当期焦点后,再经过各式压榨脑力的过程而将内容产出。印刷后出版,透过渠道销售。
而「互联网杂志」则是由搜索引擎人员搜罗互联网上有趣网站进行主题式汇整,形成一个个专题放置于搜索引擎上进行导览。没有记者,不产出内容,这些人只做编辑,发行时也没有渠道和印刷成本。
在观看这些导览时,用户虽然最终会离开搜索引擎,但是已经初步达成延长用户停留时间的目的。在这里,我们第一次看见互联网带来的带宽与储存成本的降低,为出版业的变革敲下第一响。
黄彦达写了系列文章纪念数位之墙十年,写得太好了。如果你已经错过了数位之墙好多年,那么这一次决不应该错过。
数位之墙十周年:一个黑手的学习之路
我希望自己不要忘记,卷起袖子工作的那种畅快淋漓感觉。
数位之墙十周年:一个商人的营利之道
我是个梦想追逐者,但同时流著商人的血液。
数位之墙十周年:一个青年的炼心之地
我对虚名的体悟:「任何大师都是有上司的」以及「别以为抢到了媒体的麦克风」。
数位之墙十周年:一个教士的传道之志
让我们流泪的其实不是钱的味道,互联网对人类社会的意义远超于此。
数位之墙十周年:一个中年的挥泪之别
这样的人生,老天爷真是对我太厚爱了。
Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=1531158
这篇关于数位之墙的主题式汇整和机器自动聚合的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!