数位之墙的主题式汇整和机器自动聚合

2024-03-22 18:08

本文主要是介绍数位之墙的主题式汇整和机器自动聚合,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 数位之墙的主题式汇整和机器自动聚合

Zhengyun_ustc 20070315

发现数位之墙竟然在半年前曾经这么说过,呵呵,很像我们最开始谈起的概念,只不过不再是搜索引擎人员来做搜罗,而是机器自动生成的,从而发现所有热点,并进一步精耕细作为一个一个有趣的话题,继而串连起来形成专题。百度新闻、Google新闻的原理也就是这样。只不过,新闻的自然语言处理还是相对简单的,毕竟文字规整,内容聚焦性强,发散性弱。网民零散的语言则更发散,更无厘头,文字风格更迥异,所以对自然语言处理提出了更高的要求。

Web 2.0 革命(二)新媒体初成》[作者摘要:号称是新媒体,却只放二手内容。]

然而,为了提升「网站总页面浏览量」而必须进行的「内容生产」,却非科技背景发家的矽谷工程师所擅长。于是搜索引擎经营者开始思索内容要从哪里来的问题。

第一个解决方法,就是开始编辑「互联网杂志」。传统的杂志有记者和编辑,经过每期编辑会议决定当期焦点后,再经过各式压榨脑力的过程而将内容产出。印刷后出版,透过渠道销售。

「互联网杂志」则是由搜索引擎人员搜罗互联网上有趣网站进行主题式汇整形成一个个专题放置于搜索引擎上进行导览。没有记者,不产出内容,这些人只做编辑,发行时也没有渠道和印刷成本。

在观看这些导览时,用户虽然最终会离开搜索引擎,但是已经初步达成延长用户停留时间的目的。在这里,我们第一次看见互联网带来的带宽与储存成本的降低,为出版业的变革敲下第一响。

 

黄彦达写了系列文章纪念数位之墙十年,写得太好了。如果你已经错过了数位之墙好多年,那么这一次决不应该错过。

数位之墙十周年:一个黑手的学习之路
我希望自己不要忘记,卷起袖子工作的那种畅快淋漓感觉。

数位之墙十周年:一个商人的营利之道
我是个梦想追逐者,但同时流著商人的血液。

数位之墙十周年:一个青年的炼心之地
我对虚名的体悟:「任何大师都是有上司的」以及「别以为抢到了媒体的麦克风」。

数位之墙十周年:一个教士的传道之志
让我们流泪的其实不是钱的味道,互联网对人类社会的意义远超于此。

数位之墙十周年:一个中年的挥泪之别
这样的人生,老天爷真是对我太厚爱了。

 

 

Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=1531158


这篇关于数位之墙的主题式汇整和机器自动聚合的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/835866

相关文章

Python脚本实现自动删除C盘临时文件夹

《Python脚本实现自动删除C盘临时文件夹》在日常使用电脑的过程中,临时文件夹往往会积累大量的无用数据,占用宝贵的磁盘空间,下面我们就来看看Python如何通过脚本实现自动删除C盘临时文件夹吧... 目录一、准备工作二、python脚本编写三、脚本解析四、运行脚本五、案例演示六、注意事项七、总结在日常使用

SpringBoot项目启动后自动加载系统配置的多种实现方式

《SpringBoot项目启动后自动加载系统配置的多种实现方式》:本文主要介绍SpringBoot项目启动后自动加载系统配置的多种实现方式,并通过代码示例讲解的非常详细,对大家的学习或工作有一定的... 目录1. 使用 CommandLineRunner实现方式:2. 使用 ApplicationRunne

Springboot的ThreadPoolTaskScheduler线程池轻松搞定15分钟不操作自动取消订单

《Springboot的ThreadPoolTaskScheduler线程池轻松搞定15分钟不操作自动取消订单》:本文主要介绍Springboot的ThreadPoolTaskScheduler线... 目录ThreadPoolTaskScheduler线程池实现15分钟不操作自动取消订单概要1,创建订单后

python实现自动登录12306自动抢票功能

《python实现自动登录12306自动抢票功能》随着互联网技术的发展,越来越多的人选择通过网络平台购票,特别是在中国,12306作为官方火车票预订平台,承担了巨大的访问量,对于热门线路或者节假日出行... 目录一、遇到的问题?二、改进三、进阶–展望总结一、遇到的问题?1.url-正确的表头:就是首先ur

Spring使用@Retryable实现自动重试机制

《Spring使用@Retryable实现自动重试机制》在微服务架构中,服务之间的调用可能会因为一些暂时性的错误而失败,例如网络波动、数据库连接超时或第三方服务不可用等,在本文中,我们将介绍如何在Sp... 目录引言1. 什么是 @Retryable?2. 如何在 Spring 中使用 @Retryable

使用 Python 和 LabelMe 实现图片验证码的自动标注功能

《使用Python和LabelMe实现图片验证码的自动标注功能》文章介绍了如何使用Python和LabelMe自动标注图片验证码,主要步骤包括图像预处理、OCR识别和生成标注文件,通过结合Pa... 目录使用 python 和 LabelMe 实现图片验证码的自动标注环境准备必备工具安装依赖实现自动标注核心

QT实现TCP客户端自动连接

《QT实现TCP客户端自动连接》这篇文章主要为大家详细介绍了QT中一个TCP客户端自动连接的测试模型,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录版本 1:没有取消按钮 测试效果测试代码版本 2:有取消按钮测试效果测试代码版本 1:没有取消按钮 测试效果缺陷:无法手动停

基于Qt实现系统主题感知功能

《基于Qt实现系统主题感知功能》在现代桌面应用程序开发中,系统主题感知是一项重要的功能,它使得应用程序能够根据用户的系统主题设置(如深色模式或浅色模式)自动调整其外观,Qt作为一个跨平台的C++图形用... 目录【正文开始】一、使用效果二、系统主题感知助手类(SystemThemeHelper)三、实现细节

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学