多吉搜索不能用了_这个搜索引擎是你从来没玩过的船新版本,一上线服务器就被挤爆...

本文主要是介绍多吉搜索不能用了_这个搜索引擎是你从来没玩过的船新版本,一上线服务器就被挤爆...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

8f510be34949be86be029c985937b6a1.png

前一段时间写了一篇关于搜索引擎的对比 《谷歌用不了,百度不想用?怎么办?》,还给大家推荐了一款新的搜索引擎多吉搜索,大家反映还不错。

最近呢,一个叫做 Magi 的搜索引擎又开始火了,还一度上了知乎热榜,而且由于短时间内使用的人太多,居然还宕机了。

关于搜索引擎,虽然说出名的就那几个,但是每年都会有小众产品上线,只不过像 magi 这个产品,一上线就被挤瘫痪,除了有初创团队服务器能力有限的原因,还有一个很重要的原因是:

这个搜索引擎是你从来没有玩过的船新版本。

大家都知道,现有的搜索引擎搜索出来的结果基本都是一个个网页链接,我们想要知道详细信息的话,还需要再一个个点进去继续了解。

当我们搜索不太了解的关键词时,一般会先看 Ta 的百科,比如说某个明星。

而百科就会事无巨细的把关于这个关键词的所有信息给你展示出来,只是大部分时候,我们并不需要了解那么多的信息,但是是却不得不在百科里这么多信息中来慢慢寻找自己有用的信息。

而这个叫做 Magi 的搜索引擎和传统的搜索引擎真的不太一样,绝对可以让你眼前一亮,这也是它能够火起来的原因,现在就来给大家展示一下,大家准备高呼“amazing”吧。

搜索引擎使用

主页呢,其实平平无奇,黑色的背景,不过很讨喜。

e19920b9d5904b0371885929bb7ad939.png

但是我们试一下搜索就知道哪里不一样了。

比如说,你的女朋友或者爸爸妈妈想问你这个年轻人:华为到底有多牛?

那自然你肯定要去查搜索华为,然后看它的百科了。

百科是这样的:

cd8001dc0e075001353b11bdef01cf72.gif

这么多信息,你还需要再总结一下,然后再告诉他们。

而在 Magi 上面搜索结果是这样的:

d264eb6c06797076012c7e5cb965ebff.gif

左边的一些描述和属性都是属于华为的关键信息,已经帮你概括好,而且记起来还非常简单。

右边则是一条条网页链接,并且自动和左边的关键词建立连接,想了解某个关键词的详细内容,可以更有针对性地查看。

ac76b0ea7aa414fca856270f1fca1c12.png

是不是感觉通过这个搜索引擎获取信息的方式有点意思?很像脑图对吧?

好,现在回过头我们再分析一下,可以发现,通过 Magi 搜索的关键词结果呈现方式是比较结构化的。

从上到下依次是描述、属性、标签,有的结果还有近义词等等。之后才是平常我们搜索到的链接结果。

每个结构化结果都会附上来源链接,就在页面的右侧,用鼠标划过它们即可看到,答案是从哪几个具体的来源学习到的。

bc38beffe5bdc0a17cf8ab025ba1fede.gif

结构化还会以绿、黄、红三种颜色表示其可信度从高到低,点击还可显示可信度评分,由于搜索华为结果的可信度评分都为 100 分,我再找一个新的结果给大家展示。

以“埃菲尔铁塔”为例:

1fef9b06d588d51dbc82a5b30542342a.gif

这样的搜索引擎可以大大节省我们搜索获取信息时间。

因为我们去通过搜索引擎搜索干嘛呢?不就是为了寻求一个答案吗?

而 Magi 就是非常直接干脆的给了我们想要的答案,而且答案还放在最前面,和传统搜索引擎相比,省去了

而且它的这种结构化结果形式很是新颖,就像是打开了一个新世界。所以不管是谁,都会体验这个不一样的搜索,怪不得会宕机。

我就搜了一下我自己,标签还是对的。

1d5851ee74a78b2d7ac12e83d79e5dcb.png

搜索罗永浩的,大家自寻亮点。

918ac1978bb091d30e31d2296ee1c47c.png

还有微博的 CEO,真是笑死我了。

69ce5312d079cff542b0da0a1e372ec0.png

还有前一段时间特别火的乔碧萝殿下,亮点同样自寻。

412e61a1201bb1cf4074507a7410884a.png

关于这个搜索结果,我的表情:?????

09796c4b3c26bd75bfcd8519127ebe72.png

Magi 是这样,就是只要关你搜索的关键词新闻网页链接越多,那么结果中的描述、属性、标签也就越多。

是不是感觉像个吃瓜看八卦的好地方?

于是乎,各家粉丝纷纷上场,搜起自己的爱豆来,就给大家随机展示几个各家粉丝搜索自家爱豆的结果,图片来自各粉丝微博。

关于李宇春的:

e4be0f8194fe6f72e8dd614d8fedc27e.png

关于王一博的:

bb4a8850ef9ec8b03689ebf985687868.png

还有太多,就不再一一列举了。

相信大家都知道,饭圈流量的恐怖,于是迅速就被饭圈女孩给玩坏了,以至于长时间无法正常访问。

也难怪,因为搜起来你会看到各种维度的关键词串联在一起,每一次点击总有新发现,玩起来是有点上头。

Magi 原理

遇到这么好玩的一个搜索引擎,好奇的小伙伴一定会问这是什么原理呢?

Magi 是基于机器学习的信息抽取和检索系统,它不使用 HTML 标签等半结构化特征,无需预设领域和关键词,直接处理自然语言文本。它能够将互联网上的公开文本和企业内部的私有数据提取归纳为结构化知识,为用户提供自主更新的、可量化解析的、可溯源的知识体系。 而且这个系统具有终身学习能力,能够开放地获取并自主学习互联网上的信息,不断增强自身对自然语言文本的处理能力。https://36kr.com/p/5262151

只要用户输入关键词,即可获取 Magi 从互联网文本中自主学习到的结构化知识和网页搜索结果。

可以看到在 Magi 的主页搜索框下方,还可以看到它在不停的学习。

8a459688e286c3c81cc4cedff23807dd.png

这些是人工智能在无人干预的情况下 7 x 24 小时不间断运行的,而且一直在学,一直还在改,先前学习到的知识的可信度会被重新评估,使结果中的错误被自动纠正。

至于其中的技术原理,Magi 的作者也在知乎做了详细解释,有兴趣并且还能看得懂的小伙伴可以移步作者@季逸超的知乎了解,这里就不多做解释了。

70ee3c83ad8b3cd293902449b265f958.png

Magi 存在的意义

虽然大家都在高度评价这个搜索引擎,但是作者也是再三说明,它其实是一个自主阅读文本并纠错的 AI。

1d6abb11de7a42aaa2bb9c5b54ccd79d.png

Magi 存在的意义就是在于帮助我们人类来阅读文本、筛选归类信息。

要知道互联网上提供了足够多的海量信息,而且还在一直也不断的更新。

虽然对于人们来说种类够多够丰富了,但是想要利用好却成了一件难事,也无法跟上信息的生产速度,如果不会利用,想要获得有效的信息那无异于大海捞针。

所以也只有人工智能能够帮我们去筛选、归类好这些信息来供我们使用,而且还能做到比人类相对客观,最重要的是他们精力无限。

因此按照 Magi 的官方介绍,Magi 的使命就是为人类用户提供了与互联网数据交互的新方式。

而 Magi 系统背后的技术平台则承载着另一半重要的意义:让机器像人一样能理解并充分利用互联网中无穷无尽的知识。

难怪会被用户夸为:划时代的搜索引擎,前途无限。

Magi 目前的问题

结结实实吹了一波,没错,前景的确让人期待。

不过,眼下的 Magi 还存在很多问题,它在日常使用中并不能完全代替传统搜索引擎、满足每个小伙伴的需要。

还有其它一些,比如说,无法识别错别字;

86b9e6505de0d2c40fc1300a7979a270.png

偶尔搜索结果南辕北辙;

412930a868f997ec856fe4151acad7a0.png

不能搜索图片;

5087478107dd3059ba350ad631b0a0b0.png

不能搜索视频;

f048a4afc1bb591086f89b0c354bf7eb.png

还有这个,咦,老公是什么鬼?

5ee100f25b5b2896044459944b559dc1.png

以及答案混乱,(隔壁老王是亲戚就怪了)。

27ba40e26a9989640ce74be180863302.png

其官方也有介绍到:目前的 Magi 技术还没有完全成熟,比如有些信息是过时的,但是也学习了过来。

也就是说,Magi 机器学习的过程中对信源的筛选算法还有很大优化空间,这些都需要时间来消化。

结语

初步使用下来, Magi 给我的感觉还是不错的,起码值得一玩,相信大家也是,毕竟对于这类新奇有用的东西不乏好奇心。更何况,在这个领域里,我们更乐于看到百度的挑战者。

网址贴出来:magi.com 大家悠着点玩,可别给玩坏了。

总之,Magi 作为一款新兴产品,还有很长的路需要走,让我们拭目以待。

本文首发于微信公众号网罗灯下黑(wldxh8),未经授权请勿转载,获取本文介绍的工具请参看个人签名。

这篇关于多吉搜索不能用了_这个搜索引擎是你从来没玩过的船新版本,一上线服务器就被挤爆...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/263176

相关文章

2024.6.24 IDEA中文乱码问题(服务器 控制台 TOMcat)实测已解决

1.问题产生原因: 1.文件编码不一致:如果文件的编码方式与IDEA设置的编码方式不一致,就会产生乱码。确保文件和IDEA使用相同的编码,通常是UTF-8。2.IDEA设置问题:检查IDEA的全局编码设置和项目编码设置是否正确。3.终端或控制台编码问题:如果你在终端或控制台看到乱码,可能是终端的编码设置问题。确保终端使用的是支持你的文件的编码方式。 2.解决方案: 1.File -> S

ONLYOFFICE 8.1 版本桌面编辑器测评

在现代办公环境中,办公软件的重要性不言而喻。从文档处理到电子表格分析,再到演示文稿制作,强大且高效的办公软件工具能够极大提升工作效率。ONLYOFFICE 作为一个功能全面且开源的办公软件套件,一直以来都受到广大用户的关注与喜爱。而其最新发布的 ONLYOFFICE 8.1 版本桌面编辑器,更是带来了诸多改进和新特性。本文将详细评测 ONLYOFFICE 8.1 版本桌面编辑器,探讨其在功能、用户

17.用300行代码手写初体验Spring V1.0版本

1.1.课程目标 1、了解看源码最有效的方式,先猜测后验证,不要一开始就去调试代码。 2、浓缩就是精华,用 300行最简洁的代码 提炼Spring的基本设计思想。 3、掌握Spring框架的基本脉络。 1.2.内容定位 1、 具有1年以上的SpringMVC使用经验。 2、 希望深入了解Spring源码的人群,对 Spring有一个整体的宏观感受。 3、 全程手写实现SpringM

通过SSH隧道实现通过远程服务器上外网

搭建隧道 autossh -M 0 -f -D 1080 -C -N user1@remotehost##验证隧道是否生效,查看1080端口是否启动netstat -tuln | grep 1080## 测试ssh 隧道是否生效curl -x socks5h://127.0.0.1:1080 -I http://www.github.com 将autossh 设置为服务,隧道开机启动

【服务器运维】MySQL数据存储至数据盘

查看磁盘及分区 [root@MySQL tmp]# fdisk -lDisk /dev/sda: 21.5 GB, 21474836480 bytes255 heads, 63 sectors/track, 2610 cylindersUnits = cylinders of 16065 * 512 = 8225280 bytesSector size (logical/physical)

【服务器运维】CentOS6 minimal 离线安装MySQL5.7

1.准备安装包(版本因人而异,所以下面的命令中版本省略,实际操作中用Tab自动补全就好了) cloog-ppl-0.15.7-1.2.el6.x86_64.rpmcpp-4.4.7-23.el6.x86_64.rpmgcc-4.4.7-23.el6.x86_64.rpmgcc-c++-4.4.7-23.el6.x86_64.rpmglibc-2.12-1.212.el6.x86_64.r

【服务器运维】CentOS7 minimal 离线安装 gcc perl vmware-tools

0. 本机在有网的情况下,下载CentOS镜像 https://www.centos.org/download/ 1. 取出rpm 有的情况可能不需要net-tools,但是如果出现跟ifconfig相关的错误,就把它安装上。另外如果不想升级内核版本的话,就找对应内核版本的rpm版本安装 perl-Time-Local-1.2300-2.el7.noarch.rpmperl-Tim

SQL Server中,always on服务器的相关操作

在SQL Server中,建立了always on服务,可用于数据库的同步备份,当数据库出现问题后,always on服务会自动切换主从服务器。 例如192.168.1.10为主服务器,12为从服务器,当主服务器出现问题后,always on自动将主服务器切换为12,保证数据库正常访问。 对于always on服务器有如下操作: 1、切换主从服务器:假如需要手动切换主从服务器时(如果两个服务

Visual Studio中,MSBUild版本问题

假如项目规定了MSBUild版本,那么在安装完Visual Studio后,假如带的MSBUild版本与项目要求的版本不符合要求,那么可以把需要的MSBUild添加到系统中,然后即可使用。步骤如下:            假如项目需要使用V12的MSBUild,而安装的Visual Studio带的MSBUild版本为V14。 ①到MSDN下载V12 MSBUild包,把V12包解压到目录(

时间服务器中,适用于国内的 NTP 服务器地址,可用于时间同步或 Android 加速 GPS 定位

NTP 是什么?   NTP 是网络时间协议(Network Time Protocol),它用来同步网络设备【如计算机、手机】的时间的协议。 NTP 实现什么目的?   目的很简单,就是为了提供准确时间。因为我们的手表、设备等,经常会时间跑着跑着就有误差,或快或慢的少几秒,时间长了甚至误差过分钟。 NTP 服务器列表 最常见、熟知的就是 www.pool.ntp.org/zo