sphinx专题

sphinx配置文件

看到一个有关sphinx配置文件的文章:http://www.cnblogs.com/yjf512/p/3598332.html,出自轩脉仁的博客。 sphinx使用的另一个参考:http://hot66hot.iteye.com/blog/1759559 sphinx的安装使用的小例子:http://www.cnblogs.com/chenzehe/archive/2010/11/04

sphinx里 java接口中对错误信息封装的一点记录

SphinxResult result = sphinx.Query(String queryString, String index, String comment);下面是实现:/** Connect to searchd server and run current search query. */public SphinxResult Query ( String query,

sphinx在windows下的安装

以前在linux上安装过使用过sphinx倒是没有发现问题,现在有时间想在windows下安装试试,没想到在运行生成索引时出现一个烦人的问题,信息如下: index column number 1 has no name如果在构建索引时有发现类似的信息,不一定是配置的问题,可以考虑一下是不是安装的版本过低。 开始使用的版本是0.9.8.1,后来换成corseek-4.0.1就行了。

【sphinx】mysql 配置文件 仅支持几个属性类型

Sphinx 仅支持几个属性类型 属性描述sql_attr_uint 和sql_attr_bigint32 位无符号整数值和 64 位有符号整数值。可对所有整数数据库字段和 DATE 使用这两种类型。sql_attr_float32 位浮点值。如果您想要存储地理坐标,可使用此属性类型。还要注意的是,如果您需要更高的精确度,则没有解决方法;字段四舍五入到七位小数。sql_attr_bool一个布尔

【sphinx】 配置文件之增量数据源

来看段代码 #增量数据源source incrementtest: test{sql_ranged_throttle = 100sql_query_pre = insert into t values ('')sql_query = inse

sphinx搭建亿级搜索

sphinx搭建亿级搜索 最近在做一些模糊搜索,大家知道MySQL单表如果超过100万条记录,查询就会变慢,如果用like语句做模糊搜索,那么索引就完全用不上,这样一来一次搜索就要遍历全表,没个1秒是出不来结果的,多的时候十几秒也是正常的。如果是MyISAM引擎,写表的时候是表级锁,立刻就跪了。一台小型机做100个并发,每个并发建立一个数据库长连接,机器负载很快就上去了。之前还做过

在pcDuino使用开源的语音识别Sphinx

CMU Sphinx 是用C 语言和Java 语言写的先进的语音识别系统。它是通过卡内基梅隆大学Sphinx 组,Sun 微系统实验室、三菱电器研究实验室、惠普等联合完成的,同时美国加州大学圣克鲁斯分校和麻省理工学院也对其有贡献。 安装 sudo apt-get install libasound2-devlibgstreamer0.10-dev libgstreamer

Mysql+sphinx+中文分词简介(ubuntu)

一、编译先前条件 确认是否已经安装以下软件,有些也许不是必须的,但建议还是都装上。 apt-get install autoconf automake autotools-dev cpp curl gawk gcc lftp libc6-dev linux-libc-dev make libpcre3-dev libpcrecpp0 g++ libtool libncurses5-dev

Sphinx 0.9.9/Coreseek 3.2 参考手册

Sphinx 0.9.9/Coreseek 3.2 参考手册 Sphinx--强大的开源全文检索引擎,Coreseek--免费开源的中文全文检索引擎 Copyright © 2006-2010 (coreseek)nzinfo, <li.monan(at)gmail.com>, (coreseek)HonestQiao, <honestqiao(at)gmail.com>, (sph

围绕Sphinx搭建代码化的内容管理+文档开发系统 | 技术传播

【技术传播】这个话题荒废好久,今天“诈尸”一波。 话说这段时间学习和实践了一下开源工具Sphinx,实现了文档代码化开发和同源发布。在此之前,我一直以为部署一套这样的系统,非得采购专门工具不可;万万没想到,一个免费开源的工具,竟然可以做到如此交付水平;而且完全不需要开发者掌握专门的xml/dita格式,只需要配合通用性更高的rst/md格式,就可以轻松搞定内容开发——实在让人有种莫名“想跪”的冲

SPHINX的输出文档格式

SPHINX的输出文档格式 SPHINX的输出文档格式更多信息 SPHINX的输出文档格式 用rst编写,然后用sphinx-build进行编译,还是效果相当不错地,只要掌握了格式,可以一次编译,多种格式输出,主要是用的可能是html和pdf,不过其他格式也是具备的。 这些命令提供了广泛的灵活性,以满足各种输出格式的需求,如下所示: HTML:make html 生成HTM

PHP之SPHINX的使用(全文搜索引擎)

还有个一种扩展类似sphinx,叫做lucence; ==========用法: ======使用 1.下载coreseek,是一款加了中文语言包的sphinx; 2. 配置: sphinxse的安装(必须在linux中才能安装sphinxse) 使

CentOS 安装配置python Sphinx

1. 安装 # yum install python-sphinx 采用下面官网的方法会非常慢。 # pip install sphinx

Sphinx+MySQL5.1x+SphinxSE+mmseg中文分词

什么是Sphinx Sphinx 是一个全文检索引擎,一般而言,Sphinx是一个独立的搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成。当前系统内置MySQL和PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式的XML数据。通过修改源代码,用户可以自行增加新的数据源(例如:其他类型的DBM

coreseek/sphinx 索引配置文件说明

## 数据源src1source src1{## 说明数据源的类型。数据源的类型可以是:mysql,pgsql,mssql,xmlpipe,odbc,python## 有人会奇怪,python是一种语言怎么可以成为数据源呢?## python作为一种语言,可以操作任意其他的数据来源来获取数据,更多数据请看:(http://www.coreseek.cn/products-install/pyt

从0到1搭建文档库——sphinx + git + read the docs

sphinx + git + read the docs 目录 一、sphinx 1 sphinx的安装 2 本地构建文件框架 1)创建基本框架(生成index.rst ;conf.py) conf.py默认内容 index.rst默认内容 2)生成页面(Windows系统下) 参考资料 3 编辑说明 1)图片:相对路径 2)文档编辑(官方) 3)页面主题:conf.py

wordpress使用coreseek(sphinx)全文索引

wordpress的默认搜索是采用mysql的like,但是当我们整个网站的数据非常大的时候,mysql的like的效率将会非常慢,而且wordpress本身的性能也是比较低的,而且mysql like的准确率也不高,前一段时间本站使用了wordpress整合Google自定义搜索但是发现Google经常被墙,很不爽,决定改之。今天wordpress教程网跟大家分享下如何在wordpress中使

Sphinx+gitee+Read the Docs搭建在线文档系统

本文介绍一种在线文档系统的搭建,需要借助Sphinx、gitee和Read the Docs。 Sphinx是一个功能强大的文档生成器,具有许多用于编写技术文档的强大功能gitee是一种版本管理系统,相比github,有着更快的访问速度Read the Docs是一个在线文档托管服务, 你可以从各种版本控制系统中导入文档 1 安装环境 Windows系统python3环境 2 Sphinx安装与

sphinx内存溢出问题(out of memory)

sphinx默认的存储临时查询信息是在电脑内存中,只需修改配置文件,设置存贮位置为电脑硬盘

[转] Sphinx SetGeoAnchor 经纬度查找附近地点

原文地址 http://www.douban.com/group/topic/30286342 Sphinx 的 SetGeoAnchor方法,(LinkWith:http://sphinxsearch.com/docs/manual-0.9.9.html#api-func-setgeoanchor) coreseek提供的中文翻译手册: function SetGeoAnchor (

在Ubuntu 14.04 64bit上使用Sphinx转换MonaServer项目文档

这几天看到网上出了个Cumulus的后继项目MonaServer, 官网是 http://www.monaserver.ovh/ 看介绍相当强悍, 包括支持RTMP, RTMFP, RTSP, HTTP, WebSocket等等, 妈呀, 简单在流媒体领域大一统了, 所以, 我是有相当的兴趣去业余研究它的. 我粗略过了一篇源码目录, 然后就想通过文档来进一步了解,但是发现国外的官网相当慢,

Sphinx实验手册

Sphinx实验手册 Sphinx+linux+apache+mysql+php+coreseek 环境准备: 源代码编译的LAMP环境 Centos 5.5                 Linux版本 Mysql-5.1            mysql版本 Apache-2.2.9       apache版本 Php-5.2.6            php版本 Sphi

CentOS6.2 安装Coreseek(Sphinx)详细教程

Sphinx是一个基于SQL的全文检索引擎,可以结合mysql,postgresql做全文搜索,它可以提供比数据库本身更专业的搜索功能,但对中文检索并不友好。而coreseek就是基于sphinx针对中文搜索研发出来的软件, 适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等应用场景。http://blog.rekfan.com/?p=136 Coreseek

sphinx 搜索到一些数据库不存在的id

在用coreseek(sphinx)做索引时,创建索引后,开始调用,查询出了一些这张表中不存在的id。 原因: 我这个表的id是bigint类型的。是64bit。 我编译的coreseek没有添加参数,导致我在建立索引的时候,64bit给转成了32bit的id存储起来了。所以有一些id实际上是在索引的时候被截取了一般,数字不一样了。 解决:        编译的时候加上参数   *

搭建在线电子书:Sphinx + Github + ReadTheDocs

我写博客的初衷是为了系统的构建自己的知识体系,目前使用的平台有微信公众号,CSDN,博客园,GitHub Pages和Gitee Pages,他们都各有优缺点,整理的笔记多了之后发现这些平台不是很方便,比如公众号,CSDN和博客园,每次写完文章后,还需要再平台上进行编辑再发布,比较麻烦;GitHub Pages和Gitee Pages虽然可以快速发布,但是在文章系统管理上不是很方便。我希望将笔记整

coreseek+sphinx+mysql+php 安装配置及实例

目录 搭建coreseeksphinxmmseg3安装 第一步 先安装mmseg3第二步 安装coreseek 下面开始sphinx与mysql的配置Sphinx扩展安装安装 第一步 安装依赖libsphinxclient第二步 安装sphinx的PHP扩展 php调用sphinx示例 参考文章:http://wenku.baidu.com/view/9c0d79c25fbfc