Skip to main content

moregeek program

centos安装Sphinx与使用,增量索引和主索引使用-多极客编程

1.Sphinx 优点高速索引(接近10M/S)高速搜索(2-4G文本搜索耗时不到0.1秒)高可用性(单CPU支持100GB文本,100M文档)提供相关性排名、分布式搜索、文档摘要(高亮显示)2.Sphinx 缺点必须有主键主键必须是整形不负责数据存储配置复杂3.官网下载最新版本4.解压进入sphinx/etc/,新建sphinx.conf配置文件 # # Minimal Sphinx confi

Read More

基于Solr DIH实现MySQL表数据全量索引和增量索引-多极客编程

实现MySQL表数据全量索引和增量索引,基于Solr DIH组件实现起来比较简单,只需要重复使用Solr的DIH(Data Import Handler)组件,对data-config.xml进行简单的修改即可。Solr DIH组件的实现类为org.apache.solr.handler.dataimport.DataImportHandler,在Solr的solrconfig.xml中配置两个h

Read More

coreseek自定义词库(二)增量索引(delta)-多极客编程

如果在第一次建立索引的时候数据量较大比如:100W,而每天新增的仅仅在1W左右,那么要重新进行索引需要花费的代价就太大了,所以只需要对新添加的数据进行操作建立索引即可。1.建立索引:    /usr/local/coreseek/bin/indexer --config /usr/local/coreseek/etc/zl_sphinx.conf  --all添加数据之后执行:2.更新增量索引:

Read More

xunsearch增量索引改进版-多极客编程

   最近测试了xunserach全文索引程序。xunsearch只有LINUX版,所以想用windows服务器请使用其它全文索引程序。xunsearch本身不像coreseek那样自带增量索引的功能,所以很多从coreseek转过来的朋友很是不习惯。不过xunsearch拥有很多的API和案例,使用这些程序很容易做出自己的增量索引脚本,只需要把这些脚本添加到LINUX服务器任务里就可以实现增量

Read More