这个简短的教程描述了如何在 Ubuntu Server 上安装 Solr 4,我使用的版本是:Ubuntu Server 12.04 和 Apache Solr 4.0-BETA. 我同时将展示如何测试安装以及执行一个简单的索引和查询任务。
在 Ubuntu 12.04 LTS 上安装 Tomcat
1. 安装包
1 |
apt-get install tomcat6 curl
|
2. 从 http://lucene.apache.org/solr 上下载 Solr 4 (写文章是的最新版本是 apache-solr-4.0.0-BETA.tgz)
3. 为 solr 选择一个目录,并使用 SOLR_HOME 环境变量指向这个目录,我这里选择的是 /opt/solr ,因此我的 SOLR_HOME=/opt/solr. 如果你想选择不同的目录请替换 /opt/solr
4. 解压缩文件并复制到 $SOLR_HOME:
- 复制 example/solr/* 到 /opt/solr
- 复制 example/webapps/solr.war 到 /opt/solr
5. 编辑 /opt/solr/collection1/conf/solrconfig.xml 中的 dataDir 配置项
1 |
< dataDir >${solr.data.dir:/opt/solr/data}</ dataDir >
|
6. 为 Solr 创建数据目录,并给 tomcat 设置可读写权限
1 |
% mkdir /opt/solr/data
|
2 |
% sudo chown tomcat6 /opt/solr/data
|
下面是我的 /opt/solr 目录的结构:
$ tree -d ├── bin ├── collection1 │ └── conf │ ├── lang │ ├── velocity │ └── xslt └── data
7. 在 Tomcat 中设置新的 context (web应用程序)并指向我们的 solr 文件,只需要在创建文件/etc/tomcat6/Catalina/localhost/solr.xml ,内容如下:
1 |
<? xml version = "1.0" encoding = "utf-8" ?>
|
2 |
< Context docBase = "/opt/solr/solr.war" debug = "0" crossContext = "true" >
|
3 |
< Environment name = "solr/home" type = "java.lang.String" value = "/opt/solr" override = "true" />
|
4 |
</ Context >
|
8. 重启 tomcat
1 |
/etc/init.d/tomcat6 restart |
9. 你可以在浏览器上打开 http://localhost:8080/solr 来验证是否安装成功
索引测试以及 UTF-8 测试
solr 安装文件包含一个简单的 schema.xml (我们已经复制到了 $SOLR_HOME 目录) 和一些包含示例数据的 xml 文件,我们将使用这些数据来测试 UTF-8 编码是否正常。
1. 进入 solr 解压目录然后使用 curl 导入 utf8-example.xml 文件
1 |
URL=http://localhost:8080/solr/update |
2 |
curl $URL --data-binary @example/exampledocs/utf8-example.xml -H 'Content-type:application/xml'
|
来自服务器的响应类似如下XML信息:
1 |
<? xml version = "1.0" encoding = "UTF-8" ?>
|
2 |
< response >
|
3 |
< lst name = "responseHeader" >< int name = "status" >0</ int >< int name = "QTime" >22</ int ></ lst >
|
4 |
</ response >
|
5 |
</ xml >
|
2. 提交文档
1 |
curl "$URL?softCommit=true"
|
3. 通过测试搜索字符串 êâîôû ,使用 Solr 管理界面或者使用 GET 请求访问
http://localhost:8080/solr/collection1/select?q=êâîôû
你将看到返回一个搜索结果。
相关推荐
文档中详细介绍了如何在ubuntu下面安装solr-4.9.0,以及在安装过程中出现的问题和解决办法
solr中文分词器
solr 中文分词
solr中文分词jar包ik-analyzer 含class配置 ik-analyzer-7.5.0
solr安装ik分词器将jar复制到solr\WEB-INF\lib 中 具体使用:https://mp.csdn.net/postedit
由于网上提供的solr中文分词器大多不吃吃6.5以上,会报错(具体错误提示忘了),这里提供高版本,内含使用教程
solr中文分词器 IKAnalyzer 支持solr版本5.x到7.x 亲测可用,我用的是7.2版本
Ubuntu16.04安装部署solr7详细过程,有需要搭建的可以参考!
solr搜索框架的中文分词器文件及配置详解供大家下载,亲测可用.解压出来的jar包放到apache-tomcat-9.0.20\webapps\solr\WEB-INF\lib下(Tomcat项目里solr项目)其他三个文件放到apache-tomcat-9.0.20\webapps\solr\...
中文分词技术(中文分词原理)词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的...
包含内容:IKAnalyzer中文分词器V2012使用手册.pdf;机械词汇大全【官方推荐】;深蓝词库转换.exe;中文分词词库打包50万词汇;IKAnalyzer-5.0.jar
solr5 中文分词
git地址https://github.com/magese/ik-analyzer-solr7,注意为solr7x的版本,如果低于此版本可能不使用 另外附件中有solr7的配置
solr cloud6.x.x 都可以用,solr的拼音分词
solr7.3.1种需要的中文IK分词器,其中包括IK分词的jar和配置文件还有mmseg4j
solr 源码 + IK 分词器 + zookeeper。
solr 中文查询分词器,把一串字符分作多个词语进行查询
该分词器支持solr7.x
Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一...