8个基于Lucene的开源搜索引擎(推荐)

所属分类: 软件编程 / 其它相关 阅读数: 163
收藏 0 赞 0 分享

Lucene是一种功能强大且被广泛使用的搜索引擎,以下列出8种基于Lucene的搜索引擎,你可以想象他们有多么强大。

1.Apache Solr

Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。

2.Elastic Search

ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。

3.Index Tank

IndexTank是一套基于Java的索引-实时全文搜索引擎实现,它的设计分离了相关性标记和文档内容,因为相关性标记的生命周期和文档本身是不一样的,特别是在用户创建的内容的情况下,例如分享次数,Like按钮,+1按钮等等。

4.Katta

Katta是一个可扩展的、故障容错的、分布式实施访问的数据存储。

Katta可用于大量、重复、索引的碎片,以满足高负荷和巨大的数据集。这些索引可以是不同的类型。当前该实现在Lucene和Hadoop mapfiles

5.Bobo Search

bobo-browse是一用java写的lucene扩展组件,通过它可以很方便在lucene上实现分组统计功能。

比如说搜索电脑,可以得到cpu是intel的有几条命中记录,cpu是amd的有几条命中记录。

6.Compass

Compass是一个强大的,事务的,高性能的对象/搜索引擎映射(OSEM:object/search engine mapping)与一个Java持久层框架。Compass包括:

搜索引擎抽象层(使用Lucene搜索引荐),
OSEM(Object/Search Engine Mapping)支持,
事务管理,
类似于Google的简单关键字查询语言,
可扩展与模块化的框架,
简单的API

7.Summa

Summa是一种由java开发的,快速模块化和可扩展的搜索引擎。Summa有如下特点:

综合搜索Summa能够同时访问许多不同的数据和资料来源,并以一个统一的接口公开
模块化设计Summa搜索系统由一系列独立模块组成,这样使得它更简单容易地被维护和升级
可扩展性Summa支持分布式架构而且能够按比例的扩大或缩小以处理任何数量的数据
开放标准Summa基于现代web技术与标准,不包含任何私有代码或原理
故障容错如果某单一数据资源或服务出错,Summa将会继续运行而不受出错部分限制

8.Constellio

Constellio是一个开源的搜索解决方案,适合企业级的搜索。基于Apache Solr项目构建,使用Lucene做为搜索引擎,并提供基于Web的网页和文档的检索。可选择文档类型、文件夹以及文件名进行检索。

以上所述是小编给大家介绍的8个基于Lucene的开源搜索引擎(推荐),希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!

更多精彩内容其他人还在看

笛卡尔乘积介绍

笛卡尔(Descartes)乘积又叫直积。假设集合A={a,b},集合B={0,1,2},则两个集合的笛卡尔积为{(a,0),(a,1),(a,2),(b,0),(b,1), (b,2)}
收藏 0 赞 0 分享

人人都是开发者:7款傻瓜式APP开发工具

国外的营销工作者和技术开发者开发了许多能帮助企业创建简单APP应用的工具,通过这些工具,就算是一个对程序一窍不通的普通网民都可以很容易的创建一个企业的APP程序,并可以对程序进行应用更新维护,开展营销等活动
收藏 0 赞 0 分享

分享下手机软件界面设计浅析

手机的软件系统已成为用户直接操作和应用的主体,它应以美观实用、操作便捷为用户所青睐。用户界面设计的规范性显得尤为重要
收藏 0 赞 0 分享

bilibili弹幕转ass程序制作思路及过程

本文主要是为了方便线下播放Bilibili的弹幕,而专门制作的一款将弹幕转换为ASS的程序,介绍了程序制作的思路及过程,有需要的朋友可以参考下
收藏 0 赞 0 分享

Eclipse 误删文件的恢复与代码的恢复详解

这篇文章主要介绍了Eclipse 误删文件的恢复,代码的恢复的相关资料,需要的朋友可以参考下
收藏 0 赞 0 分享

ascii码表(二进制 十进制 十六进制)详细介绍

这篇文章主要介绍了ascii码表二进制 十进制 十六进制详细介绍的相关资料,需要的朋友可以参考下
收藏 0 赞 0 分享

TCP的三次握手与四次挥手详细介绍

这篇文章主要介绍了TCP的三次握手与四次挥手详细介绍的相关资料,需要的朋友可以参考下
收藏 0 赞 0 分享

TCP 四种定时器(重传定时器,坚持计时器,保活定时器,时间等待计时器)

这篇文章主要介绍了TCP 四种定时器,重传定时器,坚持计时器,保活定时器,时间等待计时器的相关资料,需要的朋友可以参考下
收藏 0 赞 0 分享

内存溢出和内存泄漏的详解及区别

这篇文章主要介绍了内存溢出和内存泄漏的详解及区别的相关资料,需要的朋友可以参考下
收藏 0 赞 0 分享

密码哈希函数 Bcrypt的最大密码长度限制详解

这篇文章主要介绍了密码哈希函数 Bcrypt的最大密码长度限制详解的相关资料,需要的朋友可以参考下
收藏 0 赞 0 分享
查看更多