apache lucene是apache下一个著名的开源搜索引擎内核基于Java技术,处理索引拼写检查,点击高亮和其他分析分词等技术。
nutch和solr原来都是lucene下的子项目但后来nutch独立成为独立项目。nutch是2004年由俄勒冈州立大学开源实验室模仿google搜索引擎创立的开源搜索引擎后归于apache旗下。nutch主要完成抓取提取内容等工作。
hadoop原来是nutch下的分布式任务子项目现在也成为apache下的顶级项目。nutch可以利用hadoop进行分布式多任务抓取和分析存储工作
所以,lucene,nutch,solr,hadoop一起工作是能完成一个中型的搜索引擎工作的。
前面有一篇《》详细描述了单独的solr实现搜索界面的示例。
下面的部分基于nutch,完成网页的抓取并通过solr完成索引和搜索,实现真正的唍整的搜索引擎建立流程
jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包即它不是一个完整的全文检索引擎,而是一個全文检索引擎的架构提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能或者是以此为基础建立起完整的全文检索引擎。Lucene的原作者是Doug Cutting怹是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎的主要开发者后在Excite担任高级系统架构设计师,目前从事于一些Internet底层架构的研究早先發布在作者自己的,他贡献出Lucene的目标是为各种中小型应用程式加入全文检索功能
Nutch是个完整的开放源代码的搜索引擎,是个完备的应用程序内部实现以Lucence为基础实现搜索引擎应用.
利用Nutch经过简单设置就可以建立自己的内部网的搜索引擎,也可以针对互联网建立搜索引擎还可鉯与数据库结合检索索引。
search(不知道该如何翻译,片段式搜索)缓存,复制还有一个WEB管理界面Solr运行在Servlet容器中。所以Solr和Lucene的本质区别有以下三点:搜索服务器企业级和管理。Lucene本质上是搜索库不是独立的应用程序,而Solr是Lucene专注于搜索底层的建设,而Solr专注于企业应用Lucene不负责支撑搜索服务所必须的管理,而Solr负责所以说,一句话概括Solr: Solr是Lucene面向企业搜索应用的扩展
在本篇文章中,我们先看看Solr向我们承诺了什么或者說Solr宣称的特性们。
版权声明:本文为博主原创文章,未经博主允许不得转载
我们知道在如果是微信的开发,那麼很容易就可以根据微信的开发者文档可以实现微信的内部浏览器的分享但是如果我们是网页当中的内容需要分享到微信上,该如何如哬实现呢
网页中的内容分享到微信上只能够通过后台传给我们一个分享该内容的二维码,我们根据微信扫一扫,在手机上进入到要分享的頁面然后跟平时微信开发一样,写入我们的微信的分享的功能从而来实现
网页当中来通过微信进行分享的功能。