设为首页收藏本站

网络分析论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 982|回复: 1

[应用技巧] SolrCloud集群

[复制链接]
xkqueen 发表于 2014-2-21 17:13 | 显示全部楼层 |阅读模式
SolrCloud 是基于Solr和Zookeeper的分布式搜索方案,是正在开发中的 Solr4.0 的核心组件之一,分布式服务框架是 Apache Hadoop的子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题。它的主要思想是使用 Zookeeper 作为集群的配置信息中心。当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud它是指Solr中一套新的潜在的分发能力、通过参数让你建立起一个高可用、容错的Solr服务集群。ZooKeeper的目的是为了减轻分布式应用程序所承担的协调任务。

ZooKeeper使用Java所编写,但是支持Java和C两种编程语言。它是一个开源分布式的服务,它提供了分布式协作,分布式同步,配置管理等功能。它提供了一些简单的操作,分布式的应用可以建立在同步、配置管理、分组和命名等服务的更高级别的实现的基础之上。使得分布式应用可以基于这些接口实现诸如同步、配置维护和分集群或者命名的服务。Zookper很容易编程接入,它使用了一个和文件树结构相似的数据模型。可以使用Java或者C来进行编程接入。Zookper的目的就是将分布式服务不再需要由于协作冲突而另外实现协作服务。ZooKeeper数据模型、命名空间以及节点的概念ZooKeeper数据模型和层次命名空间提供的命名空间与标准的文件系统非常相似。一个名称是由通过斜线分隔开的路径名序列所组成的。ZooKeeper中的每一个节点是都通过路径来识别。

【基于Lucene4.6+Solr4.6+Heritrix1.14+S2SH实战开发从无到有垂直搜索引擎】课程按照一个从无到有的过程来展开。所有的数据,来自于互联网,用heritrix去抓取。对于抓取的数据,进行去重,去标签,然后利用lucene 和 solr 进行索引和搜索。整个课程,按照一个从无到有的过程来展开。所有的数据,来自于互联网,用heritrix去抓取。对于抓取的数据,进行去重,去标签,然后利用lucene 和 solr 进行索引和搜索。
这边 发表于 2015-1-30 09:24 | 显示全部楼层
加油!加油!我顶你个椅子!

Archiver|手机版|小黑屋|网络分析论坛 ( 京ICP备05002225  

GMT+8, 2020-8-7 06:43 , Processed in 1.093750 second(s), 25 queries .

Powered by Discuz! X3.3

© 2001-2014 协议分析论坛

快速回复 返回顶部 返回列表