ElasticSearch简介与安装(1)

ElasticSearch简介

Elaticsearch,简称为es,es是一个开源的高扩展的分布式全文搜索服务,它可以近乎实时的存储、检索数据;本身扩展性很好,可以扩展到上百台服务器,处理PB级别的数据。es也是使用Java开发并使用Lucene作为其核心来实现所有索引和搜索的功能,但是它的目的是通过简单的RESTful API来隐藏Lucene的复杂性,从而让全文搜索变得简单。

ElasticSearch使用案例

  • 2013年初,GitHub抛弃了Solr,采取ElasticSearch来做PB级的搜索。“GitHub使用ElasticSearch搜索20TB的数据,包括13亿文件和1300亿行代码”。

  • 维基百科:启动以elasticsearch为基础的核心搜索架构。

  • SoundCloud:“SoundCloud使用ElasticSearch为1.8亿用户提供即时而精准的音乐搜索服务”。

  • 百度:百度目前广泛使用ElasticSearch作为文本数据分析,采集百度所有服务器上的各类指标数据及用户自定义数据,通过对各种数据进行多维分析展示,辅助定位分析实例异常或业务层面异常。目前覆盖百度内部20多个业务线(包括casio、云分析、网盟、预测、文库、直达号、钱包、风控等),单集群最大100台机器,200个ES节点,每天导入30TB+数据。

  • 新浪使用ES 分析处理32亿条实时日志。

  • 阿里使用ES 构建挖财自己的日志采集和分析体系。

ElasticSearch对比Solr

  • Solr利用 Zookeeper 进行分布式管理,而 Elasticsearch 自身带有分布式协调管理功能。

  • Solr支持更多格式的数据,而Elasticsearch仅支持json文件格式。

  • Solr官方提供的功能更多,而Elasticsearch本身更注重于核心功能,高级功能都有第三方插件提供。

  • Solr在传统的搜索应用中表现好于Elasticsearch,但在处理实时搜索应用时效率明显低于 Elasticsearch当单纯的对已有数据进行搜索时,Solr更快,当实时建立索引时, Solr会产生io阻塞,查询性能较差, Elasticsearch具有明显的优势。随着数据量的增加,Solr的搜索效率会变得更低,而Elasticsearch却没有明显的变化。综上所述,Solr的架构不适合实时搜索的应用。Solr是传统搜索应用(非实时检索)的有力解决方案,但 Elasticsearch 更适用于新兴的实时搜索应用

ElasticSearch:安装&启动

下载:

  • ElasticSearch分为Linux和Window版本,基于我们主要学习的是ElasticSearch的Java客户端的使用,所以我们课程中使用的是安装较为简便的Window版本,项目上线后,公司的运维人员会安装Linux版的ES供我们连接使用。

  • ElasticSearch官方地址:https://www.elastic.co/cn/products/elasticsearch

下载后名字文件名叫elasticsearch-6.2.2

安装

Window版的ElasticSearch的安装很简单,类似Window版的Tomcat,解压开即安装完毕,解压后的ElasticSearch的目录结构如下:

启动

进入elasticsearch-6.6.2\bin目录,点击elasticsearch.bat启动:

注意:启动时可能会出现JVM堆内存不够的错误。需修改elasticsearch-6.6.2/config目录下的配置文件jvm.options

浏览器访问:http://localhost:9200 看到如下返回的json信息,代表ES服务启动成功:

注意:ElasticSearch是用java开发的,且本版本的es需要的jdk版本要是JDK1.8+,并配置好JDK环境变量,否则启动ElasticSearch失败。

本站资源除特别声明外,转载文章请声明文章出处
东泰博客 » ElasticSearch简介与安装(1)

发表评论

切图仔日常笔记博客