
ELK
王树民
大JAVA
展开
-
Elasticasearch Web管理工具-Cerebro
Elasticasearch Web管理工具-Cerebrocerebro是一个使用Scala,Play Framework,AngularJS和Bootstrap构建的开源(MIT许可)elasticsearch web管理工具。需要Java 1.8或更高版本才能运行。1、安装JAVA环境tar -xzvf jdk-8u121-linux-x64.tar.gz -C /data配置环境/etc/profile文件中添加export JAVA_HOME=/data/jdk1.8.原创 2020-10-13 17:46:23 · 642 阅读 · 0 评论 -
Elasticsearch的快照备份 使用脚本进行快照
Elasticsearch的快照备份该文档适用于备份使用NAS的仓库类型。所有Elasticsearch集群中的服务通过挂载NAS目录来存放备份快照数据。1、创建备份仓库创建一个仓库名称:backupcurl -H "Content-Type: application/json" -XPUT http://10.10.18.10:9200/_snapshot/backup -d '{"type":"fs","settings":{"location":"/data/bak_es/原创 2020-10-13 17:42:19 · 674 阅读 · 0 评论 -
Centos7 搭建Cerebro Elasticsearch监控
简介Cerebro是一款Elasticsearch监控工具项目Github主页overview.pngnodes.pngrest.png创建用户useradd -s /sbin/nologin cerebro解压安装文件mkdir /opt/cerebro;\tar xf /tmp/cerebro-0.8.1.tgz -C /opt/cerebro;\ln -s /opt/cerebro/cerebro-0.8.1 /opt/ce...原创 2020-09-23 19:10:33 · 467 阅读 · 0 评论 -
es数据备份与恢复
数据备份 描述: es引入仓库与快照的概念实现了数据的备份与恢复,在elasticsearch.yml中指定仓库的base目录,创建仓库,将快照创建在指定的仓房中即可实现索引的备份。 解决的问题: 备份指定的索引 备份全部索引 答疑 快照的过程可以后台进行 快照时会将保存该索引的全部数据 同一仓库下的同一快照只能执行一次。 本次快照会基于上次仓库之前的快照进行增量保存。 快照保存的内容:①索引数据②集群全局状态③。。。留待探索 同一时刻只允许一个快照...原创 2020-09-22 16:46:37 · 1426 阅读 · 0 评论 -
滚动重启es
滚动重启总有一天你会需要做一次集群的滚动重启——保持集群在线和可操作,但是逐一把节点下线。常见的原因:Elasticsearch 版本升级,或者服务器自身的一些维护操作(比如操作系统升级或者硬件相关)。不管哪种情况,都要有一种特别的方法来完成一次滚动重启。正常情况下,Elasticsearch 希望你的数据被完全的复制和均衡的分布。如果你手动关闭了一个节点,集群会立刻发现节点的丢失并开始再平衡。如果节点的维护是短期工作的话,这一点就很烦人了,因为大型分片的再平衡需要花费相当的时间(想想尝试复制原创 2020-09-21 18:12:45 · 680 阅读 · 0 评论 -
ElasticSearch入门 第二篇:集群配置ES2.4
这是ElasticSearch 2.4 版本系列的第二篇:ElasticSearch入门 第一篇:Windows下安装ElasticSearch ElasticSearch入门 第二篇:集群配置 ElasticSearch入门 第三篇:索引 ElasticSearch入门 第四篇:使用C#添加和更新文档 ElasticSearch入门 第五篇:使用C#查询文档 ElasticSearch入门 第六篇:复合数据类型——数组,对象和嵌套 ElasticSearch入门 第七篇:分析器...原创 2020-09-14 17:20:29 · 645 阅读 · 0 评论 -
Flink:异步I/O访问外部数据
Flink大数据项目实战:http://t.cn/ExrHPl9Aysnc I/O1.1Aysnc I/O是啥?Async I/O 是阿里巴巴贡献给社区的一个呼声非常高的特性,于1.2版本引入。主要目的:是为了解决与外部系统交互时网络延迟成为了系统瓶颈的问题。场景:流计算系统中经常需要与外部系统进行交互,比如需要查询外部数据库以关联上用户的额外信息。通常,我们的实现方式是向数据库发送用户a的查询请求(例如在MapFunction中),然后等待结果返回,在这之前,我们...原创 2020-08-04 11:04:23 · 826 阅读 · 0 评论 -
前面 FLink 的文章中我们已经介绍了说 Flink 已经有很多自带的 Connector。
https://www.cnblogs.com/Allen-rg/p/11593528.html1、《从0到1学习Flink》—— Data Source 介绍2、《从0到1学习Flink》—— Data Sink 介绍其中包括了 Source 和 Sink 的,后面我也讲了下如何自定义自己的 Source 和 Sink。那么今天要做的事情是啥呢?就是介绍一下 Flink 自带的 ElasticSearch Connector,我们今天就用他来做 Sink,将 Kafka 中的数据经过 Fl原创 2020-08-04 09:51:34 · 536 阅读 · 0 评论 -
elasticsearch运维实战之2 - 系统性能调优
elasticsearch性能调优集群规划独立的master节点,不存储数据, 数量不少于2 数据节点(Data Node) 查询节点(Query Node),起到负载均衡的作用Linux系统参数配置文件句柄Linux中,每个进程默认打开的最大文件句柄数是1000,对于服务器进程来说,显然太小,通过修改/etc/security/limits.conf来增大打开最大句柄数* - nofile 65535虚拟内存设置max_map_count定义了进程能拥有的最多内...原创 2020-07-28 17:15:28 · 642 阅读 · 0 评论 -
ElasticSearch优化系列四:ES的heap是如何被瓜分掉的
以下分别解读几个我知道的内存消耗大户:Segment MemorySegment不是file吗?segment memory又是什么?前面提到过,一个segment是一个完备的lucene倒排索引,而倒排索引是通过词典(Term Dictionary)到文档列表(Postings List)的映射关系,快速做查询的。由于词典的size会很大,全部装载到heap里不现实,因此Lucene为词典做了一层前缀索引(Term Index),这个索引在Lucene4.0以后采用的数据结构是FST (Fin...原创 2020-07-27 16:39:39 · 574 阅读 · 0 评论 -
ElasticSearch中的field data(正排索引)
glrh123 2016-07-29 11:07:01 3137 已收藏 1分类专栏: ElasticSearch版权主要参考文章:http://www.tuicool.com/articles/B3QnQzE正排索引与倒排索引Elasticsearch使用一种叫做倒排索引(inverted index)的结构来做快速的全文搜索。倒排索引由在文档中出现的唯一的单词列表,以及对于每个单词在文档中的位置组成。倒排索引的结构如下图,它存储的内容是“哪些词语出现在了哪些文档中”,这种结构决定了...原创 2020-07-27 16:00:38 · 1220 阅读 · 0 评论 -
Elasticsearch-6.x 倒排索引,doc_values,Fielddata, store研究
一.倒排索引倒排索引的概念,感兴趣的可以点击查看<<ES权威指南中关于倒排索引的解释>>也可以查看elasticsearch简介和倒排序索引介绍这篇文章,写的很清晰。1.1 字段和倒排索引的关系首先,在es中,我们可以把一个doc(文档)理解为数据库中的一行数据,每个doc对应多个field(字段),例如:PUT /employee/group/1{ "age" : 25, "about" : "I love to go rock clim...原创 2020-07-27 15:26:08 · 524 阅读 · 0 评论 -
Elasticsearch内存那些事儿
Elasticsearch 内存分配设置详解。前言「该给 ES 分配多少内存?」「为什么是给 ES 分配服务器的一半内存?」「为什么内存使用率不断升高,没有释放?」「为何经常有某个 field 的数据量超出内存限制的异常?」「为何感觉上没多少数据,也会经常 Out Of Memory?」相信每个ES使用者或者运维人员都遇到过这些问题,也踩过不少坑。这里根据我个人的学习和日常工作的使用心得,谈一谈 Elasticsearch 的内存那些事儿。一、Elasticsearch...原创 2020-07-23 15:01:34 · 1240 阅读 · 0 评论 -
关于 Elasticsearch 内存占用及分配
Elasticsearch 和 Lucene 对内存使用情况:Elasticsearch 限制的内存大小是 JAVA 堆空间的大小,不包括Lucene 缓存倒排索引数据空间。Lucene 中的 倒排索引 segments 存储在文件中,为提高访问速度,都会把它加载到内存中,从而提高 Lucene 性能。所以建议至少留系统一半内存给Lucene。 Node Query Cache(负责缓存f ilter 查询结果),每个节点有一个,被所有 shard 共享,filter quer...原创 2020-07-23 15:00:04 · 2660 阅读 · 0 评论 -
es 写入数据的工作原理是什么啊?es 查询数据的工作原理是什么啊?底层的 lucene 介绍一下呗?倒排索引了解吗?
面试题es 写入数据的工作原理是什么啊?es 查询数据的工作原理是什么啊?底层的 lucene 介绍一下呗?倒排索引了解吗?面试官心理分析问这个,其实面试官就是要看看你了解不了解 es 的一些基本原理,因为用 es 无非就是写入数据,搜索数据。你要是不明白你发起一个写入和搜索请求的时候,es 在干什么,那你真的是......对 es 基本就是个黑盒,你还能干啥?你唯一能干的就是用 es 的 api 读写数据了。要是出点什么问题,你啥都不知道,那还能指望你什么呢?面试题剖析...原创 2020-07-07 15:36:44 · 238 阅读 · 0 评论 -
Docker 部署 Elasticsearch - 权限认证
Elasticsearch 认证插件选择这里选择一个免费的:社区插件 Readonly REST下载地址:https://readonlyrest.com/download/1、进入网站后 选择插件类型、elastic版本、邮箱地址2、提交后下载地址会发送到你的邮箱编辑Dockerfile我这里安装的 elastic:6.8.0FROM elasticsearch:6.8.0COPY readonlyrest-1.18.0_es6.8.0.zip /plugins...原创 2020-07-06 13:46:56 · 909 阅读 · 0 评论 -
一文掌握并应用Elasticsearch中的GC实现垃圾日志处理
如果你关注过 Elasticsearch 的日志,可能会看到如下类似的内容:[2018-06-30T17:57:23,848][WARN ][o.e.m.j.JvmGcMonitorService] [qoo--eS] [gc][228384] overhead, spent [2.2s] collecting in the last [2.3s][2018-06-30T17:57:29,020][INFO ][o.e.m.j.JvmGcMonitorService] [qoo--eS] [gc][原创 2020-07-06 11:37:55 · 1536 阅读 · 2 评论 -
elasticsearch调优
1、elasticsearch了解多少,说说你们公司es的集群架构,索引数据大小,分片有多少,以及一些调优手段 。面试官:想了解应聘者之前公司接触的ES使用场景、规模,有没有做过比较大规模的索引设计、规划、调优。解答:如实结合自己的实践场景回答即可。比如:ES集群架构13个节点,索引根据通道不同共20+索引,根据日期,每日递增20+,索引:10分片,每日递增1亿+数据,每个通道每天索引大小控制:150GB之内。仅索引层面调优手段:1.1、设计阶段调优1)根据业务增量需求,采取基于日期模原创 2020-07-06 11:21:05 · 673 阅读 · 0 评论 -
Elasticsearch集群模式知多少
01序言Elasticsearch经过多年发展,集群模式已经非常成熟,涵盖的技术点非常多,对于使用者来说,掌握并熟练运用至关重要。那么Elasticsearch有多少种集群模式呢?当前适合哪种集群模式?本文不涉及实战操作,仅限集群原理范围探讨,基于当前最新版本7.6.X。02集群模式Elasticsearch节点设计支持多种角色,这个是实现集群最重要的前提,节点角色各司其职,也可以任意组合,职责重合。ES节点角色类型节点角色说明:Master,集群管理Voting,投票选举节点Dat转载 2020-07-06 10:14:57 · 505 阅读 · 0 评论 -
elasticsearch实现冷热数据分离
目录(?)[-]es架构 各节点的es配置 如何实现某索引数据写到指定的node根据节点tag即可 如何实现数据从hot节点迁移到老的cold节点 cold节点数据保留1个月 优化点 logstash测试 关于es的index template本文以最新的elasticsearch-6.3.0.tar.gz为例,为了节约资源,本文将副本调为0, 无client角色https://www.elastic.co/blog/hot-warm-architecture-in-el...原创 2020-07-06 09:56:37 · 2950 阅读 · 0 评论 -
ElasticSearch CPU和内存占用高的优化记录出现GC
公司最近使用ElasticSearch作为数据报表汇总引擎.上线三个月累计数据800万,但是今天突然大面积出现查询超时,上服务器查看服务运行情况,发现cpu使用率高达300% mem 使用率也到了90%,下面记录了整个排查问题的过程 1.首先查看elastic cpu和mem占用情况 //首先查看所有进程# top//找到对应的elasticserch运行的PID,查看占用内存比较高的线程,Ctrl+c 退出#top -Hp 123...原创 2020-07-01 13:07:37 · 6895 阅读 · 0 评论 -
ElasticSearch6.3.2 中的JVM性能调优
前一段时间被人问了个问题:在使用ES的过程中有没有做过什么JVM调优措施?在我搭建ES集群过程中,参照important-settings官方文档来的,并没有对JVM参数做过多的调整。但谈到JVM配置参数,少不了操作系统层面上的一些配置参数,比如 page cache 和文件描述符的个数:(/etc/security/limits.conf)。另外ES jvm.options配置文件也针对JVM参数做了一些优化,这里简要介绍一下ElasticSearch中与jvm相关的各个配置参数: 将 X...原创 2020-07-01 13:02:25 · 627 阅读 · 0 评论 -
Elasticsearch的filter的caching(缓存)机制详解
编程界的小学生2017-12-27 07:50:54直接举例说明1.假设现在要在倒排索引中去搜索字符串(xxx)比如如下有个倒排索引列表:我现在要搜索:2017-02-02去倒排索引中找,发现对应的document list是doc2和doc32.为每个在倒排索引中搜索到的结果,构建一个bitset使我们找到的doc list构建一个bitset,就是一个二进制数组,数组每个元素都是0或1。用来标识一个doc对一个filter条件是否匹配,如果匹配就是1,不匹配就...原创 2020-06-30 16:32:13 · 1231 阅读 · 0 评论 -
elasticsearch 的日志gc
[2018-06-30T17:57:23,848][WARN ][o.e.m.j.JvmGcMonitorService] [qoo--eS] [gc][228384] overhead, spent [2.2s] collecting in the last [2.3s][2018-06-30T17:57:29,020][INFO ][o.e.m.j.JvmGcMonitorService] [qoo--eS] [gc][old][228385][160772] duration [5s...原创 2020-06-30 13:42:27 · 1492 阅读 · 0 评论 -
Elasticsearch 7.7部署
Elasticsearch(简称:ES)是一个开源的分布式搜索引擎, Elasticsearch 还是一个分布式文档数据库.并提供了大量数据的存储功能快速的搜索与分析功能. 起源于 Lucene, 基于 Java 语言开发的搜索引擎类库, 创建于 1999 年, 2005 年成为 Apache 顶级开源项目.Lucene 具有高性能, 以扩展的优点,主要功能分布式搜索引擎 大数据近实时分析引擎 高性能 容易使用/容易扩展 聚合功能 分布式存储及集群管理Elasticsearch个原创 2020-06-26 08:37:37 · 994 阅读 · 1 评论 -
Elasticsearch常用配置及性能参数
Elasticsearch常用配置及性能参数cluster.name: estest 集群名称node.name: “testanya” 节点名称node.master: false 是否主节点node.data: true 是否存储数据index.store.type: niofs 读写文件方式index.cache.field.type: soft 缓存类型bootstrap.mlockall: true 禁用swapgateway.type: local 本地存储...原创 2020-06-19 14:02:52 · 2164 阅读 · 0 评论 -
新建类AsyncEsDataRequest继承RichAsyncFunction类.
Flink入门(五) 实时流Join ElasticSearch6维度表小白鸽 2018-12-18 18:54:52 3363 已收藏 4展开需求实时流需要和维护表Join做属性的扩展.Spark-Streaming可以 stream join hive表.flink没发现这个功能,所以将维度表放在ES上.maven依赖 <properties> <project.build.sourceEncoding>UTF-8</projec...原创 2020-06-02 14:34:49 · 472 阅读 · 0 评论 -
Elasticsearch SQL用法详解
原创数据库开发技术作者:小米运维时间:2018-12-13 17:10:4462600本文详细介绍了不同版本中Elasticsearch SQL的使用方法,总结了实际中常用的方法和操作,并给出了几个具体例子。上篇文章回顾:看示例学awk一、5.x中ES-SQL用法Elasticsearch 5.x版本中,SQL功能还没有集成到Elasticsearch源码中,需要下载第三方插件后才能使用,配置过程如下:1.安装ES-SQL依赖node npmES-SQL 5....原创 2020-05-30 07:51:59 · 2300 阅读 · 0 评论 -
Elasticsearch 技术分析(五):如何通过SQL查询Elasticsearch
1|0前言这篇博文本来是想放在全系列的大概第五、六篇的时候再讲的,毕竟查询是在索引创建、索引文档数据生成和一些基本概念介绍完之后才需要的。当前面的一些知识概念全都讲解完之后再讲解查询是最好的,但是最近公司项目忙经常加班,毕竟年底了。但是不写的话我怕会越拖越久,最后会不了了之了,所以刚好上海周末下雪,天冷无法出门,就坐在电脑前敲下了这篇博文。因为公司的查询这块是我负责的所以我研究了比较多点,写起来也顺手些。那么进入正文。2|0为什么用SQL查询前面的文章介绍过,Elasticse...转载 2020-05-30 07:38:06 · 853 阅读 · 0 评论 -
删除elasticsearch大于7天前的索引
curl -u 用户名:密码 -H'Content-Type:application/json'-d'{ "query": { "range": { "@timestamp": { "lt": "now-7d", "format": "epoch_millis" } } ...原创 2020-05-29 18:07:21 · 1959 阅读 · 0 评论 -
ElasticSearch使用RestHighLevelClient进行搜索查询
Elasticsearch Java API有四类client连接方式:TransportClient、 RestClient 、Jest、 Spring_Data_Elasticsearch。其中TransportClient、 RestClient是Elasticsearch原生的api,TransportClient会在8.0版本中完成删除,替代的是HighLevelRestClient,它使用HTTP请求而不是Java序列化请求。Spring_Data_Elasticsearch是spri...原创 2020-05-27 16:25:59 · 4210 阅读 · 0 评论 -
Elasticsearch -- Index Settings
原开源中国合格公民发布于 2018/11/07 11:11ElasticSearch索引级别的设置,可以在每一个索引上使用。静态设置:只能在索引创建时或关闭索引上设置。动态设置:可以使用update-index-settingsAPI在打开的索引上更改它们。警告:更改已关闭索引的静态或动态索引设置,可能会导致设置不正确;如果不删除并重新创建索引,则无法纠正。Static index settingsindex.number_of_shards:设置索引的主...原创 2020-05-22 09:15:38 · 648 阅读 · 0 评论 -
Elasticsearch SQL用法详解
原创数据库开发技术作者:小米运维时间:2018-12-13 17:10:4462600本文详细介绍了不同版本中Elasticsearch SQL的使用方法,总结了实际中常用的方法和操作,并给出了几个具体例子。上篇文章回顾:看示例学awk一、5.x中ES-SQL用法Elasticsearch 5.x版本中,SQL功能还没有集成到Elasticsearch源码中,需...转载 2020-05-07 21:46:24 · 1950 阅读 · 0 评论 -
IDEA 超级好用的插件
IDEA 超级好用的插件 阿里代码规约检测 p3c (github 地址:https://github.com/alibaba/p3c/blob/master/idea-plugin/README_cn.md) 快捷键提示工具:Key promoter X 代码注解插件: Lombok 代码生成工具:CodeMaker 单元测试测试生成工具:...原创 2020-05-01 07:38:46 · 362 阅读 · 0 评论 -
Docker安装Elasticsearch和Elasticsearch-Head以及IK分词器
阿靖哦 2020-04-01 17:13:00 33 已收藏展开ElasticSearch 是一个分布式、高扩展、高实时的搜索引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。充分利用ElasticSearch的水平伸缩性,能使数据在生产环境变得更有价值。ElasticSearch 的实现原理主要分为以下几个步骤,首先用户将数据提交到Elastic Search 数据库中,再通...原创 2020-04-30 16:27:15 · 332 阅读 · 0 评论 -
Kibana插件安装
在如何开发自己的搜索帝国之Elasticsearch中已经介绍安装好了ES,下面就Kibana对ES的查询监控作介绍,就是常提到的大数据日志处理组件ELK里的K。 什么是Kibana?现引用园友的一段对此的介绍,个人觉得比较全。 Kibana是一个针对Elasticsearch的开源分析及可视化平台,用来搜索、查看交互存储在Elasticsearch索引中的数据。使用Kibana,可以通过各...转载 2018-05-05 09:25:05 · 7244 阅读 · 0 评论 -
kibana5.3使用x-pack插件对elasticsearch5.3集群进行监控
kibana5.3使用x-pack插件对elasticsearch5.3集群进行监控2018年03月07日 17:59:45阅读数:263需求: 安装elasticsearch后添加x-pack插件,访问elasticsearch索引可以不用用户验证;并且能在kibana的页面上查看monitor模块说明:由于只是一次解决问题经历,有什么不对的请大佬们指点解决:环境: centos (windo...转载 2018-05-05 09:25:11 · 486 阅读 · 0 评论 -
Elasticsearch-ES 5.x (Head,Kibana,X-Pack) 集群的部署、配置、测试
Elasticsearch-ES 5.x (Head,Kibana,X-Pack) 集群的部署、配置、测试2017年03月31日 09:55:14阅读数:11965Elasticsearch-ES 5.x (Head,Kibana,X-Pack) 集群的部署、配置、测试搭建环境为公司的三台 CentOS 7.3测试服务器版本5.2.2拓展组件 Head,Kibana,X-Pack1 安装前准备1、...转载 2018-05-05 09:25:17 · 333 阅读 · 0 评论 -
图解
同样是输入ip地址和端口后连接,界面如下。加星的表示主节点。下面介绍下各个图表。 系统监控:这里包含系统方面的一些状态,左起分别为:cpu,内存,交换区和平均负载的情况jvm:显示jvm的一些状态,左起分别为:jvm heap内存使用情况,蓝色的为已使用内存;非heap使用内存;线程数;gc情况(次数和时间);进程:下面四张图主要显示es的进程对系统资源的使用情况,左起分别为:进程打开文件数,内存...转载 2018-05-04 16:09:25 · 152 阅读 · 0 评论 -
centos7中给Elasticsearch5 安装bigdesk
centos7中给Elasticsearch5 安装bigdesk2017年03月18日 22:40:51阅读数:4013环境系统:centos7 elasticsearch:5.2.2安装步骤步骤由于elasticsearch不再建议支持插件的安装方式。建议作为独立的程序来安装类似于bigdesk、head。以前都是插件方式来安装。现在呢?官网介绍应该Run bigdesk standalone...转载 2018-05-04 15:40:54 · 185 阅读 · 0 评论