1075 热度

Elasticsearch 聚合

聚合是一种基于搜索的数据汇总,通过组合可以完成复杂的操作。聚合可以对文档进行汇总、分组等。通过聚合,我们会得到一个数据的概览,是分析和总结全部的数据,而不是寻找单个文档。

收录时间: 2021-03-18
分类: Elasticsearch
贡献者: Rector
1132 热度

分布式搜索引擎ElasticSearch之高可用集群搭建配置

主节点负责创建索引、删除索引、分配分片、追踪集群中的节点状态等工作, 主节点负荷相对较轻, 客户端请求可以直接发往任何节点, 由对应节点负责分发和返回处理结果。一个节点启动之后, 采用 Zen Discovery机制去寻找集群中的其他节点, 并与之建立连接, 集群会从候选主节点中选举出一个主节点, 并且一个集群只能选举一个主节点, 在某些情况下, 由于网络通信丢包等问题, 一个集群可能会出现多个主节点, 称为“脑裂现象”, 脑裂会存在丢失数据的可能, 因为主节点拥有最高权限, 它决定了什么时候可以创建索引, 分片如何移动等, 如果存在多个主节点, 就会产生冲突, 容易产生数据丢失。

收录时间: 2021-03-18
分类: Elasticsearch
贡献者: Rector
1160 热度

Elasticsearch 复合查询——多字符串多字段查询

有时我们在搜索电影的时候,包含了多个条件,比如主演是周星驰,打分8分以上,上映时间是1990年~2001年的,那么Elasticsearch又该如何帮我们做查询呢?这里我们可以用 bool 查询来实现需求。这种查询将多查询组合在一起,成为用户自己想要的 bool 查询。

收录时间: 2021-03-15
分类: Elasticsearch
贡献者: Rector
959 热度

ElasticSearch(ES)使用Nested结构存储KV及聚合查询

本文将讨论如何在ElasticSearch中使用nested结构进行数据的存储、查询和聚合,并结合K-V场景讨论ElasticSearch针对field数量限制的解决方案。

收录时间: 2021-03-08
分类: Elasticsearch
贡献者: Rector
1615 热度

ElasticSearch 集群安全

在安装完 ES 后,ES 默认是没有任何安全防护的。ES 的安全管理主要包括以下内容:身份认证:鉴定访问用户是否合法。用户鉴权:设置用户有哪些访问权限。传输加密:数据在传输的过程中,要加密。日志审计:记录集群操作等...

收录时间: 2021-03-03
分类: Elasticsearch
贡献者: Rector
1823 热度

数据同步工具 Elasticsearch-datatran v6.2.8 发布

数据同步工具 Elasticsearch-datatran 6.2.8 发布,Elasticsearch-datatran 由 bboss 开源的数据同步迁移工具,支持在Elasticsearch、关系数据库、Mongodb、HBase、Hive、Kafka、文本文件、SFTP/FTP多种数据源之间进行海量数据同步。

收录时间: 2021-03-02
分类: Elasticsearch
贡献者: Rector
AD 友情赞助
1232 热度

图解 ElasticSearch 原理,你可收好了!

Elasticsearch 是一款功能强大的开源分布式搜索与数据分析引擎,目前国内诸多互联网大厂都在使用,包括携程、滴滴、今日头条、饿了么、360 安全、小米、vivo 等。除了搜索之外,结合 Kibana、Logstash、Beats,Elastic Stack 还被广泛运用在大数据近实时分析领域,包括日志分析、指标监控、信息安全等多个领域。它可以帮助你探索海量结构化、非结构化数据,按需创建可视化报表,对监控数据设置报警阈值,甚至通过使用机器学习技术,自动识别异常状况。

收录时间: 2021-03-02
分类: Elasticsearch
贡献者: Rector
1350 热度

elasticsearch备份和还原(基于hdfs)

备份和还原,为什么elasticsearch还需要备份呢,明明可以设置副本做到高可用,那怕啥呢?其实在实际的生产环境中,一般最终的结果数据都是要备份的,这样的做的目的,就是能够以最快的速度还原数据,找回数据。明明mysql可以有主从,es有副本,备份干啥呢?不就是为了万无一失吗,生产环境有时候压力会很大,像mysql频繁的插入和删除数据也会导致binlog日志同步延迟,有时候就不一定能够做到同步,还有就是误操作删除了一些有用的数据呢,对吧,这个叫做有备无患。es也同样,万一一波操作猛如虎,一把把某个索引删除了呢,没有备份,到时候怎么死的都不知道呢,所以呢,从集群的角度去思考,权限,数据备份,高可用,节点拓展等都很重要。elasticsearch备份数据有很多选择,本地呀,Amazon S3, HDFS, Microsoft Azure, Google Cloud Storage这些都可以,但是我这里选择了hdfs,因为做大数据的熟悉呀,还有就是hdfs就是一个分布式的存储系统,也是数据高可用的呀,只要集群不椡,我数据依然完整,所以一点都不方了,所以这篇文章是基于HDFS的Elasticsearch的数据备份和还原。

收录时间: 2021-03-01
分类: Elasticsearch
贡献者: Rector
1224 热度

elasticsearch如何设计集群

在写本文时就在想,如果让你负责一个elasticsearch集群,从零开始,你会从哪些方面考虑?我们也知道es基本都是开箱即用,而且也很好用,配置参数也用默认的就好,只是这么简单的用不难,但是要想更好的用好es集群,那要怎么去做设计呢?我们知道想要用es集群,首先要安装es集群,当然es安装需要硬件,也就是服务器的支撑,如果安装好了es集群,也不能空跑吧,所以要有数据,所以要写入数据,当然写入数据是为了后期有所用,比如查询数据,做分析等。用是可以了,如果数据量增大,业务更加复杂,还要考虑如何更好的用,怎么用可以提高效率?一个集群也不可能只有一个人用呀,如果很多人用,就会存在不安全,需要考虑权限吧,想想也算健全了,但是万一哪天机器出问题了,数据丢失了怎么办?

收录时间: 2021-03-01
分类: Elasticsearch
贡献者: Rector
1297 热度

Docker Elasticsearch 集群配置

公司项目有些mysql的表数据已经超过5百万了,各种业务的查询入库压力已经凸显出来,初步打算将一个月前的数据迁移到ES中,mysql的老数据就物理删除掉。首先是ES使用起来比较方便,对于项目初期存储一些不能删除但又一般使用不到的数据比较合适,还有就是ES的存储采用索引分片式,使用数据的创建时间分片也很合适。

收录时间: 2021-02-25
分类: Elasticsearch
贡献者: Rector
2141 热度

elasticsearch7.8权限控制和规划

由于在版本7开始,x-pack可以免费使用了,但是权限控制免费的不够细,但是控制到索引级别都基本够用了。付费的可以体验更细致的权限控制。本文的基础是已经有了es集群的基础上进行的。官网:https://www.elastic.co/guide/en/elasticsearch/reference/7.8/secure-cluster.html一、集群权限配置假设你已经安装了elasticsearch7.8的集群,并且能够正常的运行。接下就是来配置权限;在elasticsearch.yml配置文件中新增(每个节点):xpack.security.enabled: truexpack.securi...

收录时间: 2021-02-05
分类: Elasticsearch
贡献者: Rector
1442 热度

Elasticsearch 集群的正确重启方式(qbit)

本文对 Elasticsearch 7.10 适用正确关机是为了防止数据丢失或集群混乱(如脑裂),也可避免无意义的重新分片官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/7.10/restart-cluster.html。方式一所有 master 机器配置 recover 策略,示例如下# 有 20 个数据节点加入集群就开始恢复分片...

收录时间: 2021-01-28
分类: Elasticsearch
贡献者: Rector
AD 友情赞助