本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

【ES】ELK Stack搭建教程

大数据 wangjing 1002℃

什么是ELK Stack

“ELK”是三个开源项目的首字母缩写:Elasticsearch,Logstash和Kibana。

  • Elasticsearch是一个搜索和分析引擎。
  • Logstash是一个服务器端数据处理管道,它同时从多个源中提取数据,对其进行转换,然后将其发送到比如Elasticsearch这样的“数据库”中进行存储。
  • Kibana可以对Elasticsearch中的数据进行数据可视化。

什么是Elastic Stack

Elastic Stack比ELK Stack更加灵活且强大

Elastic Stack发展历程

  • Elasticsearch是核心
  • LogStash负责数据的收集与发送、Kibana负责展示数据
  • 社区越来越大,使用案例也越来越多
  • 2015年,社区在ELK Stack中引入了一系列轻量级,单用途的数据发送器,叫做Beats
  • 那么这个阶段的Stack,我们到底应该叫BELK? BLEK? ELKB? 首字母缩写并不重要
  • 如此简单易用开源的产品,不应该只局限于首字母缩写,所以有了Elastic Stack

从零搭建ELK,快速收集Mysql日志并实现可视化

目前官网的ELK教程使用的是ElasticSearch+Filebeat+Kibana,所以我们也先使用这三个组件来从零搭建ELK,关于Logstash后文会用到。

Filebeat是一个轻量级的收集与发送日志数据的组件,将它安装在你的服务器上,类似一个代理,它将监控你指定路径下的日志文件,然后将日志信息发送给ElasticSearch或LogStash

下载并解压

  • ElasticSearch
  • Filebeat
  • Kibana

请自行选择自己的操作系统进行安装,并找到对应的安装目录,比如我现在使用的是Mac系统,下载下来的为gzip的压缩包,然后直接解压即可,如下图:

【ES】ELK Stack搭建教程

所在目录为/ekl。

运行

 

启动ElasticSearch

./elasticsearch-7.1.0/bin/elasticsearch

启动Kibana

./kibana-7.1.0-darwin-x86_64/bin/kibana

启动Filebeat

cd filebeat-7.1.1-darwin-x86_64
./filebeat modules enable mysql
./filebeat -e -c filebeat.yml

 

使用Kibana

1. 访问Kibana

浏览器打开 http://localhost:5601

2. 进入dashboard

【ES】ELK Stack搭建教程

Collapse默认是收起来的,展开后可找到Dashboard,点击即可

3.初始化

Dashboard页面的展示出来了filebeat帮我们创建的索引,如下图:

【ES】ELK Stack搭建教程

在Index pattern输入filebeat*即可匹配到filebeat所创建的索引:

【ES】ELK Stack搭建教程

点击Next step,表示我们现在想将filebeat*所匹配到的索引数据在kibana中进行查看。

第二步需要我们选择一个时间字段,时间过滤器将使用此字段按时间过滤数据。您可以选择不包含时间字段,但无法按时间范围缩小数据范围。不太明白这个时间字段意思,我们选择下拉列表的最后一个可选值I don’t want to use the Time Filter,然后点击Create index pattern。创建后进入到的页面展示出了索引所包含的字段以及字段类型,并且你也是可以去修改字段类型的,这里就不演示了。

4.使用

点击进入到Discover就可以进行查看和搜索日志,如下下图:

【ES】ELK Stack搭建教程

可以使用KQL语法来搜索日志,关于KQL语法我们用另外一篇文章来介绍吧,现在你只需要知道它是使用Kibana时进行快速搜索的语法。

收集自己的应用日志

Filebeat配置文件

Filebeat是负责收集日志以及传输的,Filebeat默认的配置文件精简后如下:

#=========================== Filebeat inputs =============================
filebeat.inputs:
- type: log
  enabled: false
  paths:
    - /var/log/*.log
    #- c:\programdata\elasticsearch\logs\*

  
#================================ Outputs =====================================

#-------------------------- Elasticsearch output ------------------------------
output.elasticsearch:
  # Array of hosts to connect to.
  hosts: ["localhost:9200"]

#----------------------------- Logstash output --------------------------------
#output.logstash:
  # The Logstash hosts
  #hosts: ["localhost:5044"]

Filebeat分为数据输入配置与数据输出配置。

默认配置文件中数据输入配置表示从/var/log/这个目录下获取.log的文件内容,但是暂时没有打开。

默认配置文件中数据输出配置表示输出到localhost:9200这个主机的elasticsearch中。

创建自己的应用日志

所以如果我们想获取我们自己应用的日志信息,我们需要将应用日志存在某个文件中,然后修改FileBeat的配置文件。

在GitHub上我创建了一个项目,大家可以自由克隆使用,这个项目在打印日志的时候会将日志输出到/var/log/elk/app.log文件中。

修改Filebeat的配置文件并重启

然后我们修改Filebeat的配置文件,修改部分为:

filebeat.inputs:
- type: log
  enabled: true
  paths:
    - /var/log/elk/*.log

 

然后重启Filebeat。

产生并查看应用日志

运行一下项目中的Main方法,就会产生一条日志并存储到/var/log/elk/app.log中,比如我目前这个文件中的内容为:

【ES】ELK Stack搭建教程

回到Kibana进行查询我们就可以查询到这条日志了,当然这中间可能需要等个几秒钟,因为Filebeat需要时间需发现你新增的日志并传输到ElasticSearch中。你可以在Kibana的Filters输入框中输入log.file.path : /var/log/elk/app.log表示利用KQL来精确的查询内容,查询结果为:

【ES】ELK Stack搭建教程

日志文件中的内容对应为ElasticSearch中的message字段,我这里是因为手动修改过文件内容,所以这里查出来的message内容不太正确,相信你按我上面的步骤来操作会得到你想要的结果的。

总结

事实上通过上面的步骤就实现了收集你自己应用的日志了。

 

集成LogStash

利用ElasticSearch、Kibana、Filebeat已经搭建了一套日志系统,似乎满足了需求,但是要注意Filebeat的特点是轻量级的收集日志器,功能比较单一,并且通常会从多个渠道收集日志,比如mysql、系统日志、应用日志等等,那么如果我们想对这些日志进行统一加工的话,就需要用到LogStash。

修改配置文件

LogStash默认的配置文件是config/logstash.yml。

配置文件的基本格式是:

# This is a comment. You should use comments to describe
# parts of your configuration.
input {
  ...
}

filter {
  ...
}

output {
  ...
}

也有输入、输出,还有一个过滤器,这个过滤器就是LogStash的特别之处,也需要另外一篇博客进行详细的讲解。那么我们这里列一个简单的配置文件,文件名称为elk-conf:

# 表示监听5044端口,Filebeat将把日志数据发送给此端口
input {
  beats {
    port => 5044
  }
}

# 将接收到的日志在控制台进行输出并且传输到elasticsearch中
output {
  elasticsearch { hosts => ["localhost:9200"] }
  stdout {  }
}

先按上面的配置测试一下,在这之前需要将Filebeat中的日志数据输出配置改一下:

#-------------------------- Elasticsearch output ------------------------------
#output.elasticsearch:
  # Array of hosts to connect to.
  # hosts: ["localhost:9200"]

#----------------------------- Logstash output --------------------------------
output.logstash:
  # The Logstash hosts
  hosts: ["localhost:5044"]

改好之后可以先启动LogStash,再重启Filebeat,不然在启动Filebeat的时候会连不上5044端口而报错,使用一下命令启动LogStash:

 

bin/logstash -f config/elk-conf.yml

 

如果启动LogStash出现“Logstash stopped processing because of an error: (ArgumentError) invalid byte sequence in US-ASCII”错误,是因为配置文件的全路径中有中文,改成英文吧…

如果你是其他系统遇到了其他错误,可以在留言区进行反馈。

测试LogStash

启动LogStash成功后,我们手动改变以下app.log中的内容,为了以后讲LogStash方便大家复制以下内容到app.log文件中吧:

83.149.9.216 - - [04/Jan/2015:05:13:42 +0000] "GET /presentations/logstash-monitorama-2013/images/kibana-search.png
HTTP/1.1" 200 203023 "http://semicomplete.com/presentations/logstash-monitorama-2013/" "Mozilla/5.0 (Macintosh; Intel
Mac OS X 10_9_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1700.77 Safari/537.36"

 

正常的话会在LogStash的控制台看见该日志内容,这里就不贴图了,因为控制台打印的信息其实比较多,为什么会这么多?这个都跟LogStash有关系,这里就不多解释了。

控制台看到到了日志后,我们现在去Kibana中看看,Kibana目前所匹配的索引是filebeat*,这个匹配模式是查不到我们刚刚新增的信息的,因为现在这条日志是通过LogStash发送到ElasticSearch中的,创建的索引是logstash-2019.06.12-000001,所以我们之前在Kibana创建的Index Pattern是查不到这条日志的,我们可以在Kibana中按照上文的步骤再来创建一个Index Pattern以匹配logstash所发送的日志,创建成功后,我们回到Kibana中的Discover模块就会如下图,并且可以切换Index Pattern以查看日志,同时也能看到我们上面创建的logstash日志。

【ES】ELK Stack搭建教程

 

总结

最终的架构图如下:

【ES】ELK Stack搭建教程

 

转载请注明:数据分析 » 【ES】ELK Stack搭建教程

喜欢 (0)or分享 (0)