使用开源工具fluentd-pilot收集容器日志

Dionysus_go 发布于2019-06-28 16:12 / 1684人阅读

摘要：来自用户的最佳实践分享，如何用阿里开源的日志收集工具收集机器上所有应用日志。具有如下特性一个多带带的进程收集机器上所有容器的日志。无论是强大的阿里云日志服务，还是比较流行的组合，甚至是，都能把日志投递到正确的地点。

来自用户的最佳实践分享，如何用阿里开源的Docker日志收集工具fluentd-pilot收集机器上所有Docker应用日志。

fluentd-pilot简介

fluentd-pilot是阿里开源的docker日志收集工具，Github项目地址。你可以在每台机器上部署一个fluentd-pilot实例，就可以收集机器上所有Docker应用日志。

fluentd-pilot 具有如下特性：

一个多带带的 fluentd 进程收集机器上所有容器的日志。不需要为每个容器启动一个 fluentd 进程。

支持文件日志和 stdout。docker log dirver 亦或 logspout 只能处理 stdout，fluentd-pilot 不仅支持收集 stdout 日志，还可以收集文件日志。

声明式配置。当您的容器有日志要收集，只要通过 label 声明要收集的日志文件的路径，无需改动其他任何配置，fluentd-pilot 就会自动收集新容器的日志。

支持多种日志存储方式。无论是强大的阿里云日志服务，还是比较流行的 elasticsearch 组合，甚至是 graylog，fluentd-pilot 都能把日志投递到正确的地点。

rancher使用fluentd-pilot收集日志

我们既然要用fluentd-pilot，就得先把它启动起来。还要有一个日志系统，日志要集中收集，必然要有一个中间服务去收集和存储，所以要先把这种东西准备好。Rancher中我们要如何做？如图，首先我们选择Rancher的应用商店中的Elasticsearch和Kibana。版本没有要求，下面使用Elasticsearch2.X和Kibana4。

其次在RancherAgent主机上面部署一个fluentd-pilot容器，然后在容器里面启动的时候，我们要声明容器的日志信息，fluentd-pilot会自动感知所有容器的配置。每次启动容器或者删除容器的时候，它能够看得到，当看到容器有新容器产生之后，它就会自动给新容器按照你的配置生成对应的配置文件，然后去采集，最后采集回来的日志同样也会根据配置发送到后端存储里面去，这里面后端主要指的elasticsearch或者是SLS这样的系统，接下来你可以在这个系统上面用一些工具来查询等等。

可根据实际情况，在每台Agent定义主机标签,通过主机标签在每台RancherAgent主机上跑一个pilot容器。用这个命令来部署，其实现在它是一个标准的Docker镜像，内部支持一些后端存储，可以通过环境变量来指定日志放到哪儿去，这样的配置方式会把所有的收集到的日志全部都发送到elasticsearch里面去，当然两个挂载是需要的，因为它连接Docker，要感知到Docker里面所有容器的变化，它要通过这种方式来访问宿主机的一些信息。在Rancher环境下使用以下docker-compose.yml 应用---->添加应用，在可选docker-compose.yml中添加一下内容。

version: "2"
services:
  pilot:
    image: registry.cn-hangzhou.aliyuncs.com/acs-sample/fluentd-pilot:0.1
    environment:
      ELASTICSEARCH_HOST: elasticsearch
      ELASTICSEARCH_PORT: "9200"
      FLUENTD_OUTPUT: elasticsearch
    external_links:
    - es-cluster/es-master:elasticsearch
    volumes:
    - /var/run/docker.sock:/var/run/docker.sock
    - /:/host
    labels:
      aliyun.global: "true"

配置好之后启动自己的应用（例子:tomcat），我们看应用上面要收集的日志，我该在上面做什么样的声明？关键的配置有两个，一是label catalina，声明的是要收集容器的日志为什么格式（标准格式等，也可以是文件。），所有的名字都可以；二是声明access，这也是个名字，都可以用你喜欢的名字。这样一个路径的地址，当你通过这样的配置来去启动fluentd-pilot容器之后，它就能够感觉到这样一个容器的启动事件，它会去看容器的配置是什么，要收集这个目录下面的文件日志，然后告诉fluentd-pilot去中心配置并且去采集，这里还需要一个卷，实际上跟Logs目录是一致的，在容器外面实际上没有一种通用的方式能够获取到容器里面的文件，所有我们主动把目录从宿主机上挂载进来，这样就可以在宿主机上看到目录下面所有的东西。

当你通过部署之后，他会自己在elasticsearch创建索引，就可以在elasticsearch的kopf上面看到会生成两个东西，都是自动创建好的，不用管一些配置，你唯一要做的事是什么呢？就可以在kibana上创建日志index pattern了。然后到日志搜索界面，可以看到从哪过来的，这条日志的内容是什么，这些信息都已经很快的出现了。

Lable说明

启动tomcat的时候，我们声明了这样下面两个，告诉fluentd-pilot这个容器的日志位置。

aliyun.logs.tomcat1-access   /opt/apache-tomcat-8.0.14/logs/localhost_access_log.*.txt 
aliyun.logs.catalina   stdout

你还可以在应用容器上添加更多的标签

aliyun.logs.$name = $path

变量name是日志名称，具体指随便是什么，你高兴就好。只能包含0-9a-zA-Z_和-

变量path是要收集的日志路径，必须具体到文件，不能只写目录。文件名部分可以使用通配符。/var/log/he.log和/var/log/*.log都是正确的值，但/var/log不行，不能只写到目录。stdout是一个特殊值，表示标准输出

aliyun.logs.$name.format，日志格式，目前支持

none 无格式纯文本

json: json格式，每行一个完整的json字符串

csv: csv格式

aliyun.logs.$name.tags: 上报日志的时候，额外增加的字段，格式为k1=v1,k2=v2，每个key-value之间使用逗号分隔，例如

aliyun.logs.access.tags="name=hello,stage=test"，上报到存储的日志里就会出现name字段和stage字段

如果使用elasticsearch作为日志存储，target这个tag具有特殊含义，表示elasticsearch里对应的index

作者简介

翟坤，随行付支付有限公司资深运维工程师。
本文版权归作者所有，转载请后台留言。

云服务器 GPU云服务器日志收集、集群日志收集 elk日志收集 kafka 日志收集

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/27181.html

为容器安全苦恼？这份清单整理了27种容器安全工具

摘要：安全基准测试工具互联网安全中心为容器安全提供了指导方针，这一方针已被和类似的安全基准工具所采用。该容器安全工具可以利用机器学习提供自适应威胁保护这是一个可以扫描容器镜像的托管安全解决方案，它甚至可以允许企业在它们的环境内执行安全策略。在Docker容器技术兴起的初期，对于许多企业而言，容器安全问题一直是他们在生产环境中采用Docker的一大障碍。然而，在过去的一年中，许多开源项目、初...

cyixlq 2019-06-28 16:19 评论0 收藏0
宜信开源|详解PaaS平台LAIN的功能和架构

摘要：是宜信公司大数据创新中心开发的开源平台。为宜信大数据创新中心各个团队提供了统一的测试和生产环境，简化了服务的部署与上线流程，也降低了运维人员对系统管理的复杂度。基于容器技术，面向多样化的技术栈，并且天然隔离系统和应用的依赖。 LAIN是宜信公司大数据创新中心开发的开源PaaS平台。在金融的场景下，LAIN 是为解放各个团队和业务线的生产力而设计的一个云平台。LAIN 为宜信大数据创新中...

mist14 2019-06-28 17:17 评论0 收藏0
数人云工程师手记 | 容器日志管理实践

摘要：容器内文件日志平台支持的文件存储是，避免了许多复杂环境的处理。以上是数人云在实践容器日志系统过程中遇到的问题，更高层次的应用包括容器日志分析等，还有待继续挖掘和填坑，欢迎大家提出建议，一起交流。业务平台每天产生大量日志数据，为了实现数据分析，需要将生产服务器上的所有日志收集后进行大数据分析处理，Docker提供了日志驱动，然而并不能满足不同场景需求，本次将结合实例分享日志采集、存储以...

saucxs 2019-06-28 15:35 评论0 收藏0
盘点那些你可能错过的CNCF优秀开源项目

摘要：自那以后，已经增加了个开源项目。该项目由监管，于年初加入。但是，指的是谷歌实现的远程程序调用，它利用了和协议缓冲区。事实上，来自的流行键值存储和谷歌自己的都是最后一个值得关注的项目是也称为，一个容器运行时。自2015年成立以来，云原生计算基金会(CNCF)已经成为开源生态系统中最重要的推动者之一，特别是当涉及到影响容器和其他云原生技术的工具时。CNCF成立的目的是促进和组织与大型行业...

GraphQuery 2019-06-28 10:55 评论0 收藏0