资讯专栏INFORMATION COLUMN

使用prometheus operator监控envoy

sorra / 1138人阅读

摘要:集群三步安装概述应当是使用监控系统的最佳实践了,首先它一键构建整个监控系统,通过一些无侵入的手段去配置如监控数据源等故障自动恢复,高可用的告警等。。

kubernetes集群三步安装 概述

prometheus operator应当是使用监控系统的最佳实践了,首先它一键构建整个监控系统,通过一些无侵入的手段去配置如监控数据源等
故障自动恢复,高可用的告警等。。

不过对于新手使用上还是有一丢丢小门槛,本文就结合如何给envoy做监控这个例子来分享使用prometheus operator的正确姿势

至于如何写告警规则,如何配置prometheus查询语句不是本文探讨的重点,会在后续文章中给大家分享,本文着重探讨如何使用prometheus operator

prometheus operator安装

sealyun离线安装包内已经包含prometheus operator,安装完直接使用即可

配置监控数据源

原理:通过operator的CRD发现监控数据源service

启动envoy

</>复制代码

  1. apiVersion: apps/v1
  2. kind: Deployment
  3. metadata:
  4. name: envoy
  5. labels:
  6. app: envoy
  7. spec:
  8. replicas: 1
  9. selector:
  10. matchLabels:
  11. app: envoy
  12. template:
  13. metadata:
  14. labels:
  15. app: envoy
  16. spec:
  17. volumes:
  18. - hostPath: # 为了配置方便把envory配置文件挂载出来了
  19. path: /root/envoy
  20. type: DirectoryOrCreate
  21. name: envoy
  22. containers:
  23. - name: envoy
  24. volumeMounts:
  25. - mountPath: /etc/envoy
  26. name: envoy
  27. readOnly: true
  28. image: envoyproxy/envoy:latest
  29. ports:
  30. - containerPort: 10000 # 数据端口
  31. - containerPort: 9901 # 管理端口,metric是通过此端口暴露
  32. ---
  33. kind: Service
  34. apiVersion: v1
  35. metadata:
  36. name: envoy
  37. labels:
  38. app: envoy # 给service贴上标签,operator会去找这个service
  39. spec:
  40. selector:
  41. app: envoy
  42. ports:
  43. - protocol: TCP
  44. port: 80
  45. targetPort: 10000
  46. name: user
  47. - protocol: TCP # service暴露metric的端口
  48. port: 81
  49. targetPort: 9901
  50. name: metrics # 名字很重要,ServiceMonitor 会找端口名

envoy配置文件:
监听的地址一定需要修改成0.0.0.0,否则通过service获取不到metric
/root/envoy/envoy.yaml

</>复制代码

  1. admin:
  2. access_log_path: /tmp/admin_access.log
  3. address:
  4. socket_address:
  5. protocol: TCP
  6. address: 0.0.0.0 # 这里一定要改成0.0.0.0,而不能是127.0.0.1
  7. port_value: 9901
  8. static_resources:
  9. listeners:
  10. - name: listener_0
  11. address:
  12. socket_address:
  13. protocol: TCP
  14. address: 0.0.0.0
  15. port_value: 10000
  16. filter_chains:
  17. - filters:
  18. - name: envoy.http_connection_manager
  19. config:
  20. stat_prefix: ingress_http
  21. route_config:
  22. name: local_route
  23. virtual_hosts:
  24. - name: local_service
  25. domains: ["*"]
  26. routes:
  27. - match:
  28. prefix: "/"
  29. route:
  30. host_rewrite: sealyun.com
  31. cluster: service_google
  32. http_filters:
  33. - name: envoy.router
  34. clusters:
  35. - name: service_sealyun
  36. connect_timeout: 0.25s
  37. type: LOGICAL_DNS
  38. # Comment out the following line to test on v6 networks
  39. dns_lookup_family: V4_ONLY
  40. lb_policy: ROUND_ROBIN
  41. hosts:
  42. - socket_address:
  43. address: sealyun.com
  44. port_value: 443
  45. tls_context: { sni: sealyun.com }
使用ServiceMonitor

envoyServiceMonitor.yaml:

</>复制代码

  1. apiVersion: monitoring.coreos.com/v1
  2. kind: ServiceMonitor
  3. metadata:
  4. labels:
  5. app: envoy
  6. name: envoy
  7. namespace: monitoring # 这个可以与service不在一个namespace
  8. spec:
  9. endpoints:
  10. - interval: 15s
  11. port: metrics # envoy service的端口名
  12. path: /stats/prometheus # 数据源path
  13. namespaceSelector:
  14. matchNames: # envoy service所在namespace
  15. - default
  16. selector:
  17. matchLabels:
  18. app: envoy # 选择envoy service

create成功后我们就可以看到envoy的数据源了:

然后就可以看到metric了:

然后就可以在grafana上进行一些配置了,promethues相关使用不是本文讨论的对象

告警配置 alert manager配置

</>复制代码

  1. [root@dev-86-201 envoy]# kubectl get secret -n monitoring
  2. NAME TYPE DATA AGE
  3. alertmanager-main Opaque 1 27d

我们可以看到这个secrect,看下里面具体内容:

</>复制代码

  1. [root@dev-86-201 envoy]# kubectl get secret alertmanager-main -o yaml -n monitoring
  2. apiVersion: v1
  3. data:
  4. alertmanager.yaml: Imdsb2JhbCI6IAogICJyZXNvbHZlX3RpbWVvdXQiOiAiNW0iCiJyZWNlaXZlcnMiOiAKLSAibmFtZSI6ICJudWxsIgoicm91dGUiOiAKICAiZ3JvdXBfYnkiOiAKICAtICJqb2IiCiAgImdyb3VwX2ludGVydmFsIjogIjVtIgogICJncm91cF93YWl0IjogIjMwcyIKICAicmVjZWl2ZXIiOiAibnVsbCIKICAicmVwZWF0X2ludGVydmFsIjogIjEyaCIKICAicm91dGVzIjogCiAgLSAibWF0Y2giOiAKICAgICAgImFsZXJ0bmFtZSI6ICJEZWFkTWFuc1N3aXRjaCIKICAgICJyZWNlaXZlciI6ICJudWxsIg==
  5. kind: Secret

base64解码一下:

</>复制代码

  1. "global":
  2. "resolve_timeout": "5m"
  3. "receivers":
  4. - "name": "null"
  5. "route":
  6. "group_by":
  7. - "job"
  8. "group_interval": "5m"
  9. "group_wait": "30s"
  10. "receiver": "null"
  11. "repeat_interval": "12h"
  12. "routes":
  13. - "match":
  14. "alertname": "DeadMansSwitch"
  15. "receiver": "null"

所以配置alertmanager就非常简单了,就是创建一个secrect即可
如alertmanager.yaml:

</>复制代码

  1. global:
  2. smtp_smarthost: "smtp.qq.com:465"
  3. smtp_from: "474785153@qq.com"
  4. smtp_auth_username: "474785153@qq.com"
  5. smtp_auth_password: "xxx" # 这个密码是开启smtp授权后生成的,下文有说怎么配置
  6. smtp_require_tls: false
  7. route:
  8. group_by: ["alertmanager","cluster","service"]
  9. group_wait: 30s
  10. group_interval: 5m
  11. repeat_interval: 3h
  12. receiver: "fanux"
  13. routes:
  14. - receiver: "fanux"
  15. receivers:
  16. - name: "fanux"
  17. email_configs:
  18. - to: "474785153@qq.com"
  19. send_resolved: true

delete掉老的secret,根据自己的配置重新生成secret即可

</>复制代码

  1. kubectl delete secret alertmanager-main -n monitoring
  2. kubectl create secret generic alertmanager-main --from-file=alertmanager.yaml -n monitoring
邮箱配置,以QQ邮箱为例

开启smtp pop3服务

照着操作即可,后面会弹框一个授权码,配置到上面的配置文件中
然后就可以收到告警了:

告警规则配置

prometheus operator自定义PrometheusRule crd去描述告警规则

</>复制代码

  1. [root@dev-86-202 shell]# kubectl get PrometheusRule -n monitoring
  2. NAME AGE
  3. prometheus-k8s-rules 6m

直接edit这个rule即可,也可以再自己去创建个PrometheusRule

</>复制代码

  1. kubectl edit PrometheusRule prometheus-k8s-rules -n monitoring

如我们在group里加一个告警:

</>复制代码

  1. spec:
  2. groups:
  3. - name: ./example.rules
  4. rules:
  5. - alert: ExampleAlert
  6. expr: vector(1)
  7. - name: k8s.rules
  8. rules:

重启prometheuspod:

</>复制代码

  1. kubectl delete pod prometheus-k8s-0 prometheus-k8s-1 -n monitoring

然后在界面上就可以看到新加的规则:

探讨可加QQ群:98488045

公众号:

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/32814.html

相关文章

  • 使用prometheus operator监控envoy

    摘要:集群三步安装概述应当是使用监控系统的最佳实践了,首先它一键构建整个监控系统,通过一些无侵入的手段去配置如监控数据源等故障自动恢复,高可用的告警等。。 kubernetes集群三步安装 概述 prometheus operator应当是使用监控系统的最佳实践了,首先它一键构建整个监控系统,通过一些无侵入的手段去配置如监控数据源等故障自动恢复,高可用的告警等。。 不过对于新手使用上还是有一...

    Jeff 评论0 收藏0
  • 华尔街见闻基于istio的服务网格实践

    摘要:,托管于腾讯云容器平台容器编排工具。适配我们目前的服务部署在腾讯云托管,节点使用核的网络增强型机器,所有的后端服务都以部署,集群外部署高可用支持集群内服务发现,数据库以为主,消息队列采用。 距离2017年的见闻技术架构调整接近2年,随着业务线的发展,见闻技术部的项目数量、项目架构类型、基础设施规模、服务变更频率都在不断地增长,带给SRE的挑战是如何能更快地助力于开发人员更快更稳定地部署...

    stonezhu 评论0 收藏0
  • 容器监控实践—Prometheus部署方案

    摘要:同时有权限控制日志审计整体配置过期时间等功能。将成为趋势前置条件要求的版本应该是因为和支持的限制的核心思想是将的部署与它监控的对象的配置分离,做到部署与监控对象的配置分离之后,就可以轻松实现动态配置。 一.单独部署 二进制安装各版本下载地址:https://prometheus.io/download/ Docker运行 运行命令:docker run --name promet...

    GeekQiaQia 评论0 收藏0
  • 使用Envoy 作Sidecar Proxy的微服务模式-3.分布式追踪

    摘要:在第三部分中,我们将了解如何在服务网格中启用分布式跟踪。在此部署模型中,被部署为服务的在本例中为客户端。会在服务调用之间添加一些追踪,并发送到或您的跟踪提供商目前支持和。这些示例的上游服务是。 本博客是深入研究Envoy Proxy和Istio.io 以及它如何实现更优雅的方式来连接和管理微服务系列文章的一部分。 这是接下来几个部分的想法(将在发布时更新链接): 断路器(第一部分) ...

    Fundebug 评论0 收藏0
  • CNCF参与Google Summer of Code 2019!感兴趣的学生现在是加入的最佳时机

    摘要:如果你是学生,计划参加,现在是审查项目构想,并与导师开始讨论的最佳时机。和大会日期会议日程通告日期年月日会议活动举办日期年月至日和赞助方案和多元化奖学金现正接受申请和即将首次合体落地中国和购票窗口,立即购票 showImg(https://segmentfault.com/img/bVbpnJA?w=1280&h=545); Google Summer of Code(GSoC)是面向...

    wanghui 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<