Kafka Agent 设计 - 可靠事件记录不是一件简单的事情

fancyLuo 发布于2019-07-16 14:35 / 1893人阅读

摘要：用编写，解决事件快速同时可靠入的问题。绿色表示可能是不同的线程，蓝色表示共享的资源。产生事件，生成值。事件写入磁盘队列，移动写入的指向位置。简单来说就是有一些业务希望自己业务本身成功了，事件必须可靠记录，同时基于事件的后续处理必须发生。

用 golang 编写，解决事件快速同时可靠入Kafka的问题。绿色表示goroutine（可能是不同的线程），蓝色表示共享的资源。所有对蓝色资源的访问需要加锁。磁盘队列使用内存映射文件实现ring buffer。kafka agent启动的时候有一个bootstrap的broker列表，同时发送的时候会与每个相关的broker维护一个到多个连接。但是kafka agent不读取也不监听zookeeper。

收益

业务方不需要等待kafka响应就可以继续干别的去（低延迟）

基于磁盘的队列（高可靠）

消息按partition排队后组大包并压缩发送（高吞吐）

因为发送到kafka之前业务侧已经拿到响应并返回，kafka的request/response可以简单地一去一回，不用基于corelation id回调通知业务侧（简单设计）

缺点是业务侧无法知道写入的kafka offset。

生产过程

业务方和 Kafka Agent 可以在同一个进程内，也可以通过本地unix domain socket沟通。如果是在同进程内，事件直接在业务方的 goroutine 内产生并入磁盘队列。如果是在不同进程内，事件通过本地网络请求转发，由kafka agent代为入队列。入队列成功之后有返回，业务侧接到返回则认为事件已经可靠保存，Eventually会进入到Kafka中。

产生事件，生成hash值。查询 queue registry 获得topic的partition数量。根据hash值计算落到parition号。根据topic和partition找到对应的磁盘队列。

如果没有对应的磁盘队列，则新建，并保存回 queue registry。如果没有对应 topic 的 metadata 则需要查询并保存回 queue registry。

事件写入磁盘队列，移动写入offset的指向位置。如果写入超过读取速度，则覆盖（丢弃掉旧的event）。

返回业务侧，告知已经可靠写入

异常流程

没有topic的metadata

没有对应的queue

topic的partition数量可能增加，需要定时刷新

写入会超过读取的速度

写入超过读取速度的时候，读取可能正在进行中

发送过程

每个队列有一个对应的goroutine负责发送到kafka。

定时唤醒发送goroutine，从自己负责的queue里读取一批事件（只会对应一个topic的一个partition，因为queue是对应topic和partition创建的）。

当前goroutine里如果没有缓存对应的broker（parition的leader）的connection pool，则从全局连接池里拿一个pool。从pool里借一个conn。

如果pool不存在则新建pool。

发送消息到kafka broker，并同步等待其返回。然后归还connection到pool里。

此时消息已经可靠写入kafka，移动读取的offset。

异常流程

partition对应的broker还未知

broker对应的pool还未创建

从broker里取得的connection已经损坏

写入时broker告知leader已经改变

移动offset的时候写入已经溢出

Reliable Event Logging

很多时候我们都希望可靠地记录事件，这些事件处理大致分为两类

日志监控

记录监控指标，用于告警

记录原始日志，用于定位问题

记录原始事件，用于离线统计分析

业务事件

离线计算发放奖励

触发一系列周边系统的动作

日志监控类的要求是迅速量大，可以丢个别的日志。业务事件类的要求是一条也不能丢，否则业务方要引入另外一个队列做离线对账（这队列不还是logging么，一般是业务自己的主数据库来承担）。业务事件的模式不能依靠上游来重试，因为主业务流程已经完成了，事件的写入和接下来的处理不应该来决定业务操作本身的成败。简单来说就是有一些业务希望自己业务本身成功了，事件必须可靠记录，同时基于事件的后续处理必须发生。

现在对kafka的使用方式，主要有两种

kafka producer => kafka，实现方式是内存做buffer，然后批量写入

log file => 日志采集 => kafka 用日志文件做缓冲

两种方式都不够完美，都无法满足使用方的要求。日志方式的问题是使用麻烦，而且性能开销大。直接用producer的方式几乎无持久化做缓冲，大部分时候就是靠内存buffer活着（除非能够忍受直接写远程kafka的延迟），根本没有持久化保证可靠性。

所以事实上目前基于kafka的应用架构里都无法把kafka做为一个可靠存储来用，不是因为kafka本身不可靠，而是做到不拖慢业务的同时可靠入库并不容易。或者讲究着把一个不可靠的data pipeline当作可靠的来用。

More on this: http://www.slideshare.net/JiangjieQin/no-data-loss-pipeline-with-apache-kafka-49753844

超融合服务器混合云事件记录数据分析做的事情数据分析每天要做的事情 php设计浏览记录表

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/33819.html

Structured Logging 需要更好的基础设施支持

摘要：存在的主要问题就是现在的设置是用非结构化日志来支持结构化日志的需求。但是目前还没有特别靠谱的方案来保证这条路径和第一种方式一样可靠。使用方需要在这两种模式之间进行选择说明现在的基础设施还不够完善。而且内部是以而不是来表示数据。 English Version: https://taowen.gitbooks.io/tsdb/content/indexing/indexing.html ...

张春雷 2019-07-16 14:58 评论0 收藏0
MySQL开源数据传输中间件架构设计实践

摘要：元数据信息保存在分布式一致性存储中，如果某工作节点或进程挂了，工作任务会转移至其他进程继续之前的断点处理数据同步，不影响服务连续性。角色主要负责元数据信息存储，任务的接收和分发，节点健康状态检测故障转移。本文根据洪斌10月27日在「3306π」技术 Meetup - 武汉站现场演讲内容整理而成。 showImg(https://segmentfault.com/img/bVbjdVD...

henry14 2019-07-31 18:42 评论0 收藏0
美图大数据平台架构实践

摘要：本文系美图互联网技术沙龙第期嘉宾分享内容，公众号后台回复美图大数据平台获取。美图数据平台整体架构如图所示是我们数据平台的整体架构。接下来会重点介绍到以及数据开放这两个阶段我们平台的实践以及优化思路。本文系美图互联网技术沙龙第 11 期嘉宾分享内容，公众号后台回复「美图大数据平台」获取 PPT。 showImg(https://segmentfault.com/img/bVbfJy9?...

canopus4u 2019-05-28 18:51 评论0 收藏0
Kafka 文档（介绍）

摘要：集群可以持久地保存所有已发布的记录无论它们是否被消费并使用可配置的保留期。有关这些保证的更多细节将在文档的设计部分中给出。与传统的消息传递系统相比，也有更强的顺序保证。这是通过将主题中的分区分配给消费者组中的消费者来实介绍 Apache Kafka®是一个分布式流平台，这到底是什么意思？流平台有三个关键功能：发布和订阅记录流，类似于消息队列或企业消息传递系统以容错持久的方式存...

syoya 2019-07-16 14:45 评论0 收藏0
后端好书阅读与推荐（续五）

摘要：实际使用的是后两者持久化分为和。技术内幕技术内幕豆瓣通过前面这本书我们已经知道怎么用比较好了，现在我们来看看的实现原理。亮点采用单进程多线程模式。后端好书阅读与推荐系列文章：后端好书阅读与推荐后端好书阅读与推荐（续）后端好书阅读与推荐（续二）后端好书阅读与推荐（续三）后端好书阅读与推荐（续四）后端好书阅读与推荐（续五） Redis设计与实现 Redis设计与实现 (豆瓣): http...

jzzlee 2019-07-25 12:20 评论0 收藏0