资讯专栏INFORMATION COLUMN

TiDB 2.0 GA Release

summerpxy / 605人阅读

摘要:年月日,发布版。版本组件提供了针对上的数据使用进行分布式计算的能力。于年月在创建,同年月发布版本,而后于年月发布版,月发布版,年月发布版,月发布版,月发布版,月发版,并在年月发版。

2018 年 4 月 27 日,TiDB 发布 2.0 GA 版。相比 1.0 版本,对 MySQL 兼容性、系统稳定性、优化器和执行器做了很多改进。

TiDB

SQL 优化器

精简统计信息数据结构,减小内存占用

加快进程启动时加载统计信息速度

支持统计信息动态更新 [experimental]

优化代价模型,对代价估算更精准

使用 Count-Min Sketch 更精确地估算点查的代价

支持分析更复杂的条件,尽可能充分的使用索引

支持通过 STRAIGHT_JOIN 语法手动指定 Join 顺序

GROUP BY子句为空时使用 Stream Aggregation 算子,提升性能

支持使用索引计算 Max/Min 函数

优化关联子查询处理算法,支持将更多类型的关联子查询解关联并转化成 Left Outer Join

扩大 IndexLookupJoin 的使用范围,索引前缀匹配的场景也可以使用该算法

SQL 执行引擎

使用 Chunk 结构重构所有执行器算子,提升分析型语句执行性能,减少内存占用,显著提升 TPC-H 结果

支持 Streaming Aggregation 算子下推

优化 Insert Into Ignore 语句性能,提升 10 倍以上

优化 Insert On Duplicate Key Update 语句性能,提升 10 倍以上

下推更多的数据类型和函数到 TiKV 计算

优化 Load Data 性能,提升 10 倍以上

支持对物理算子内存使用进行统计,通过配置文件以及系统变量指定超过阈值后的处理行为

支持限制单条 SQL 语句使用内存的大小,减少程序 OOM 风险

支持在 CRUD 操作中使用隐式的行 ID

提升点查性能

Server

支持 Proxy Protocol

添加大量监控项, 优化日志

支持配置文件的合法性检测

支持 HTTP API 获取 TiDB 参数信息

使用 Batch 方式 Resolve Lock,提升垃圾回收速度

支持多线程垃圾回收

支持 TLS

兼容性

支持更多 MySQL 语法

支持配置文件修改 lower_case_table_names 系统变量,用于支持 OGG 数据同步工具

提升对 Navicat 的兼容性

Information_Schema 中支持显示建表时间

修复部分函数/表达式返回类型和 MySQL 不同的问题

提升对 JDBC 兼容性

支持更多的 SQL_MODE

DDL

优化 Add Index 的执行速度,部分场景下速度大幅度提升

Add Index 操作变更为低优先级,降低对线上业务影响

Admin Show DDL Jobs 输出更详细的 DDL 任务状态信息

支持 Admin Show DDL Job Queries JobID 查询当前正在运行的 DDL 任务的原始语句

支持 Admin Recover Index 命令,用于灾难恢复情况下修复索引数据

支持通过 Alter 语句修改 Table Options

PD

增加 Region Merge 支持,合并数据删除后产生的空 Region [experimental]

增加 Raft Learner 支持 [experimental]

调度器优化

调度器适应不同的 Region size

提升 TiKV 宕机时数据恢复的优先级和恢复速度

提升下线 TiKV 节点搬迁数据的速度

优化 TiKV 节点空间不足时的调度策略,尽可能防止空间不足时磁盘被写满

提升 balance-leader scheduler 的调度效率

减少 balance-region scheduler 调度开销

优化 hot-region scheduler 的执行效率

运维接口及配置

增加 TLS 支持

支持设置 PD leader 优先级

支持基于 label 配置属性

支持配置特定 label 的节点不调度 Region leader

支持手动 Split Region,可用于处理单 Region 热点的问题

支持打散指定 Region,用于某些情况下手动调整热点 Region 分布

增加配置参数检查规则,完善配置项的合法性较验

调试接口

增加 Drop Region 调试接口

增加枚举各个 PD health 状态的接口

统计相关

添加异常 Region 的统计

添加 Region 隔离级别的统计

添加调度相关 metrics

性能优化

PD leader 尽量与 etcd leader 保持同步,提升写入性能

优化 Region heartbeat 性能,现可支持超过 100 万 Region

TiKV

功能

保护关键配置,防止错误修改

支持 Region Merge [experimental]

添加 Raw DeleteRange API

添加 GetMetric API

添加 Raw Batch PutRaw Batch GetRaw Batch DeleteRaw Batch Scan

给 Raw KV API 增加 Column Family 参数,能对特定 Column Family 进行操作

Coprocessor 支持 streaming 模式,支持 streaming 聚合

支持配置 Coprocessor 请求的超时时间

心跳包携带时间戳

支持在线修改 RocksDB 的一些参数,包括 block-cache-size 大小等

支持配置 Coprocessor 遇到某些错误时的行为

支持以导数据模式启动,减少导数据过程中的写放大

支持手动对 region 进行对半 split

完善数据修复工具 tikv-ctl

Coprocessor 返回更多的统计信息,以便指导 TiDB 的行为

支持 ImportSST API,可以用于 SST 文件导入 [experimental]

新增 TiKV Importer 二进制,与 TiDB Lightning 集成用于快速导入数据 [experimental]

性能

使用 ReadPool 优化读性能,raw_get/get/batch_get 提升 30%

提升 metrics 的性能

Raft snapshot 处理完之后立即通知 PD,加快调度速度

解决 RocksDB 刷盘导致性能抖动问题

提升在数据删除之后的空间回收

加速启动过程中的垃圾清理过程

使用 DeleteFilesInRanges 减少副本迁移时 I/O 开销

稳定性

解决在 PD leader 发送切换的情况下 gRPC call 不返回问题

解决由于 snapshot 导致下线节点慢的问题

限制搬移副本临时占用的空间大小

如果有 Region 长时间没有 Leader,进行上报

根据 compaction 事件及时更新统计的 Region size

限制单次 scan lock 请求的扫描的数据量,防止超时

限制接收 snapshot 过程中的内存占用,防止 OOM

提升 CI test 的速度

解决由于 snapshot 太多导致的 OOM 问题

配置 gRPC 的 keepalive 参数

修复 Region 增多容易 OOM 的问题

TiSpark

TiSpark 使用独立的版本号,现为 1.0 GA。TiSpark 1.0 版本组件提供了针对 TiDB 上的数据使用 Apache Spark 进行分布式计算的能力。

提供了针对 TiKV 读取的 gRPC 通信框架

提供了对 TiKV 组件数据的和通信协议部分的编码解码

提供了计算下推功能,包含

聚合下推

谓词下推

TopN 下推

Limit 下推

提供了索引相关支持

谓词转化聚簇索引范围

谓词转化次级索引

Index Only 查询优化

运行时索引退化扫表优化

提供了基于代价优化

统计信息支持

索引选择

广播表代价估算

多种 Spark Interface 的支持

Spark Shell 支持

ThriftServer/JDBC 支持

Spark-SQL 交互支持

PySpark Shell 支持

SparkR 支持

如今,在社区和 PingCAP 技术团队的共同努力下,TiDB 2.0 GA 版已发布,在此感谢社区小伙伴们长久以来的参与和贡献。

作为世界级开源的分布式关系型数据库,TiDB 灵感来自于 Google Spanner/F1,具备『分布式强一致性事务、在线弹性水平扩展、故障自恢复的高可用、跨数据中心多活』等核心特性。TiDB 于 2015 年 5 月在 GitHub 创建,同年 12 月发布 Alpha 版本,而后于 2016 年 6 月发布 Beta 版,12 月发布 RC1 版, 2017 年 3 月发布 RC2 版,6 月发布 RC3 版,8 月发布 RC4 版,10 月发版 TiDB 1.0,并在 2018 年 3 月发版 2.0 RC1。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/62456.html

相关文章

  • TiDB 2.0 GA Release

    摘要:年月日,发布版。版本组件提供了针对上的数据使用进行分布式计算的能力。于年月在创建,同年月发布版本,而后于年月发布版,月发布版,年月发布版,月发布版,月发布版,月发版,并在年月发版。 2018 年 4 月 27 日,TiDB 发布 2.0 GA 版。相比 1.0 版本,对 MySQL 兼容性、系统稳定性、优化器和执行器做了很多改进。 TiDB SQL 优化器 精简统计信息数据结构,...

    刘福 评论0 收藏0
  • TiDB 2.0 GA Release

    摘要:年月日,发布版。版本组件提供了针对上的数据使用进行分布式计算的能力。于年月在创建,同年月发布版本,而后于年月发布版,月发布版,年月发布版,月发布版,月发布版,月发版,并在年月发版。 2018 年 4 月 27 日,TiDB 发布 2.0 GA 版。相比 1.0 版本,对 MySQL 兼容性、系统稳定性、优化器和执行器做了很多改进。 TiDB SQL 优化器 精简统计信息数据结构,...

    weij 评论0 收藏0
  • TiDB 2.1 GA Release Notes

    摘要:年月日,发布版。相比版本,该版本对系统稳定性性能兼容性易用性做了大量改进。 2018 年 11 月 30 日,TiDB 发布 2.1 GA 版。相比 2.0 版本,该版本对系统稳定性、性能、兼容性、易用性做了大量改进。 TiDB SQL 优化器 优化 Index Join 选择范围,提升执行性能 优化 Index Join 外表选择,使用估算的行数较少的表作为外表 扩大 Join H...

    JerryZou 评论0 收藏0
  • TiDB 2.1 GA Release Notes

    摘要:年月日,发布版。相比版本,该版本对系统稳定性性能兼容性易用性做了大量改进。 2018 年 11 月 30 日,TiDB 发布 2.1 GA 版。相比 2.0 版本,该版本对系统稳定性、性能、兼容性、易用性做了大量改进。 TiDB SQL 优化器 优化 Index Join 选择范围,提升执行性能 优化 Index Join 外表选择,使用估算的行数较少的表作为外表 扩大 Join H...

    fanux 评论0 收藏0
  • 详解 | TiDB 2.0 GA is here!

    摘要:经过半年时间,个版本,今天版本正式发布。目前已经有大量的用户在线上使用,这些用户的数据量在不断增加业务也在不断演进。比如尽可能简化部署升级扩容方式,尽可能容易的定位系统中出现的异常状态。同时功能也更加丰富,支持自动部署组件支持启用。 去年十月份的时候,我们发布了 TiDB 1.0 版本,为此我们日夜兼程奋斗了两年半时间,我们认为 1.0 版本达到了可在生产环境中使用的程度。在接下来的六...

    Lycheeee 评论0 收藏0

发表评论

0条评论

summerpxy

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<