孙若曦
TiDB计算引擎技术负责人
分布式数据库TiDB计算引擎技术负责人,十余年C++ 开发经验,专注于数据库内核、并行计算、GPU 等领域。Apache Arrow开源项目Committer,曾担任NVIDIA GPU架构负责人、星环科技SQL on Hadoop团队负责人。
演讲主题
TiDB计算引擎Pipeline Model:实现数据处理的高效率与高可用性
在这个演讲中,我们将深入探讨TiDB计算引擎TiFlash中的Pipeline Model的架构与实现。TiFlash是一种列式存储引擎,旨在提高TiDB生态系统中分析查询的速度和效率。Pipeline Model是TiFlash的核心组件之一,它以流水线的方式来组织和调度查询任务的执行,使得数据处理更加高效,查询响应更加迅速。 我们将首先介绍Pipeline Model的基本概念,包括其设计理念和主要组成部分。随后,详细解析这一模型如何在TiFlash中实现,包括数据流的处理机制和执行查询的具体过程,以及它如何支持大规模并行计算。 通过本次演讲,参与者不仅能够获得对TiFlash Pipeline Model深入的理解,还能洞察其在实际应用中如何提升数据分析的性能和效率。这将对数据库管理员、数据分析师及对分布式计算感兴趣的专业人士提供极大的帮助和启发。 大纲: 一、TiFlash介绍 二、计算任务的组织与调度 三、Pipeline Model的设计与实现 1.CPU利用率 2.任务调度 3.错误处理