讲师介绍:钟华,滴滴资深软件开发工程师。
本次分享钟华老师介绍了基于 Hadoop 快速构建 Elasticsearch 索引的核心设计及挑战,包括:
最后与大家讨论了如何获得和 DataX 相同的使用体验,即在不关闭索引的前提下,将 Lucene 文件加入到索引中。接下来我们会开发数据导入相关的辅助工具,降低业务接入的复杂度,从而提高整体的数据导入效率。
讲师介绍:张金鹏,TiKV engine team tech-leader。
本次 talk 我们回顾了 3.0 的一些 feature 在实际场景中的效果,比如 Titan 在大 value 情况下对于延迟的明显降低,以及 hibernate region 能在大数据量的情况下明显降低了 CPU 开销。
同时我们带大家浏览了 4.0 的多个新特性,包括:
通过 key visualizer 直观的看数据的热点分布情况。
表达式索引的支持。
通过 SQL plan management 自动纠正错误的索引。
PD 弹性调度,可以针对不同的表进行单独的调度。
通过 follower replication 降低跨数据中心的数据流量。
跳过 SQL 层,基于 TiKV 的快速 backup 和 restore 功能。