Hudi 1.0 新功能预览 01 Apache Hudi 简介 Hudi 是一个高效的事务型数据湖仓平台,其核心特色是一个开放性的表格式定义和一套全面的事务数据库核心层。这一核心层不仅支持索引功能,还能高效地处理并发事务,并具备强大的变更数据捕获能力。在数据管道中,Hudi 能够从上游数据源如 Kafka 接收数据,并利用 Spark 和 Flink 等执行引擎进行数据导入与处理。平台还提供自动文件大小调整、增量处理和变更捕 数据运维 2024-04-26 法医