利用Hudi Bootstrap转化现有Hive表的parquet/orc文件为Hudi表

董可伦

已于 2022-11-18 15:26:39 修改

阅读量1.8k

点赞数 17

分类专栏： Hudi Spark 文章标签： bootstrap Hudi Spark

于 2022-10-12 16:25:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dkl12/article/details/127285342

版权

Spark 同时被 2 个专栏收录

78 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

46 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

本文详细介绍了如何使用Hudi Bootstrap将现有的Hive Parquet和ORC表转换为Hudi表，包括两种Bootstrap类型：METADATA_ONLY和FULL_RECORD。内容涵盖Bootstrap的使用方式、源码分析以及遇到的问题和解决方案。同时，文章讨论了不同类型的优缺点，以及在转化过程中可能遇到的分区字段和数据类型兼容性问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站：https://www.captainai.net/dongkelun

前言

在最开始学习Hudi源码时，就发现了Hudi有一个Bootstrap功能，但是一直没用过，通过官网文档https://hudi.apache.org/cn/docs/migration_guide/可知,它可以将现有的表件转化为Hudi表，而且有两种类型METADATA_ONLY和FULL_RECORD，但是文档并不详细，比如这两种类型的区别具体是啥，支持哪些文件类型的源表。于是带着这些疑问来学习一下它是如何使用的以及源码原理的实现，这样可以更全面的了解Hudi。

版本

Hudi 0.12.0
Spark 2.4.4/3.1.2

支持的文件类型

如题，目前只支持两种文件类型：parquet和orc,对于其他格式的Hive表，比如text就不能用Boot

了解本专栏

超级会员免费看

博客等级

码龄11年

大数据领域优质创作者

博客专家认证

172
原创

1260
点赞

2158
收藏

2万+
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: Flink 读写 Ceph S3入门学习总结

下一篇：: 写Hudi异常：‘Not an Avro data file‘ 解决方法

最新评论

QQ 截图工具独立版安装使用
AG南山: 嘶~，我可以自己提取吗？不是官方的软件怕后门
QQ 截图工具独立版安装使用
Ruci_Shenhao: 提示“相关环境初始化失败”是怎么回事呢？
QQ 截图工具独立版安装使用
董可伦: 好吧，我习惯ctrl+alt+a
QQ 截图工具独立版安装使用
YuuuuuCheng: 快捷键设置不能Shift+X
Flink用户自定义连接器（Table API Connectors）学习总结
W.u: 我调接口能获取到，flink 创建表语句也是没问题，但是我在执行select 的时候，他还是这样，用的就是你的建表语句，ip那些我就不贴了。 {"id":1,"name":"wyg"} create table http_get( id int, name string ) flink 的日志报错 Caused by: java.lang.RuntimeException: java.io.IOException: Failed to deserialize JSON '{"id":1,"name":"wyg"}'. at com.dkl.flink.connector.http.HttpSourceFunction.run(HttpSourceFunction.java:70)

大家在看

最新文章

目录

展开全部

收起

评论 20

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

董可伦 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。