mapreduce读写hbase代码转成spark时，mapper方法中context.write（key，value）在循环内部，该如何转成spark的RDD？

main方法如下：

Mapper类如下：

Reducer类如下：

改后的spark代码如下：

现在需要将dataRDD写入hbase，该如何处理呢？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
明夜再说 2021-10-29 16:17
关注
最简单的方法就是用flatmap铺平拆出row来然后一条一条put进去，追求性能就直接写进hdfs里的hbase对应表的目录下
另外spark的结构就别套MapReduce的代码了

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

有kerberos认证hbase在spark环境下的使用
2018-04-19 10:51

ahbbwangpei的博客 hadoop中计算框架MapReduce中存储到有kerberos的hdfs，由于其内部yarn进行了认证故不需要进行相关的操作，可直接进行读写操作。spark使用有kerberos认证的hbase是一个既麻烦又简单的问题，麻烦的方面是：中文的网站...
HBase与MapReduce深度整合,轻松实现海量数据分析
2024-05-28 01:26

AI天才研究院的博客 HBase与MapReduce深度整合,轻松实现海量数据分析作者：禅与计算机程序设计艺术 1. 背景介绍随着大数据时代的到来,企业需要处理和分析的数据量呈爆炸式增长。传统的关系型数据库已经无法满足海量数据存储和实时查询...
郑轻软工大数据实验（手把手教你入门Hadoop、hbase、spark）
2023-12-08 00:25

zslj小凡的博客轻大软工21大数据实验编程实现以下指定功能，并利用Hadoop提供的Shell命令完成相同任务利用MapReduce编程实现以下功能编程实现以下功能，并用Hadoop提供的HBase Shell命令完成相同任务。
hadoop、hbase、hive、spark分布式系统架构原理
2018-05-15 11:22

腾讯AI架构师的博客机器学习、数据挖掘等各种大数据处理都离不开各种开源分布式系统，hadoop用户分布式存储和map-reduce计算，spark用于分布式机器学习，hive是分布式数据库，hbase是分布式kv系统，看似互不相关的他们却都是基于相同的...
Spark大数据处理讲课笔记2.1 初识Spark
2023-03-20 11:33

酒城译痴无心剑的博客 1. 了解什么是Spark计算框架； 2. 了解Spark计算框架的特点； 3. 了解Spark计算框架的应用场景； 4. 理解Spark框架与Hadoop框架的对比
Spark生态圈
2024-12-27 22:48

沙滩de流沙的博客将多份数据进行关联是数据处理过程中非常普遍的用法，不过在分布式计算系统中，这个问题往往会变的非常麻烦，因为框架提供的 join 操作一般会将所有数据根据 key 发送到所有的 reduce 分区中去，也就是 shuffle 的...
Spark系列之Spark的RDD详解
2022-11-28 22:00

落叶飘雪2014的博客 Spark系列之Spark的RDD详解
Spark面试精选题（03）
2019-04-11 09:49

中琦2513的博客答：spark通过这个参数spark.deploy.zookeeper.dir指定master元数据在zookeeper中保存的位置，包括Worker，Driver和Application以及Executors。standby节点要从zk中，获得元数据信息，恢复集群运行状态，才能对外...
11、spark
2021-08-28 17:40

qq_44304788的博客第十二（十一）天：spark一、spark（一）介绍（Ⅰ）spark起源（Ⅱ）Spark的技术背景（二）spark vs MapReduce（Ⅰ）MapReduce存在的问题（Ⅱ）Spark的优势（Ⅲ）Hadoop 的 MapReduce 为什么不使用内存存储？...
读取Hive中的数据写入Hbase
2020-04-15 18:07

꧁꫞ND꫞꧂的博客 1.首先将hive中的数据使用一定的分隔符生成对应的text文件，然后放到hdfs public class LngLatOrder { public static void main(String[] args) { String table = args[0]; String date = PersonUtils....
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月27日

mapreduce读写hbase代码转成spark时，mapper方法中context.write（key，value）在循环内部，该如何转成spark的RDD？

1条回答 默认 最新

问题事件

1条回答默认最新