pyspark 记录

最新推荐文章于 2025-05-06 10:45:06 发布

coder_oyang

最新推荐文章于 2025-05-06 10:45:06 发布

阅读量304

点赞数

分类专栏：大数据文章标签： spark

本文链接：https://blog.csdn.net/coder_oyang/article/details/111518998

版权

11 篇文章

订阅专栏

1. 读取文件

./bin/spark-submit examples/src/main/python/wordcount.py file:///home/hadoop/coder_oyang/tst #读取本地文件
./bin/spark-submit examples/src/main/python/wordcount.py file:///home/hadoop/coder_oyang/ #读取本地文件夹
./bin/spark-submit examples/src/main/python/wordcount.py file:///home/hadoop/coder_oyang/tst* #读取本地多个文件
读取集群文件，将文件路径中的 file://去掉即可

将Hadoop安装目录下面的bin目录下，hadoop.cmd、hdfs.cmd、mapred.cmd、yarn.cmd中所有call对应的行，删除前面的空格；
在yarn.cmd中，如果yarncommands中带^，如下：
set yarncommands=resourcemanager nodemanager proxyserver rmadmin version jar application ^
applicationattempt container node logs daemonlog historyserver --- 将^删除，变成一行