
linux
busy_li
这个作者很懒,什么都没留下…
展开
-
数仓面试经
1.内部表和外部表的区别? 2.MapReduce的工作流程? 3.hive的数据倾斜怎么解决? 4.分区表和分桶表的区别? 5.数仓是怎么建模的? 6.order by和sort by的区别? 7.hive的动态分区怎么实现? 8.有没有实现过UDF函数,在什么场景用到的? 9.mapreduce过程中map大小是多少? 10.hive的优化参数有哪些,举例说明用途? 11.sql题 连续3天登录的用户?(经典sql题) 12.left join时候大表应该放在左边还是右边? 13.union和 unio原创 2021-09-23 11:29:21 · 254 阅读 · 0 评论 -
linux过滤切分命令
设置关键字颜色转换例:alias grep=‘grep --color=auto’ grep命令: grep ‘root’ filename过滤文件中包含root的行 grep -n ‘root’ filename过滤文件中包含root的行并且包含行号 grep -ni ‘root’ filename过滤文件中包含root的行并且包含行号(不区分大小写) grep -niv ‘root’ filename过滤文件中不包含root的行并且包含行号(不区分大小写) grep -n ‘^root’ filen原创 2021-09-14 10:55:15 · 277 阅读 · 0 评论 -
hive表数据误删恢复
hive表或者表数据被误删,都会到垃圾站,可以到垃圾站中去恢复 一般的都会在这个路径下,可能会有不同 /user/hadoop/.Trash 只需要找到被删表名,将下面数据移到hive表对应的hdfs目录即可 如果说没找到,可能是因集群配置中没有开启 ...原创 2021-08-17 16:09:24 · 309 阅读 · 0 评论