您现在的位置是：首页 > 其他

当前栏目

hive分区与实际分区文件不匹配导致spark读文件出错的问题解决

文件 Spark 解决分区匹配导致 hive 出错

2023-09-14 08:57:20 时间

先解释下，由于历史原因导致hive中的看到分区比hdfs中的文件夹不匹配，存在hive中分区数有，实际hdfs中无此文件夹。

spark中通过sparkSQL读取hive中的该表时，将会出现异常。

解决方案：

1. 检查该表是否是外部表，如果不是，将属性修改为外部表属性。

这里修改为外部表，目的是在删除分区时，不会将已有的数据删除。必要时，先做好备份处理。

alter table tablename set tblproperties('EXTERNAL'='TRUE');

2. 删除异常分区

这里尝试过通过drop table方式来删除表，但是发现会报错。

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:Invalid partition key & values; keys [year, month, day, hour, ], values [2018, ])

所以这里使用了删除分区。

alter table tablename drop partition(pk_year=2018);

3.使用分区修复命令重新创建分区

msck repair table tablename;

猜你喜欢

蛋白质结构预测大赛top1方案分享
1. ML605开发板测试
修改MySQL密码的四种方法（适合初学者）
MQTT协议的工作原理
【Linux】linux之如何清理磁盘空间
数据库分表算法
前端项目使用module.exports文件一定要Webpack编译吗？请问gulp可以编译这种文件吗
安卓手机便签以图片形式分享是怎么实现的?
m十字路口多功能控制交通系统,包括基于遗传算法优化的红绿灯时长模糊控制器和基于BP神经网络的车牌识别算法
史上最走心的Webpack4.0中级教程——配置之外你应该知道事
python opencv 转为灰色图片
华为云GaussDB支撑华为MetaERP系统全面替换

相关主题

安装whl文件
文件管理命令

zl程序教程

当前栏目

hive分区与实际分区文件不匹配导致spark读文件出错的问题解决

相关文章