您现在的位置是：首页 > 其他

当前栏目

MapReduce关于类型转换报错记录

2023-02-26 09:48:05 时间

MapReduce关于类型转换报错记录

0. 写在前面
1. 程序代码
2.参考

0. 写在前面

实验环境：Ubuntu Kylin16.04
Hadoop版本：2.7.2
IDE：Eclipse3.8

1. 程序代码

❝Mapper端 ❞

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

public static class WordCountMapper extends Mapper<LongWritable, Text, Text, IntWritable> {
	@Override
	protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
		String[] strs = value.toString().split(" ");
		for (String str : strs) {
			context.write(new Text(str), new IntWritable(1));
		}
	}
}

❝Reducer端 ❞

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

public static class WordCountReduce extends Reducer<Text, IntWritable, Text, IntWritable> {
	
	@Override
	protected void reduce(Text key, Iterable<IntWritable> values, Context context)
			throws IOException, InterruptedException {

		int sum = 0;
		for (IntWritable val : values) {
			System.out.println("<" + key + "," + val + ">");
			sum += val.get();
		}
		context.write(key, new IntWritable(sum));
	}
}

❝Driver端 ❞

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;


public class TxtCntDemo {
	
	public static void main(String[] args) throws Exception {
		args = new String[] { "/input", "/output"};

		Configuration conf = new Configuration();


		Job job = Job.getInstance(conf);/
		job.setJarByClass(TxtCntDemo.class);

		job.setOutputKeyClass(Text.class);
		job.setOutputValueClass(IntWritable.class);

		job.setMapperClass(WordCountMap.class);
		job.setReducerClass(WordCountReduce.class);
		job.setPartitionerClass(MyPartitioner.class);
		job.setNumReduceTasks(4);
		FileInputFormat.addInputPath(job, new Path(args[0]));
		FileOutputFormat.setOutputPath(job, new Path(args[1]));

		job.waitForCompletion(true);

	}
}

❝「错误描述」 ❞

java.lang.Exception: java.lang.ClassCastException: org.apache.hadoop.io.Text cannot be cast to org.apache.hadoop.io.IntWritable

java.lang.Exception: java.lang.ClassCastException: org.apache.hadoop.io.LongWritable cannot be cast to org.apache.hadoop.io.IntWritable

mapper、reducer、driver分开成3个文件，报Text不可转换成IntWritable，还有LongWritable不能转换成IntWritable的错误

❝关于第二个错误：Mapper端执行时，key的默认输入是LongWritable类型，把LongWritable类型强行转换成Text类型自然就Error了。 ❞

java.lang.Exception: java.lang.ClassCastException: org.apache.hadoop.io.Text cannot be cast to org.apache.hadoop.io.IntWritable
	at org.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:462)
	at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:522)
Caused by: java.lang.ClassCastException: org.apache.hadoop.io.Text cannot be cast to org.apache.hadoop.io.IntWritable
	at org.apache.hadoop.mapred.MapTask$NewOutputCollector.write(MapTask.java:715)
	at org.apache.hadoop.mapreduce.task.TaskInputOutputContextImpl.write(TaskInputOutputContextImpl.java:89)
	at org.apache.hadoop.mapreduce.lib.map.WrappedMapper$Context.write(WrappedMapper.java:112)
	at cn.mr.WordCountMapper.map(WordCountMapper.java:15)
	at cn.mr.WordCountMapper.map(WordCountMapper.java:1)
	at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:146)
	at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:787)
	at org.apache.hadoop.mapred.MapTask.run(MapTask.java:341)
	at org.apache.hadoop.mapred.LocalJobRunner$Job$MapTaskRunnable.run(LocalJobRunner.java:243)
	at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
	at java.util.concurrent.FutureTask.run(FutureTask.java:266)
	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
	at java.lang.Thread.run(Thread.java:748)

❝但是同样的代码mapper、reducer、driver直接放在一个文件下就顺利执行MR得出结果 ❞

这个属实给我整不会了 ??

2. 参考

❝https://www.cnblogs.com/1130136248wlxk/p/5010489.html ❞
❝记录一下 ❞

猜你喜欢

鸿蒙解决DevEco Studio无法识别设备问题
提升Web输入体验！JS 如何自动配对标点符号？
2022 年，Babel vs TypeScript，谁更适合代码编译
大数据技术在金融行业的应用与安全风险管理
升至 Android 13 之后，微软预告 Windows 11 安卓子系统 WSA 会支持 DRM 保护的高分辨率视频流
在 Linux 上试试这个基于 Python 的文件管理器
如何统一前端项目的 Node 版本和包管理器？
Denodo在2022年Gartner®数据集成工具魔力象限报告中连续第三年被评为领导者
为什么你做的数据监控分析，总被人Diss
Windows 11 和 Ubuntu 谁更能激发 AMD Radeon 7900XTX 显卡的性能？实测告诉你
Vue3 中还处在实验性阶段 Suspense 是个啥？
数据分析，如何给出有价值的建议
在 Linux 命令行中格式化输出 json
职场人别再乱用Emoji表情了，小心被起诉…
十种常用的数据分析思路
无栈协程：用户态的Linux进程调度
什么是数据智能，为什么它很重要？
openEuler委员会主席江大勇：跨越生态拐点欧拉逐梦新征程
一文读懂：什么是合成数据？
Spring Boot 国际化踩坑指南

zl程序教程

当前栏目

MapReduce关于类型转换报错记录

MapReduce关于类型转换报错记录

0. 写在前面

1. 程序代码

2. 参考

相关文章