您现在的位置是：首页 > 后端

当前栏目

SequenceFile实例操作详解大数据

实例数据详解操作

2023-06-13 09:20:25 时间

HDFS API提供了一种二进制文件支持，直接将 key,value 对序列化到文件中，该文件格式是不能直接查看的，可以通过hadoop dfs -text命令查看，后面跟上SequenceFile的HDFS路径

通过写入SequenceFile和读入SequenceFile文件，打成jar包在Hadoop环境中运行。

1.写入SequenceFile代码：

 1 package Hdfs; 

 3 import java.io.IOException; 

 4 import java.net.URI; 

 6 import org.apache.hadoop.conf.Configuration; 

 7 import org.apache.hadoop.fs.FileSystem; 

 8 import org.apache.hadoop.fs.Path; 

 9 import org.apache.hadoop.io.IOUtils; 

10 import org.apache.hadoop.io.IntWritable; 

11 import org.apache.hadoop.io.SequenceFile; 

12 import org.apache.hadoop.io.Text; 

14 public class SequenceFileWriter { 

15 private static final String[] text={ 

16 "床前明月光", 

17 "疑似地上霜", 

18 "举头望明月", 

19 "低头思故乡" 

20 }; 

21 public static void main(String[] args) { 

22 String uri="hdfs://neusoft-master:9000/user/root/test/demo1"; 

23 Configuration conf=new Configuration(); 

24 SequenceFile.Writer writer=null; 

26 try { 

27 FileSystem fs= FileSystem.get(URI.create(uri), conf); 

28 Path path = new Path(uri); 

29 IntWritable key = new IntWritable(); 

30 Text value = new Text(); 

31 writer = SequenceFile.createWriter(fs, conf, path, key.getClass(), value.getClass()); 

32 for (int i = 0; i 100; i++) { 

33 key.set(100-i); 

34 value.set(text[i%text.length]); 

35 writer.append(key, value); 

36 } 

37 } catch (IOException e) { 

38 e.printStackTrace(); 

39 }finally{ 

40 IOUtils.closeStream(writer); 

41 } 

42 } 

43 }

SequenceFileWriter

windows上打包成testseq.jar包，通过SecureFx上传到Linux对应目录中。

以下是linux操作步骤：

问题：如果CRT显示乱码如何解决？

在会话选项修改字符编码即可。

2.读入SequenceFile代码：

 1 package Hdfs; 

 3 import java.io.IOException; 

 4 import java.net.URI; 

 6 import org.apache.hadoop.conf.Configuration; 

 7 import org.apache.hadoop.fs.FileSystem; 

 8 import org.apache.hadoop.fs.Path; 

 9 import org.apache.hadoop.io.IOUtils; 

10 import org.apache.hadoop.io.SequenceFile; 

11 import org.apache.hadoop.io.Writable; 

12 import org.apache.hadoop.util.ReflectionUtils; 

14 public class SequenceFileReader { 

16 public static void main(String[] args) { 

17 String uri="hdfs://neusoft-master:9000/user/root/test/demo1"; 

18 Configuration conf = new Configuration(); 

19 SequenceFile.Reader reader =null; 

20 try { 

21 FileSystem fs = FileSystem.get(URI.create(uri),conf); 

22 Path path = new Path(uri); 

23 reader=new SequenceFile.Reader(fs, path,conf); 

24 Writable key = (Writable)ReflectionUtils.newInstance(reader.getKeyClass(), conf); 

25 Writable value =(Writable)ReflectionUtils.newInstance(reader.getValueClass(), conf); 

26 long position = reader.getPosition(); 

27 while (reader.next(key,value)) { 

28 System.out.printf("[%s]/t%s/n",key,value); 

29 position=reader.getPosition(); 

30 } 

31 } catch (IOException e) { 

32 e.printStackTrace(); 

33 }finally{ 

34 IOUtils.closeStream(reader); 

35 } 

37 } 

38 }

SequenceFileReader

windows上打包成testseq.jar包，在程序中指定主類，提交jar包時無需指定，通过SecureFx上传到Linux对应目录中。

以下是linux操作步骤：

END::SequenceFile

可通過IP：50070訪問

原创文章，作者：Maggie-Hunter，如若转载，请注明出处：https://blog.ytso.com/9083.html

分布式文件系统，分布式数据库区块链并行处理（MPP）数据库，数据挖掘开源大数据平台数据中台数据分析数据开发数据治理数据湖数据采集

猜你喜欢

Java-GUI 编程之 JList、JComboBox实现列表框
简单易操作的MSSQL简化版管理器（mssql简化版管理器）
【数字化转型】CIO 挑战：企业规模的数字化转型
MCE | Hippo 途径与靶向策略
哈奇智能杨洁明：智能物流机器人如何在智慧社区中实现价值|CCF-GAIR 2020
关于各种型号单片机delay函数不起作用问题的解决方法
【基础知识】Linux文件目录结构一览表
Linux移植安卓：极致定制且放大现有可能性（linux移植安卓）
对话依图医疗方骢：全栈式AI技术是医疗产业升级的核心要素
往光标所在位置插入值的js代码
高仿网易新闻顶部滑动条效果实现代码
Oracle关闭所有游标让性能提升到新高度（oracle关闭所有游标）
Redis中频道最大容量究竟是多少（redis 频道最大数量）
Shiro安全访问Redis的实现（Shiro获取redis）
微信小程序开发—小程序框架—小程序的逻辑层—3详解手机开发
ChatGPT全宇宙大爆炸！开启联网解除封印，无敌插件彻底颠覆体验
Spring MVC应用@Autowired和@Service进行依赖注入
如何在Oracle中优雅地编写SQL脚本（Oracle中如何写脚本）

zl程序教程

当前栏目

SequenceFile实例操作详解大数据

相关文章