Hadoop大数据分布式文件系统hdfs的Java操作
2023-09-14 09:02:04 时间
- 搭建开发环境(eclipse,hdfs的jar包----hadoop的安装目录的share下)
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-client</artifactId>
<version>2.4.1</version>
</dependency>
建议在linux下进行客户端应用的开发,不会存在兼容性问题。
如果非要在window上做客户端应用开发,需要设置以下环境:
A、在windows的某个目录下解压一个hadoop的安装包
B、将安装包下的lib和bin目录用对应windows版本平台编译的本地库替换
C、在window系统中配置HADOOP_HOME指向你解压的安装包
D、在windows系统的path变量中加入hadoop的bin目录
- 在java中操作hdfs,首先要获得一个客户端实例
Configuration conf = new Configuration()
FileSystem fs = FileSystem.get(conf)
而我们的操作目标是HDFS,所以获取到的fs对象应该是DistributedFileSystem的实例;
get方法是从何处判断具体实例化那种客户端类呢?
----从conf中的一个参数 fs.defaultFS的配置值判断;
如果我们的代码中没有指定并且工程classpath下也没有给定相应的配置,conf中的默认值就来自于hadoop的jar包中的core-default.xml,默认值为: file:///
- fs所具备的方法:
可以随机定位读取位置:DFSInputStream.seek()
相关文章
- java指定长度数组长度_Java声明数组时不能指定其长度[通俗易懂]
- java分布式框架_5个强大的Java分布式缓存框架推荐
- Java中的JPA是什么意思?「建议收藏」
- 说一下java的运行机制_Java运行机制是什么?「建议收藏」
- java与python-如何对比Python和Java,只需三分钟告诉你!
- java课设_Java 课设
- java setproperty 未生效_Java System类setProperty()方法及示例[通俗易懂]
- java 阶乘算法_Java 实现阶乘算法
- Java类的初始化顺序_java静态类初始化顺序
- java验证手机号正则表达式_Java使用正则表达式验证手机号和电话号码的方法「建议收藏」
- ringbuffer java例子_Java RingBuffer.publish方法代碼示例「建议收藏」
- Java遍历json_java处理json数据
- Java字符串转集合_java集合转数组
- Hadoop(五)搭建Hadoop客户端与Java访问HDFS集群详解大数据
- Hadoop文件存储系统-HDFS详解以及java编程实现大数据
- 根据URL抓取并生成缩略图的Java代码详解编程语言
- 库MySQL Database Backup with Java.(java备份mysql)
- 新手进阶:从Java开发到Linux系统架构(java转linux)
- Java 连接 Redis:实现数据快速传输(java连redis)
- 时间设置Redis中Java如何设置过期时间(redisjava过期)
- Redis与Hadoop:让数据变得更加简单(redis与hadoop)
- MySQL与Java的结合:实现强大的数据持久化功能(mysql与java)
- 使用Java连接MySQL实现查询功能(java连接mysql查询)
- 实现高并发:Java利用Redis秒杀成功(java秒杀redis)
- Java Redis一次实现无限数据加速的尝试(用java redis)
- 收购Oracle收购Java重新定义软件开发未来(java被oracle)
- Java快速加载Oracle数据库(java加载oracle)
- Java经验点滴:类注释文档编写方法