您现在的位置是：首页 > 大数据

当前栏目

简单的Http请求数据保存到Hdfs

数据 HDFS HTTP 简单请求保存

2023-09-14 08:57:20 时间

使用okhttp工具集来开发：（如果文件已经存在会报错）

package com.etl;

import java.io.IOException;

import org.apache.commons.lang3.StringUtils;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;

import okhttp3.Call;
import okhttp3.Callback;
import okhttp3.OkHttpClient;
import okhttp3.Request;
import okhttp3.Response;

public class LinkHttp {
    
    private  static Configuration conf = null;
    private static String fsName = "fs.defaultFS";
    private static String fsURI = null;

    public static void main(String[] args) throws Exception {
        
        String name = args[0];
        String uri =  args[1];
        String url = args[2];
        String targetFile = args[3];  //文件全路径
        
        //初始化
        init(name, uri);
        OkHttpClient client = new OkHttpClient();
        final Request request = new Request.Builder().url(url).get().build();
        Call call = client.newCall(request);
        call.enqueue(new Callback() {

            @Override
            public void onFailure(Call call, IOException e) {
                System.out.println("Fail");
            }

            @Override
            public void onResponse(Call call, Response response) throws IOException {
                FileSystem fs = null;
                try {
                        Path dstPath = new Path(targetFile);
                        fs = FileSystem.get(conf);
                        FSDataOutputStream outputStream = fs.create(dstPath);    
                        if(response.isSuccessful()) {
            //                    System.out.println(response.body().string());
                                outputStream.write(response.body().bytes());        
                                outputStream.close();        
                                System.out.println("create file " + targetFile + " success!");        
                                //fs.close();
                        }
                }catch (Exception e){
                    e.printStackTrace();
                }finally {
                    fs.close();
                }
                System.out.println("run writeHdfs end");

                //关闭
                if(response.body()!=null) {
                    response.body().close();
                }
            }
        });
        
    }

    private static void init(String name, String uri) {
            if(StringUtils.isNotBlank(fsName)){
                fsName = name;
            }
             fsURI  = uri;
             conf = new Configuration();
             conf.set(fsName, fsURI);
    }

}

配置启动脚本如下：

#!/bin/sh
name=fs.defaultFS        #固定不变
uri=dwpro-name1:8020     #hdfs文件系统地址
url=http://www.cnblogs.com/30go/   #待保存的http地址
targetPath=/tmp/test/king.txt   # 目标的文件名
java -Djava.ext.dirs=lib com.etl.LinkHttp \
${name} ${uri} ${url} ${targetPath}  >> test.log 2>&1 &

猜你喜欢

【牛客网刷题】VL8-VL10 generate for语句、比较数大小、function的使用
Android系统手机端抓包方法
css3 实现心跳
【C++】第15篇 main函数参数详解
JavaScript中对象分类
HEVC与AVC的区别与联系(十二)
银行营业网点管理系统——dao包（BranchesDao）
[ARIA] Read error message for the focused form field by using aria-describedby
DayDayUp：罗振宇—2018.12.31年终秀——《时间的朋友》跨年演讲重点概览【文字+视频】
golang实战：使用os/exec包执行Linux shell命令、使用flag包解析参数实现k8s kubectl helm部署应用完整代码
IDEA创建多个模块MavenSpringBoot项目
chrome: 保存页面中的canvas为图片(chrome 107.0.5304.110)
Java实现蓝桥杯VIP 算法提高笨小猴
在ABAP里模拟实现Java Spring的依赖注入
Eyeshot Fem 2023.1.X Crack
C#中DllImport用法汇总
【Android 内存优化】自定义组件长图组件 ( 自定义组件构造方法 )
Spring3.0 AOP 详解
Python如何实现函数调用追踪

相关主题

Python数据存储
数据宽度
HDFS详解大数据
块组件数据
ajax和json数据
数据回显
hive导入数据
redis持久化详解大数据
大数据未来发展趋势
IP数据报格式
元数据元数据
大数据框架
.NET与大数据
合并数据
MySQL数据定义
响应式数据
数据操作函数

zl程序教程

当前栏目

简单的Http请求数据保存到Hdfs

相关文章