您现在的位置是：首页 > 大数据

当前栏目

Anatomy of a Flink Program(Flink程序的剖析)

flink 程序 of 剖析 program

2023-09-14 09:14:46 时间

Flink program consists of the same basic parts:

1.Obtain an execution environment,获取执行环境
2.Load/create the initial data,获取数据
3.Specify transformations on this data,指定数据转换
4.Specify where to put the results of your computations,指定数据sink到哪里
5.Trigger the program execution.触发项目的执行

1.获取执行环境
You can obtain one using these static methods on StreamExecutionEnvironment:

getExecutionEnvironment()

createLocalEnvironment()

createRemoteEnvironment(host: String, port: Int, jarFiles: String*)

For specifying data sources the execution environment has several methods to read from files using various methods: you can just read them line by line, as CSV files, or using completely custom data input formats. To just read a text file as a sequence of lines, you can use:

2.获取数据

val env = StreamExecutionEnvironment.getExecutionEnvironment()

val text: DataStream[String] = env.readTextFile("file:///path/to/file")

3.指定数据转换
You apply transformations by calling methods on DataSet with a transformation functions. For example, a map transformation looks like this:

val input: DataSet[String] = ...

val mapped = input.map { x => x.toInt }

4.指定数据sink到哪里
Once you have a DataStream containing your final results, you can write it to an outside system by creating a sink. These are just some example methods for creating a sink:

writeAsText(path: String)

print()

5.触发项目的执行
Once you specified the complete program you need to trigger the program execution by calling execute() on the StreamExecutionEnvironment.

env.execute("AppName")

The execute() method is returning a JobExecutionResult, this contains execution times and accumulator results.

猜你喜欢

《收获，不止Oracle》分片技术
单向链表 Josephu(约瑟夫，约瑟夫环）问题
Xshell个性化设置，解决Xshell遇到中文显示乱码的问题
【Android 逆向】修改运行中的 Android 进程的内存数据 ( Android 系统中调试器进程内存流程 | 编译内存调试动态库以及调试程序 )
[Nuxt] Update Vuex State with Mutations and MapMutations in Vue.js
Git强制更新本地库和冲突解决
NgRx使用CreateSelector组装复合Selector
Prometheus Operator 常用指标
Linux权限详解命令之 chmod：修改权限
android 通过反射获取usb和sdcard路径(7.0以上) 区分usb和sdcard方式
jquery资源
linux rmdir命令：删除指定的空目录，及其内的子空目录
go语言web开发系列之二十四:用imagemagick为上传图片生成缩略图
【CSS】CSS 选择器 ② ( ID 选择器 | 通配符选择器 | CSS 选择器使用注意事项 )
使用 mysqldump 备份时的一些参数
初入测试职场如何做好功能测试，学会这4点秒变老鸟...
通过IEnumerable和IDisposable实现可暂停和取消的任务队列
m认知无线电信号检测算法matlab仿真,能量检测,循环平稳检测以及自相关检测
SAP UI5 应用开发教程之六十七 - 基于 OData V4 的 SAP UI5 List-Detail(列表-明细)布局的实现方式试读版
linux命令之route，路由命令
etcdctl-管理操作etcd集群
Docker - 在Ubuntu18.04中安装Docker CE

相关主题

Flink入门
Flink 简介
Flink介绍
Flink KAFKA
(转)Flink简介
Flink SQL 写 hudi
Flink - Checkpoint

zl程序教程

当前栏目

Anatomy of a Flink Program(Flink程序的剖析)

相关文章