zl程序教程

Hive案例

  • Hive学习之路 (十二)Hive SQL练习之影评案例详解大数据

    Hive学习之路 (十二)Hive SQL练习之影评案例详解大数据

    现有如此三份数据:1、users.dat 数据格式为: 2::M::56::16::70072, 共有6040条数据对应字段为:UserID BigInt, Gender String, Age Int, Occupation String, Zipcode String对应字段中文解释:用户id,性别,年龄,职业,邮政编码 2、movies.dat 数据格式为: 2::Jumanji (19

    日期 2023-06-12 10:48:40     
  • hive之案例分析(grouping sets,lateral view explode, concat_ws)

    hive之案例分析(grouping sets,lateral view explode, concat_ws)

    有这样一组搜索结果数据: 租户,平台, 登录用户, 搜索关键词, 搜索的商品结果List {"tenantcode":"0000001", "platform":"IOS","loginName":"13111111111", "keywords":"手机","goodsList":[{"skuCode":"sku00001","skuName":"skuname1","spuCode":"s

    日期 2023-06-12 10:48:40     
  • BigData之Hive:Hive(​​​​​​​一个基于Hadoop的​​​​​​​数据仓库工具​​​​​​​​​​​​​​)的简介(包括HiveSQL)、下载、案例应用之详细攻略

    BigData之Hive:Hive(​​​​​​​一个基于Hadoop的​​​​​​​数据仓库工具​​​​​​​​​​​​​​)的简介(包括HiveSQL)、下载、案例应用之详细攻略

    BigData之Hive:Hive(​​​​​​​一个基于Hadoop的​​​​​​​数据仓库工具​​​​​​​​​​​​​​)的简介(包括HiveSQL)、下载、案例应用之详细攻略 目录 Hive(​​​​​​​一个基于Hadoop的​​​​​​​数据仓库工具​​​​​​​​​​​​​​)的简介 1、HiveSQL     

    日期 2023-06-12 10:48:40     
  • hive学习(五) 应用案例

    hive学习(五) 应用案例

    1.实现struct数据结构例子 1.1创建student表 create table student( id int, info struct<name:string,age:int> ) row format delimited fields terminated by ',' collection items terminated by ':';   1.2向这

    日期 2023-06-12 10:48:40     
  • 【大数据开发运维解决方案】Hadoop+Mysql+Hive+zookeeper+kafka+Hbase+Sqoop+Kylin单机伪分布式安装及官方案例详细文档

    【大数据开发运维解决方案】Hadoop+Mysql+Hive+zookeeper+kafka+Hbase+Sqoop+Kylin单机伪分布式安装及官方案例详细文档

    Hadoop2.7.6+Mysql5.7+Hive2.3.2+zookeeper3.4.6+kafka2.11+Hbase1.4.9+Sqoop1.4.7+Kylin2

    日期 2023-06-12 10:48:40     
  • hive导入导出数据案例

    hive导入导出数据案例

    查询数据: use ods;set /user.password=ODS-SH;select * from base_cdma_all limit 10; use tag_bonc;select * from dpi_http_userapp_statistics limit 100000;  #设置显示当前使用的数据库 set hive.cli.print.current.d

    日期 2023-06-12 10:48:40     
  • 数仓工具—Hive实战之full join 经典案例(13)

    数仓工具—Hive实战之full join 经典案例(13)

    full join 经典案例 full join 增量数据同步更新 我们知道我们的数仓数据很大一部分是来自业务数据库的,那么这个时候我们数据同步的方式有两种一种是增量同步一种是全量同步,那么这个时候我们增量同步进来的数据

    日期 2023-06-12 10:48:40     
  • 数仓工具—Hive实战之自关联经典案例(11)

    数仓工具—Hive实战之自关联经典案例(11)

    自关联经典案例 其实说到关联我相信很多人都知道,自关联其实是关联的一种,其实我们最常见的是两张不同的表之间的关联,但其实工作中我们能看到的其实还有一种关联,那就是一张表与它自己关联。 下面我们就通过几个案例感受一下,自关

    日期 2023-06-12 10:48:40     
  • 59 Hive案例(级联求和)

    59 Hive案例(级联求和)

    需求 有如下访客访问次数统计表 t_access_times 需要输出报表:t_access_times_accumulate 实现步骤 可以用一个hql语句即可实现: select

    日期 2023-06-12 10:48:40     
  • 58 Hive案例(访问时长统计)

    58 Hive案例(访问时长统计)

    需求 从web日志中统计每日访客平均停留时间 实现步骤 1、由于要从大量请求中分辨出用户的各次访问,逻辑相对复杂,通过hive直接实现有困难,因此编写一个mr程序来求出访客访问

    日期 2023-06-12 10:48:40     
  • 57 Hive案例(数据ETL)

    57 Hive案例(数据ETL)

    需求 对web点击流日志基础数据表进行etl(按照仓库模型设计) 按各时间维度统计来源域名top10 已有数据表 “t_orgin_weblog” : col_namedat

    日期 2023-06-12 10:48:40     
  • Hive SQL综合案例

    Hive SQL综合案例

    一 Hive SQL练习之影评案例 案例说明 现有如此三份数据:1、users.dat 数据格式为: 2::M::56::16::70072, 共有6040条数据对应字段为:UserID BigInt, Gender String, Age Int, Occupation String, Zipcode String对应字段中文解释:用户id,性别,年龄,职业,邮政编码 2、movies.dat

    日期 2023-06-12 10:48:40     
  • 【Hive】Apache Hive系列之Hive高级查询案例

    【Hive】Apache Hive系列之Hive高级查询案例

    指路牌 准备 SQL查询 单表查询 WHERE条件查询 DISTINCT去重查询 LIMIT分页查询

    日期 2023-06-12 10:48:40