zl程序教程

Hadoop系列

  • Hadoop 3.x 新特性剖析系列2详解大数据

    Hadoop 3.x 新特性剖析系列2详解大数据

    1.概述 接着上一篇博客的内容,继续介绍Hadoop3的其他新特性。其内容包含:优化Hadoop Shell脚本、重构Hadoop Client Jar包、支持等待Container、MapReduce任务级别本地优化、支持多个NameNode、部分默认服务端口被改变、支持文件系统连接器、DataNode内部添加负载均衡、重构后台程序和任务堆管理。 2.2.1 优化Hadoop Shell脚本

    日期 2023-06-12 10:48:40     
  • Hadoop 3.x 新特性剖析系列1详解大数据

    Hadoop 3.x 新特性剖析系列1详解大数据

    1.概述 目前从Hadoop官网的Wiki来看,稳定版本已经发行到Hadoop2.9.0,最新版本为Hadoop3.1.0,查阅JIRA,社区已经着手迭代Hadoop3.2.0。那么,今天笔者就带着大家来剖析一下Hadoop3,看看它给我们带来了哪些新特性。 2. 内容 从功能上来说,Hadoop3比Hadoop2有些功能得到了增强,具体增加了哪些,后面再讲。首先,我们来看看Hadoop

    日期 2023-06-12 10:48:40     
  • Hadoop源码解读系列目录

    Hadoop源码解读系列目录

    Hadoop源码解读系列 1、hadoop源码|common模块-configuration详解2、hadoop源码|core模块-序列化与压缩详解3、hadoop源码|core模块-远程调用与NIO详解4、hadoop源码|core模块-linux文件系统与nfs文件系统详解5、hadoop源码|core模块-hadoop文件系统详解6、hadoop源码|hdfs模块-hdfs架构和流程详解7

    日期 2023-06-12 10:48:40     
  • Hadoop2 实战系列之1 -- Hortonworks Sandbox的安装和使用

    Hadoop2 实战系列之1 -- Hortonworks Sandbox的安装和使用

    本文主要讲述如何利用hortonworks sanbox来搭建hadoop2的学习环境。Hortonworks sanbox集成了hadoop2及其上的一些常用工具如hive, pig等。 下载地址 http://hortonworks.com/products/hortonworks-sandbox/ 导入到virtualbox 在virtualbox中可以选择图形工具来进行导入,菜单选项

    日期 2023-06-12 10:48:40     
  • [hadoop系列]Pig的安装和简单演示样例

    [hadoop系列]Pig的安装和简单演示样例

      inkfish原创,请勿商业性质转载,转载请注明来源(http://blog.csdn.net/inkfish )。(来源:http://blog.csdn.net/inkfish)   Pig是Yahoo!捐献给Apache的一个项目,眼下还在Apache孵化器(incubator)阶段,眼下版本号是v0.5.0。Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-lik

    日期 2023-06-12 10:48:40     
  • Hadoop概念学习系列之Hadoop、Spark学习路线

    Hadoop概念学习系列之Hadoop、Spark学习路线

      1 Java基础:     视频方面:          推荐《毕向东JAVA基础视频教程》。学习hadoop不需要过度的深入,java学习到javase,在Java虚拟机的内存管理、以及多线程、线程池、设计模式、并行化多多理解实践即可。     书籍方面:    

    日期 2023-06-12 10:48:40     
  • hadoop系列-hadoop版本选择

    hadoop系列-hadoop版本选择

    引言 Hadoop自从出现到现在被广泛应用,经理了很多个版本的衍化,甚至各个公司都在原生apache hadoop的基础上进行了一些改造以及特性优化,有些是完善了一整套的集群部署工

    日期 2023-06-12 10:48:40     
  • Hadoop家族系列文章

    Hadoop家族系列文章

    转自:http://blog.fens.me/series-hadoop-family/   Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassan

    日期 2023-06-12 10:48:40     
  • hadoop系列讨论

    hadoop系列讨论

    生产环境下cloudera的cdh版本更受欢迎,但是貌似cloudera对于YARN的开发力度不是很突出,所以在apache与cdh版本选择的时候,大家是怎么考虑的? 主要关注生产环境下的运维成本,期待更多人加入讨论,更希望有对cdh有运维经验的人来分享分享 添加评论  分享   默认排序按时间排序 7 个回答 0赞同反对,不会显示你的姓名 向

    日期 2023-06-12 10:48:40     
  • hadoop系列:zookeeper(2)——zookeeper核心原理(选举)

    hadoop系列:zookeeper(2)——zookeeper核心原理(选举)

    1、前述 上篇文章《hadoop系列:zookeeper(1)——zookeeper单点和集群安装》(http://blog.csdn.net/yinwenjie/article/details/47361419)我们介绍了zookeeper的两种安装方式。相信您的測试机或者VM上面已经有了一个可用的zookeeper环境了。本文是zookeeper解说的第二篇文章。我们主要

    日期 2023-06-12 10:48:40     
  • [hadoop系列]Pig的安装和简单演示样例

    [hadoop系列]Pig的安装和简单演示样例

      inkfish原创,请勿商业性质转载,转载请注明来源(http://blog.csdn.net/inkfish )。(来源:http://blog.csdn.net/inkfish)   Pig是Yahoo!捐献给Apache的一个项目,眼下还在Apache孵化器(incubator)阶段,眼下版本号是v0.5.0。Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-lik

    日期 2023-06-12 10:48:40     
  • 【大数据Hadoop】HDFS3.3.1-Namenode系列源码阅读

    【大数据Hadoop】HDFS3.3.1-Namenode系列源码阅读

    Namenode功能 前言文件系统目录树数据块管理Datanode管理租约管理缓存管理 前言 HDFS集群是以Master/Slave模式运行的,主要有两类节点:Namenode

    日期 2023-06-12 10:48:40     
  • 【Hadoop】Hadoop生态系列之搭建HadoopHA集群

    【Hadoop】Hadoop生态系列之搭建HadoopHA集群

    上一篇:Hadoop生态系列之MapReduce Shuffle概述及常见问题 指路牌 Hadoop HA构建概述准备工作主机和服务启动映射表主机信息JDK安装和配置IP主机名映射关闭防火墙SSH

    日期 2023-06-12 10:48:40     
  • 【Hadoop】Hadoop生态系列之MapReduce Shuffle概述及常见问题

    【Hadoop】Hadoop生态系列之MapReduce Shuffle概述及常见问题

    上一篇:Hadoop生态系列之InputForamt.class与OutputFormat.class分析 指路牌 MapReduce Shuffle定义MapReduce Shuffle常见问题

    日期 2023-06-12 10:48:40     
  • 【Hadoop】Hadoop生态系列之InputForamt.class与OutputFormat.class分析

    【Hadoop】Hadoop生态系列之InputForamt.class与OutputFormat.class分析

    上一篇:Hadoop生态系列之MapReduce概述及MapReduce任务开发与发布 指路牌 InputForamt&OutputFormat整体设计InputFormat.classT

    日期 2023-06-12 10:48:40     
  • 【Hadoop】Hadoop生态系列之MapReduce概述及MapReduce任务开发与发布

    【Hadoop】Hadoop生态系列之MapReduce概述及MapReduce任务开发与发布

    上一篇:Hadoop生态系列之HDFS常用Shell命令实践及Java API操作HDFS 这里写目录标题 MapReduce概述流程分析环境搭建MapReduce任务开发背景实现任务发布远程部署

    日期 2023-06-12 10:48:40     
  • 【Hadoop】Hadoop生态系列之HDFS常用Shell命令实践及Java API操作HDFS

    【Hadoop】Hadoop生态系列之HDFS常用Shell命令实践及Java API操作HDFS

    上一篇:Hadoop生态系列之HDFS架构简述 指路牌 HDFS实践HDFS Shell 命令(常用)打印hadoop类路径格式化NameNodedfsadmin命令D

    日期 2023-06-12 10:48:40     
  • 【Hadoop】Hadoop生态系列之HDFS架构简述

    【Hadoop】Hadoop生态系列之HDFS架构简述

    上一篇:Hadoop生态系列之Hadoop简述及环境搭建 指路牌 HDFS架构简介架构NameNode & DataNodesHDFS不擅长存储小文件HDFS机架感知SecondaryNa

    日期 2023-06-12 10:48:40     
  • 【Hadoop】Hadoop生态系列之Hadoop简述及环境搭建

    【Hadoop】Hadoop生态系列之Hadoop简述及环境搭建

    路标 背景大数据背景Hadoop 诞生环境搭建--基于CentOS7搭建环境准备HADOOP安装 背景 随着信息化互联网|物联网发展要求,万物互联趋势势在必行。随之引发架

    日期 2023-06-12 10:48:40