Hadoop系列
Hadoop 3.x 新特性剖析系列2详解大数据
1.概述 接着上一篇博客的内容,继续介绍Hadoop3的其他新特性。其内容包含:优化Hadoop Shell脚本、重构Hadoop Client Jar包、支持等待Container、MapReduce任务级别本地优化、支持多个NameNode、部分默认服务端口被改变、支持文件系统连接器、DataNode内部添加负载均衡、重构后台程序和任务堆管理。 2.2.1 优化Hadoop Shell脚本
日期 2023-06-12 10:48:40Hadoop 3.x 新特性剖析系列1详解大数据
1.概述 目前从Hadoop官网的Wiki来看,稳定版本已经发行到Hadoop2.9.0,最新版本为Hadoop3.1.0,查阅JIRA,社区已经着手迭代Hadoop3.2.0。那么,今天笔者就带着大家来剖析一下Hadoop3,看看它给我们带来了哪些新特性。 2. 内容 从功能上来说,Hadoop3比Hadoop2有些功能得到了增强,具体增加了哪些,后面再讲。首先,我们来看看Hadoop
日期 2023-06-12 10:48:40Hadoop源码解读系列目录
Hadoop源码解读系列 1、hadoop源码|common模块-configuration详解2、hadoop源码|core模块-序列化与压缩详解3、hadoop源码|core模块-远程调用与NIO详解4、hadoop源码|core模块-linux文件系统与nfs文件系统详解5、hadoop源码|core模块-hadoop文件系统详解6、hadoop源码|hdfs模块-hdfs架构和流程详解7
日期 2023-06-12 10:48:40Hadoop2 实战系列之1 -- Hortonworks Sandbox的安装和使用
本文主要讲述如何利用hortonworks sanbox来搭建hadoop2的学习环境。Hortonworks sanbox集成了hadoop2及其上的一些常用工具如hive, pig等。 下载地址 http://hortonworks.com/products/hortonworks-sandbox/ 导入到virtualbox 在virtualbox中可以选择图形工具来进行导入,菜单选项
日期 2023-06-12 10:48:40[hadoop系列]Pig的安装和简单演示样例
inkfish原创,请勿商业性质转载,转载请注明来源(http://blog.csdn.net/inkfish )。(来源:http://blog.csdn.net/inkfish) Pig是Yahoo!捐献给Apache的一个项目,眼下还在Apache孵化器(incubator)阶段,眼下版本号是v0.5.0。Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-lik
日期 2023-06-12 10:48:40Hadoop概念学习系列之Hadoop、Spark学习路线
1 Java基础: 视频方面: 推荐《毕向东JAVA基础视频教程》。学习hadoop不需要过度的深入,java学习到javase,在Java虚拟机的内存管理、以及多线程、线程池、设计模式、并行化多多理解实践即可。 书籍方面:  
日期 2023-06-12 10:48:40hadoop系列-hadoop版本选择
引言 Hadoop自从出现到现在被广泛应用,经理了很多个版本的衍化,甚至各个公司都在原生apache hadoop的基础上进行了一些改造以及特性优化,有些是完善了一整套的集群部署工
日期 2023-06-12 10:48:40Hadoop家族系列文章
转自:http://blog.fens.me/series-hadoop-family/ Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassan
日期 2023-06-12 10:48:40hadoop系列讨论
生产环境下cloudera的cdh版本更受欢迎,但是貌似cloudera对于YARN的开发力度不是很突出,所以在apache与cdh版本选择的时候,大家是怎么考虑的? 主要关注生产环境下的运维成本,期待更多人加入讨论,更希望有对cdh有运维经验的人来分享分享 添加评论 分享 默认排序按时间排序 7 个回答 0赞同反对,不会显示你的姓名 向
日期 2023-06-12 10:48:40hadoop系列:zookeeper(2)——zookeeper核心原理(选举)
1、前述 上篇文章《hadoop系列:zookeeper(1)——zookeeper单点和集群安装》(http://blog.csdn.net/yinwenjie/article/details/47361419)我们介绍了zookeeper的两种安装方式。相信您的測试机或者VM上面已经有了一个可用的zookeeper环境了。本文是zookeeper解说的第二篇文章。我们主要
日期 2023-06-12 10:48:40[hadoop系列]Pig的安装和简单演示样例
inkfish原创,请勿商业性质转载,转载请注明来源(http://blog.csdn.net/inkfish )。(来源:http://blog.csdn.net/inkfish) Pig是Yahoo!捐献给Apache的一个项目,眼下还在Apache孵化器(incubator)阶段,眼下版本号是v0.5.0。Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-lik
日期 2023-06-12 10:48:40【大数据Hadoop】HDFS3.3.1-Namenode系列源码阅读
Namenode功能 前言文件系统目录树数据块管理Datanode管理租约管理缓存管理 前言 HDFS集群是以Master/Slave模式运行的,主要有两类节点:Namenode
日期 2023-06-12 10:48:40【Hadoop】Hadoop生态系列之搭建HadoopHA集群
上一篇:Hadoop生态系列之MapReduce Shuffle概述及常见问题 指路牌 Hadoop HA构建概述准备工作主机和服务启动映射表主机信息JDK安装和配置IP主机名映射关闭防火墙SSH
日期 2023-06-12 10:48:40【Hadoop】Hadoop生态系列之MapReduce Shuffle概述及常见问题
上一篇:Hadoop生态系列之InputForamt.class与OutputFormat.class分析 指路牌 MapReduce Shuffle定义MapReduce Shuffle常见问题
日期 2023-06-12 10:48:40【Hadoop】Hadoop生态系列之InputForamt.class与OutputFormat.class分析
上一篇:Hadoop生态系列之MapReduce概述及MapReduce任务开发与发布 指路牌 InputForamt&OutputFormat整体设计InputFormat.classT
日期 2023-06-12 10:48:40【Hadoop】Hadoop生态系列之MapReduce概述及MapReduce任务开发与发布
上一篇:Hadoop生态系列之HDFS常用Shell命令实践及Java API操作HDFS 这里写目录标题 MapReduce概述流程分析环境搭建MapReduce任务开发背景实现任务发布远程部署
日期 2023-06-12 10:48:40【Hadoop】Hadoop生态系列之HDFS常用Shell命令实践及Java API操作HDFS
上一篇:Hadoop生态系列之HDFS架构简述 指路牌 HDFS实践HDFS Shell 命令(常用)打印hadoop类路径格式化NameNodedfsadmin命令D
日期 2023-06-12 10:48:40【Hadoop】Hadoop生态系列之HDFS架构简述
上一篇:Hadoop生态系列之Hadoop简述及环境搭建 指路牌 HDFS架构简介架构NameNode & DataNodesHDFS不擅长存储小文件HDFS机架感知SecondaryNa
日期 2023-06-12 10:48:40【Hadoop】Hadoop生态系列之Hadoop简述及环境搭建
路标 背景大数据背景Hadoop 诞生环境搭建--基于CentOS7搭建环境准备HADOOP安装 背景 随着信息化互联网|物联网发展要求,万物互联趋势势在必行。随之引发架
日期 2023-06-12 10:48:40