zl程序教程

HBase

  • 启动Hadoop HA Hbase zookeeper spark

    启动Hadoop HA Hbase zookeeper spark

    服务器角色 服务器 192.168.58.180 192.168.58.181 192.168.58.182 192.168.58.183 Name CentOSMaster Slvae1 Slave2 StandByNameNode NameNode  Yes      Yes DataNode    Yes &nb

    日期 2023-10-26 10:14:00     
  • Apache HBase 入门

    Apache HBase 入门

    介绍 Quickstart 将使您运行一个单节点,独立的 HBase 实例。 这一节描述了单节点独立 HBase 的设置。 独立的 实例具有所有的 HBase 守护进程 —— Master,RegionServers,和 ZooKeeper —— 运行于一个单独的JVM 持久化到本地文件系统。它是我们的大多数基本部署配置文件。我们将向你展示如何使用 hbase shell CLI 在 HB

    日期 2023-10-26 10:14:00     
  • hadoop备战:hbase的分布式安装经验

    hadoop备战:hbase的分布式安装经验

    配置HBase时,首先考虑的肯定是Hbase版本号与你所装的hadoop版本号是否匹配。这一点我在之前 的博客中已经说明清楚,hadoop版本号与hbase版本号的匹配度,那是官方提供的。以下的实验就是本人没參照版本号匹配尝试投机的方法。出现了错误。 版本号说明:

    日期 2023-10-26 10:14:00     
  • HBase运维经验

    HBase运维经验

    http://www.qconbeijing.com/download/Nicolas.pdf 重点看了下facebook做了哪些改进以及他们的运维经验,比较重要的有以下几点:   改进: 1 加强了行级的ACID约束 2 改善了数据的分布规则,可以配置hdfs的replicas所在节点 3 改写了master的assign规则,利用zk来进行assign 4 不用停机地重启clu

    日期 2023-10-26 10:14:00     
  • Hbase技术详细学习笔记

    Hbase技术详细学习笔记

    注:转自 Hbase技术详细学习笔记 最近在逐步跟进Hbase的相关工作,由于之前对Hbase并不怎么了解,因此系统地学习了下Hbase,为了加深对Hbase的理解,对相关知识点做了笔记,并在组内进行了Hbase相关技术的分享,由于Hbase涵盖的内容比较多,因此计划分享2期,下面就是针对第一期Hbase技术分享整体而成,第一期的主要内容如下

    日期 2023-10-26 10:14:00     
  • 【原创】 HBase  配置指南

    【原创】 HBase 配置指南

     HBase 默认配置   Centos6.5下Hbase配置 官网配置文档:http://hbase.apache.org/book.html#_configuration_files 中文翻译转自:http://eclecl1314-163-com.iteye.com/blog/1474286 Hbase集群搭建及所有配置

    日期 2023-10-26 10:14:00     
  • 将mr写到Hbase上

    将mr写到Hbase上

    新建maven项目导入依赖 project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xs

    日期 2023-10-26 10:14:00     
  • HBase最佳实践-读性能优化策略

    HBase最佳实践-读性能优化策略

    任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题。HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是HBase还需要完善的,有些是我们确实对它了解太少。总结起来,大家遇到的主要问题无非是Full GC异常导致宕机问题、RIT问题、写吞吐量太低以及读延迟较大。 Full GC问题之前在一些文章里面已经讲过它的来龙去脉,主要的解决方案目前主要有两方面需

    日期 2023-10-26 10:14:00     
  • Hadoop、HBase、Hive、Spark

    Hadoop、HBase、Hive、Spark

    Hadoop   Hadoop是Apache旗下的一个用java语言实现开源软件框架,是一个开发和运行处理大规模数据的软件平台。允许使用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理。它的核心组件有: HDFS(分布式文件系统):解决海量数据存储 YARN(作业调度和集群资源管理的框架):解决资源任务调度 MAPREDUCE(分布式运算编程框架):解决海量数据计算  

    日期 2023-10-26 10:14:00     
  • 创建Hive/hbase相关联的表异常

    创建Hive/hbase相关联的表异常

    hive> CREATE TABLE hperson(id string, name string,email string) STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":id,cf1:name,cf2:em

    日期 2023-10-26 10:14:00     
  • HBase集群安装过程中的问题集锦

    HBase集群安装过程中的问题集锦

    1、HRegionServer启动不正常 在namenode上执行jps,则可看到hbase启动是否正常,进程如下: [root@master bin]# jps26341 HMaster26642 Jps7840 ResourceManager7524 NameNode7699 SecondaryNameNode 由上可见,hadoop启动正常。HBase少了一个进程,猜测应该是有个节点reg

    日期 2023-10-26 10:14:00     
  • 大数据-数据存储:HDFS、MongoDB、HBase的区别和使用场景

    大数据-数据存储:HDFS、MongoDB、HBase的区别和使用场景

    一、HDFS HDFS::适合大文件存储,可append,但不可修改。适合Hadoop离线数据分析,Apache Spark的数据存储。 HDFS对大量小文件的存储开销比较大&#

    日期 2023-10-26 10:14:00     
  • 001.hadoop及hbase部署

    001.hadoop及hbase部署

    一 环境准备 1.1 相关环境 系统:CentOS 7 #CentOS 6.x系列也可参考,转换相关命令即可。 hadoop包:hadoop-2.7.0.tar.gz #下载官方地址:http://www.apache.org/dyn/closer.cgi/hadoop/common/ hbase包:hbase-1.0.3-bin.tar.gz #下载官方地址:http://www.

    日期 2023-10-26 10:14:00     
  • HBase 的存储结构

    HBase 的存储结构

    HBase 的存储结构 2016-10-17 杜亦舒 HBase 中的表常常是超级大表,这么大的表,在 HBase 中是如何存储的呢?HBase 会对表按行进行切分,划分为多个区域块儿,每个块儿名为 HRegionHBase 是集群结构,会把这些块儿分散存储到多个服务器中,每个服务器名为HRegionServer服务器多了,就需要一个管理者 HMaster,负责

    日期 2023-10-26 10:14:00     
  • 用Kafka和HBase构建一个基于Docker的数据采集器

    用Kafka和HBase构建一个基于Docker的数据采集器

    不难看出Docker近来发展迅速。分布式计算现在已日益普遍,而适用于分布式环境的开发工具仍在发展之中。一个多平台的应用在开发、测试以及部署方面已经成为一大难题,但好在虚拟机为我们提供了一个非常有用的简化抽象概念,允许应用的依赖性独立于物理硬件进行配置,但容器化技术通过运行宿主机的独立进程,避免了与虚拟化硬件竞争,从而进一步实现了这一点。同时,Docker是管理Linux容器的一个重要工具,也具备了

    日期 2023-10-26 10:14:00     
  • hbase 存储乱码的问题--解决方案

    hbase 存储乱码的问题--解决方案

    最近在将一些数字型的数据转成字节后存储到hbase中,出现了乱码问题,如下: public byte[] nextId() { try { long partitionId = currentId % partition; retur

    日期 2023-10-26 10:14:00     
  • HBase并行写机制(mvcc)

    HBase并行写机制(mvcc)

    HBase在保证高性能的同时,为用户提供了便于理解的一致性数据模型MVCC (Multiversion Concurrency Control),即多版本并发控制技术,把数据库的行锁与行的多个版本结合起来,从而去提高数据库系统的并发性能。 HBase在保证高性能的同时,为用户提供了便于理解的一致性数据模型MVCC (Multiversion Concurrency Control),即多版本

    日期 2023-10-26 10:14:00     
  • 提高HBase写性能

    提高HBase写性能

    以下为使用hbase一段时间的三个思考,由于在内存充足的情况下hbase能提供比较满意的读性能,因此写性能是思考的重点。希望读者提出不同意见讨论     1 autoflush=false的影响     无论是官方还是很多blog都提倡为了提高hbase的写入速度而在应用代码中设置autoflush=false,然后lz认为在在线应用中应该谨

    日期 2023-10-26 10:14:00     
  • Hbase 备份的方式

    Hbase 备份的方式

    HBase 备份的方式有三种: 1.下线备份   (1)停止集群。   (2)Distcp    (3)restore 2.在线备份 -replication 3.在线北大 -CopyTable 4.在线备份-Export

    日期 2023-10-26 10:14:00     
  • HBase 集群监控

    HBase 集群监控

    为什么需要监控? 为了保证系统的稳定性,可靠性,可运维性。 掌控集群的核心性能指标,了解集群的性能表现。 集群出现问题时及时报警,便于运维同学及时修复问题。 集群重要指标值异常时进行预警,将问题扼杀在摇篮中,不用等集群真正不可用时才采取行动。 当集群出现问题时,监控系统可以帮助我们更快的定位问题和解决问题 如何构建 HBase 集群监控系统? 公司有自己的监控系统,我们所要做的就

    日期 2023-10-26 10:14:00     
  • hbase phoenix char may not be null

    hbase phoenix char may not be null

    在使用phoenix做hbase的相关測试的时候。会出现 char may not be null 的错误。这是因为建表和导入的数据不匹配导致的。主要是char的定义,假如一个字段定义为char类型,可是插入的数据是“”,那么就会出现这种错误。较为简单的方式是把建表语句中的char类型改为varchar类型

    日期 2023-10-26 10:14:00     
  • hbase图文详解及一些算法

    hbase图文详解及一些算法

    它介于nosql和RDBMS之间,仅能通过主键(row key)和主键的range来检索数据,仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。主要用来存储非结构化和半结构化的松散数据。 与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。 与nosql数据库们一样,row key是用来检索记录的主键。访问hbase tabl

    日期 2023-10-26 10:14:00     
  • 浅析华为云基于HBase MTTR上的优化实践

    浅析华为云基于HBase MTTR上的优化实践

    摘要:主要介绍华为云在HBase 2.x内核所做的一些MTTR优化实践。 本文分享自华为云社区《华为云在HBase MTTR上的优化实践》,作者: 搬砖小能手。 随着HBase在华为云的广泛应用,HBase的数据节点规模也越来越大。最新版本的MRS可支持的单集群HBase数据节点规模可达到1024节点,可支持的region数量可达到200w+。面对如此大规模的节点数量,集群的MTTR也面临着巨大

    日期 2023-10-26 10:14:00     
  • CentOS7搭建Hadoop + HBase + Zookeeper集群

    CentOS7搭建Hadoop + HBase + Zookeeper集群

    一、基础环境准备 1、下载安装包(均使用当前最新的稳定版本,截止至2017年05月24日) 1)jdk-8u131 2)hadoop-2.7.3 3)hbase-1.2.5 4)zookeeper-3.4.10 以上下载地址请点击“阅读原文” 2、修改hosts文件(使用的三台集群主机默认IP为192.168.0.100、192.168.0.101、192.168.0.102)

    日期 2023-10-26 10:14:00     
  • hbase 常用命令行操作总结

    hbase 常用命令行操作总结

    前言 本篇针对hbase常用客户端操作命令,做一下总结,方便后续运营过程中使用; 1、查看帮助命令 help的命令展示出了常用的操作命令以及格式,通过这个命令可以

    日期 2023-10-26 10:14:00     
  • Hbase客户端优化

    Hbase客户端优化

    Scan Cachingscanner一次缓存多少数据来scan(从服务端一次抓多少数据回来scan)。默认值是 1,一次只取一条。Scan Attribute Selectionscan时建议指定需要的Column Family,减少通信量,否则scan操作默认会返回整个row的所有数据(所有Coulmn Family)。Close ResultScanners通过scan取完数据后,记得要关闭

    日期 2023-10-26 10:14:00     
  • HBase使用教程

    HBase使用教程

    1     基本介绍 1.1 前言 HBase – Hadoop Database。是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像B

    日期 2023-10-26 10:14:00     
  • HBase表重命名

    HBase表重命名

    hbase shell> disable 'tableName' hbase shell> snapshot 'tableName', 'tableSnapshot' hbase shell> clone_snapshot 'tableSnapshot', 'newTableName' hbase shell> delete_snapshot 'tableSnaps

    日期 2023-10-26 10:14:00     
  • HBase Region级别二级索引

    HBase Region级别二级索引

    我们会经常谈及二级索引,这是对全表数据进行另外一种方式的组织存储,是针对table级别的。如果要为HBase上的表实现一个强一致性的二级索引,那么就无法逃避分布式事务,而这一直是用户最期待的功能。 而即使只需要保证最终一致性,这个索引也并不好实现,因为你需要额外的表以存储过程数据,需要解决宕机恢复问题等   撇开分布式事务,我们是否可以考虑对索引的要求进行降级,比如把Region看

    日期 2023-10-26 10:14:00     
  • HBase 快速入门(安装和命令操作)

    HBase 快速入门(安装和命令操作)

    笔记整理自 1 HBase 安装部署 1.1 Zookeeper 正常部署 首先保证 Zookeeper 集群的正常部署,并启动。 bin/zkServer.sh start bin/zkServer.

    日期 2023-10-26 10:14:00     
  • Hbase-RowKey Filter详解

    Hbase-RowKey Filter详解

    RowFilter是用来对rowkey进行过滤的,比较符如下: 相关的过滤方法使用: 提取rowkey以01结尾数据 Filter filter = new RowFilter(CompareFilter.CompareOp.EQUAL,new RegexStringComparator(".*01$")); 提取rowkey

    日期 2023-10-26 10:14:00     
  • HBase开启LZO

    HBase开启LZO

    hbase只支持对gzip的压缩,对lzo压缩支持不好。在io成为系统瓶颈的情况下,一般开启lzo压缩会提高系统的吞吐量。但这需要参考具体的应用场景,即是否值得进行压缩、压缩率是否足够等等。 想要hbase支持lzo压缩,参照以下步骤: 1 首先要让系统支持lzo动态库,安装lzo-2.00以上版本:http://www.oberhumer.com/opensource/lzo/downl

    日期 2023-10-26 10:14:00     
  • 【甘道夫】Eclipse+Maven搭建HBase开发环境及HBaseDAO代码演示样例

    【甘道夫】Eclipse+Maven搭建HBase开发环境及HBaseDAO代码演示样例

    环境: Win764bit Eclipse Version: Kepler Service Release 1 java version "1.7.0_40" 第一步:Eclipse中新建Maven项目。编辑pom.xml并更新下载jar包 <project xm

    日期 2023-10-26 10:14:00     
  • HBase提供的工具

    HBase提供的工具

    1 .压缩测试工具   hbase org.apache.hadoop.hbase.util.CompressionTest   1G数据不同的压缩算法得到的结果 +--------------------+--------------+ | MODIFIER           | SIZE (bytes) | +---

    日期 2023-10-26 10:14:00     
  • HBase Canary

    HBase Canary

        HBase  Canary 用于检测HBase 系统的状态。它对指定表的每一个region 抓取一行,来探测失败或者延迟。 hbase org.apache.hadoop.hbase.tool.Canary -help     Usage: bin/hbase org.apache.hadoop.hbas

    日期 2023-10-26 10:14:00     
  • hbase 集群管理脚本

    hbase 集群管理脚本

    #!/bin/bash # Show all running Java processes on region servers. Must run on master using HBase owner user. JAVA_HOME=/usr/local/jdk1.6 HBASE_HOME=/usr/local/hbase/current IFS=$'\n' printf "+------

    日期 2023-10-26 10:14:00     
  • HBase写数据

    HBase写数据

    1 多HTable并发写 创建多个HTable客户端用于写操作,提高写数据的吞吐量,一个例子: static final Configuration conf = HBaseConfiguration.create(); static final String table_log_name

    日期 2023-10-26 10:14:00     
  • 大数据HBase(十):Apache Phoenix的基本入门操作

    大数据HBase(十):Apache Phoenix的基本入门操作

     文章目录 Apache Phoenix的基本入门操作 一、Phoenix的快速入门 1、需求 2、创建表语法

    日期 2023-10-26 10:14:00     
  • 分布式NoSQL列存储数据库Hbase操作(二)

    分布式NoSQL列存储数据库Hbase操作(二)

    文章目录 分布式NoSQL列存储数据库Hbase(二)知识点01:课程回顾知识点02:课程目标知识点03:Hbase使用场景1、集群管理2、

    日期 2023-10-26 10:14:00     
  • hbase安装

    hbase安装

    http://apache.fayea.com/zookeeper/stable/ wget http://apache.fayea.com/zookeeper/stable/zookeeper-3.4.8.tar.gz tar zxvf zookeeper-3.4.8.tar.gz mv zookeeper-3.4.8 /home/hadoop/zookeepercd /home/hadoo

    日期 2023-10-26 10:14:00     
  • Zookeeper管理多个HBase集群

    Zookeeper管理多个HBase集群

        zookeeper是hbase集群的"协调器"。由于zookeeper的轻量级特性,因此我们可以将多个hbase集群共用一个zookeeper集群,以节约大量的服务器。多个hbase集群共用zookeeper集群的方法是使用同一组ip,修改不同hbase集群的"zookeeper.znode.parent"属性,让它们使用不同的根目录。比如cluster

    日期 2023-10-26 10:14:00     
  • Hive、HBase对比【相同:HDFS作为底层存储】【区别:①Hive用于离线数据的批处理,Hbase用于实时数据的处理;②Hive是纯逻辑表,无物理存储功能,HBase是物理表,放非结构数据】

    Hive、HBase对比【相同:HDFS作为底层存储】【区别:①Hive用于离线数据的批处理,Hbase用于实时数据的处理;②Hive是纯逻辑表,无物理存储功能,HBase是物理表,放非结构数据】

    一、概念 1、Hive 1. Hive是hadoop数据仓库管理工具,严格来说,不是数据库,本身是不存储数据和处理数据的,其依赖于HDFS存储数据,依赖于MapReducer进行数据处理。 2. Hive的优点是学习成本低,可以通过类SQL语句(HSQ

    日期 2023-10-26 10:14:00     
  • HBase完全分布式搭建 | 集群建表测试

    HBase完全分布式搭建 | 集群建表测试

    🚀 作者 :“大数据小禅” 🚀 简介:详细讲解HBase的集群分布式搭建,附带过程截图。 🚀 安装包获取:获取对应

    日期 2023-10-26 10:14:00     
  • Hadoop集群中Hbase的介绍、安装、使用

    Hadoop集群中Hbase的介绍、安装、使用

     HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 一、Hbase简介 HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google

    日期 2023-10-26 10:14:00     
  • Hbase预分区种子生成

    Hbase预分区种子生成

    提前生成Hbase预分区种子,在创建Hbase表时也进行相应的预分区,同时设置预分区的个数,预分区的范围对应Hbase监控页面的Region Server的start key与End key,从而使数据能够均匀的分布于各个Region中。 private static final String[] PARTITIONS = generatPartitionSeed(); //生成3844个

    日期 2023-10-26 10:14:00     
  • 云HBase全面支持金融云可用区-支持实时安全风控\金融时序\大数据量存储及高并发访问

    云HBase全面支持金融云可用区-支持实时安全风控\金融时序\大数据量存储及高并发访问

    HBase已经全面支持金融云的业务,包括华东1、华东2、华南区域。HBase是一个通用的数据库,在金融云场景下有较多的需求,本文主要分析hbase解决哪些金融场景的需求 金融云实时风控 在安全风控的场景下,我们往往需求存储大量的结构化数据,主要因为越多的数据,画像风控越精准,阿里蚂蚁金融实时风控流程图如下: 1、数据源会产生在各个地方,以事件为中心,事件有很多的属性,比如:人物、行为、环境、

    日期 2023-10-26 10:14:00     
  • 运行HBase应用开发程序产生异常,提示信息包含org.apache.hadoop.hbase.ipc.controller.ServerRpcControllerFactory的解决办法

    运行HBase应用开发程序产生异常,提示信息包含org.apache.hadoop.hbase.ipc.controller.ServerRpcControllerFactory的解决办法

    Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties Exception in thread "main" java.io.IOException: java.lang.reflect.InvocationTargetException at org.apache.hadoop.h

    日期 2023-10-26 10:14:00     
  • 基于Solr的HBase多条件查询测试

    基于Solr的HBase多条件查询测试

    背景: 某电信项目中采用HBase来存储用户终端明细数据,供前台页面即时查询。HBase无可置疑拥有其优势,但其本身只对rowkey支持毫秒级 的快 速检索,对于多字段的组合查询却无能为力。针对HBase的多条件查询也有多种方案,但是这些方案要么太复杂,要么效率太低,本文只对基于Solr的 HBase多条件查询方案进行测试和验证。 原理: 基于Solr的HBase多条件查询原理很简单,将HBa

    日期 2023-10-26 10:14:00     
  • hbase高性能读取数据

    hbase高性能读取数据

        有时需要从hbase中一次读取大量的数据,同时对实时性有较高的要求。可以从两方面进行考虑:1、hbase提供的get方法提供了批量获取数据方法,通过组装一个list<Get> gets即可实现;2、java多线程的Future方法实现了如何从多线程中获取返回数据。以上两种方法结合后,获取数据将会更加的高效。阅读到一篇文章,对这两个方法的结合使用给出了实

    日期 2023-10-26 10:14:00     
  • hadoop(八) - hbase集群环境搭建

    hadoop(八) - hbase集群环境搭建

    1. 上传hbase安装包hbase-0.96.2-hadoop2-bin.tar.gz 2. 解压 tar -zxvf hbase-0.96.2-hadoop2-bin.tar.gz -C /cloud 3. 配置hbase集群,要改动3个文件(首先zk集群已经安装好了)注意:要把hadoop的hdfs-site.xml和core-site.xml 放到hbase/con

    日期 2023-10-26 10:14:00