`
501311837
  • 浏览: 17595 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

ZooKeeper-- 管理分布式环境中的数据

阅读更多

1.随着分布式应用的不断深入,需要对集群管理逐步透明化。监控集群和作业状态;可以充分的利用ZK的独有特性,熟悉程度决定应用高度


2.Service端具有fast fail特性,非常健壮,无单点,不超过半数Server挂掉不会影响提供服务


3.zookeeper名字空间由节点znode构成,其组织方式类似于文件系统,其各个节点相当于目录和文件,通过路径作为唯一标示。与文件系统不同的是,每个节点具有与之对用的数据内容,同时也可以具有子节点


4.ZK用于存储协调数据,如状态、配置、位置信息等。每个节点存储的数据量很小KB级别

 

5.节点维护一个状态stat结构(包括数据变化的版本号、ACL变化、时间戳),以允许缓存验证与协调更新。每当节点数据内容改变,多一个版本号类似Hbase。客户端获取数据的同时也会获取数据版本号,节点的数据内容以原子方式读写。节点具有一个访问控制列表来约束访问操作,即具有权限控制

 

6.Watches:
Zk对Node的CRUD都可以触发监听
watch事件是一次性触发器,当wacht监视的数据发生变化,通知设置了该watch的clietn,即wacther

watch事件是异步发送至观察者

wacth是一次性触发的并且在获取watch事件和设置新watch事件之间有延迟,所以有可能不能可靠的观察到节点的每一次变化

客户端监视一个节点,总是先获取watch事件再发现节点的数据变化

watch事件的顺序对应于ZK服务所见的数据更新的顺序

 

7.ZK在hadoop平台上的典型应用


storm集群:Zk作为nimbus(master)和supervisor(slave)的中间枢纽,保存strom集群和作业的所有信息。并负责nimbus和supervisor的全部通信
Hbase集群:Zk作为协调器,为hbase提供了稳定服务和failover机制,HRegionServer也会把自己以Ephemeral(临时节点)方式注入到ZK中,使得Hmaster可以随时感知到各个HRegionServer的健康状态(可用于监控RegionServer)此外Zk也避免了HMaster的单点问题

应用三大块:
strom应用开发,storm集群监控
MR应用开发
HBase应用开发

 

8.流行的场景应用:
分布式配置管理:
分布式订阅即所谓的配置管理,顾名思义就是将数据发布到ZK节点上,共订阅者动态的获取数据,实现配置信息的集中式管理和动态更新,例如全局的配置信息,地址列表等就非常适合使用

NameService
这个主要是作为分布式命名的服务,通过调用Zk的create node api,能够很容易的创建一个全局唯一的path,这个path就可以作为一个名称

分布式通知/协调
Zk中特有的watcher注册与异步通知机制,能够很好的实现分布式环境下不同系统之间的通知于协调,实现对数据变更的实时处理。
使用方法通常是不同系统都对ZK上同一个znode进行watch,监听znode的变化(包括znode本身内容及子节点)其中一个系统update了znode那么另一个系统能够收到通知,并作出相应处理

分布式锁
这个主要得益于ZK为我们保证了数据的强一致性,即用户只要相信每时每刻,ZK集群中任意节点上的相同znode的数据时一定相同的。锁服务可以分为两大类:1.保持独占 2.控制时序

Hbase Master选举是ZK经典使用场景


   Znode

Znode    Znode维护着数据、ACLaccess control list,访问控制列表)、时间戳等交换版本号等数据结构,它通过对这些数据的管理来让缓存生效并且令协调更新。每当Znode中的数据更新后它所维护的版本号将增加,这非常类似于数据库中计数器时间戳的操作方式。

另外Znode还具有原子性操作的特点:命名空间中,每一个Znode的数据将被原子地读写。读操作将读取与Znode相关的所有数据,写操作将替换掉所有的数据。除此之外,每一个节点都有一个访问控制列表,这个访问控制列表规定了用户操作的权限。

    ZooKeeper中同样存在临时节点。这些节点与session同时存在,当session生命周期结束,这些临时节点也将被删除。临时节点在某些场合也发挥着非常重要的作用

 

     Watch机制

 

    Watch机制就和单词本身的意思一样,看。看什么?具体来讲就是某一个或者一些Znode的变化。官方给出的定义:一个Watch事件是一个一次性的触发器,当被设置了Watch的数据发生了改变的时候,则服务器将这个改变发送给设置了Watch的客户端,以便通知它们。

Watch机制主要有以下三个特点:

  1 一次性的触发器(one-time trigger

    当数据改变的时候,那么一个Watch事件会产生并且被发送到客户端中。但是客户端只会收到一次这样的通知,如果以后这个数据再次发生改变的时候,之前设置Watch的客户端将不会再次收到改变的通知,因为Watch机制规定了它是一个一次性的触发器。

  2 发送给客户端

    这个表明了Watch的通知事件是从服务器发送给客户端的,是异步的,这就表明不同的客户端收到的Watch的时间可能不同,但是ZooKeeper有保证:当一个客户端在看到Watch事件之前是不会看到结点数据的变化的。例如:A=3,此时在上面设置了一次Watch,如果A突然变成4了,那么客户端会先收到Watch事件的通知,然后才会看到A=4

  3被设置Watch的数据

    这表明了一个结点可以变换的不同方式。一个Znode变化方式有两种,结点本身数据的变化以及结点孩子的变化。因此Watch也可以设置为这个Znode的结点数据,当然也可以设置为Znode结点孩子。

 

     使用API来访问ZooKeeper

    API访问ZooKeeper才是客户端主要的使用手段,通过在客户端编写丰富多彩的程序,来达到对ZooKeeper的利用。这里给出一个简单的例子:(深入的还没能力给出啊,例子是从网上找的很清晰明了)

 

1. import java.io.IOException;
2.
3. import org.apache.zookeeper.CreateMode;
4. import org.apache.zookeeper.KeeperException;
5. import org.apache.zookeeper.Watcher;
6. import org.apache.zookeeper.ZooDefs.Ids;
7. import org.apache.zookeeper.ZooKeeper;
8.
9. public class demo {
10.     // 会话超时时间,设置为与系统默认时间一致
11.     private static final int SESSION_TIMEOUT=30000;
12.    
13.     // 创建 ZooKeeper 实例
14.     ZooKeeper zk;
15.    
16.     // 创建 Watcher 实例
17.     Watcher wh=new Watcher(){
18.            public void process(org.apache.zookeeper.WatchedEvent event)
19.            {
20.                    System.out.println(event.toString());
21.            }
22.     };
23.    
24.     // 初始化 ZooKeeper 实例
25.     private void createZKInstance() throws IOException
26.     {             
27.            zk=new ZooKeeper("localhost:2181",demo.SESSION_TIMEOUT,this.wh);
28.           
29.     }
30.    
31.     private void ZKOperations() throws IOException,InterruptedException,KeeperException
32.     {
33.            System.out.println("\n1. 创建 ZooKeeper 节点 (znode : zoo2, 数据: myData2 ,权限: OPEN_ACL_UNSAFE ,节点类型: Persistent");
34.            zk.create("/zoo2","myData2".getBytes(), Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);
35.           
36.            System.out.println("\n2. 查看是否创建成功: ");
37.            System.out.println(new String(zk.getData("/zoo2",false,null)));
38.                           
39.            System.out.println("\n3. 修改节点数据 ");
40.            zk.setData("/zoo2", "shenlan211314".getBytes(), -1);
41.           
42.            System.out.println("\n4. 查看是否修改成功: ");
43.            System.out.println(new String(zk.getData("/zoo2", false, null)));
44.                           
45.            System.out.println("\n5. 删除节点 ");
46.            zk.delete("/zoo2", -1);
47.           
48.            System.out.println("\n6. 查看节点是否被删除: ");
49.            System.out.println(" 节点状态: ["+zk.exists("/zoo2", false)+"]");
50.     }
51.    
52.     private void ZKClose() throws  InterruptedException
53.     {
54.            zk.close();
55.     }
56.    
57.     public static void main(String[] args) throws IOException,InterruptedException,KeeperException {
58.            demo dm=new demo();
59.            dm.createZKInstance( );
60.            dm.ZKOperations();
61.            dm.ZKClose();
62.     }
63.}

 

 

 

此类包含两个主要的 ZooKeeper 函数,分别为 createZKInstance ()和 ZKOperations ()。其中 createZKInstance ()函数负责对 ZooKeeper 实例 zk 进行初始化。 ZooKeeper 类有两个构造函数,我们这里使用  “ ZooKeeper  String connectString,  int sessionTimeout,  Watcher watcher 对其进行初始化。因此,我们需要提供初始化所需的,连接字符串信息,会话超时时间,以及一个 watcher 实例。 17 行到 23 行代码,是程序所构造的一个 watcher 实例,它能够输出所发生的事件。

 

    ZKOperations ()函数是我们所定义的对节点的一系列操作。它包括:创建 ZooKeeper 节点( 33 行到 34 行代码)、查看节点( 36 行到 37 行代码)、修改节点数据( 39 行到 40 行代码)、查看修改后节点数据( 42 行到 43 行代码)、删除节点( 45 行到 46 行代码)、查看节点是否存在( 48 行到 49 行代码)。另外,需要注意的是:在创建节点的时候,需要提供节点的名称、数据、权限以及节点类型。此外,使用 exists 函数时,如果节点不存在将返回一

 

 null 值。

 

分享到:
评论

相关推荐

    分布式服务框架 Zookeeper -- 管理分布式环境中的数据

    分布式服务框架 Zookeeper -- 管理分布式环境中的数据

    分布式服务框架Zookeeper--管理分布式环境中的数据[收集].pdf

    分布式服务框架Zookeeper--管理分布式环境中的数据[收集].pdf

    分布式服务框架Zookeeper—管理分布式环境中的数据

    本文介绍的Zookeeper是以3.2.2这个稳定版本为基础,,Zookeeper的安装非常简单,下面将从单机模式和集群模式两个方面介绍Zookeeper的安装和配置。单机安装非常简单,只要获取到Zookeeper的压缩包并解压到某个目录如...

    分布式服务框架 Zookeeper — 管理分布式环境中的数据.doc

    众所周知通常分布式架构都是中心化的设计,就是一个主控机连接多个处理节点。问题可以从这里考虑,当主控机失效时,整个系统则就无法访问了,所以保证系统的高可用性是...在这里我们就涉及到了我们的重点Zookeeper。

    Grain Mall-分布式微服务分布式电商项目基础(7.42G)

    项目由业务集群系统+后台管理系统构成,打通了分布式开发及全栈开发技能,包含前后分离全栈开发、Restful接口、数据校验、网关、注册发现、配置中心、熔断、限流、降级、链路追踪、性能监控、压力测试、系统预警、...

    分布式协调工具-ZooKeeper实现动态负载均衡

    ZooKeeper中特有watcher注册与异步通知机制,能够很好的实现分布式环境下不同系统之间的通知与协调,实现对数据变更的实时处理。使用方法通常是不同系统都对ZK上同一个znode进行注册,监听znode的变化(包括znode...

    java8stream源码-dempsy-commons:用于分布式处理的实用程序

    一种为弹性分布式系统提供环境配置的方法 - 一些简单的重用组件 - 有助于多线程和更复杂的网络测试 - 高性能多线程 API、接口和实现 命名和版本控制 通常,包含抽象定义(又名接口)的库以.api结尾。 它们采用dempsy...

    ZooKeeper典型使用场景

    基于对Paxos 算法的实现,使该框架保证了分布式环境中数据的强一致性,也正是基于这样的特性,使得zookeeper 能够应用于很多场景。网上对zk的使用场景也有不少介绍,本文将结合作者身边的项目例子,系统的对zk 的...

    大数据处理利器:Spark+ZooKeeper+Kafka Scala源码示例

    项目核心采用Spark进行批处理与流处理,整合了ZooKeeper和Kafka以增强分布式计算和数据流管理能力。文件类型多样,包括175个class文件,109个crc校验文件,82个Parquet数据文件,以及67个Scala源码文件等。 项目...

    ZooKeeperDemo

    本工程用于初步研究ZooKeeper的应用 本工程编码方式:UTF-8 开发工具:Eclipse 参考博客:http://littlerich.top/2017/09/10/大数据_分布式服务框架zookeeper管理分布式环境中的数据/

    ZooKeeper典型应用场景

    基于对 Paxos 算法的实现,使该框架保证了分布式环境中数据的强一致性,也正是基于这样的特性,使得 ZooKeeper 解决很多分布式问题。网上对 ZK 的应用场景也有丌少介绉,本文将结合作者身边的项目例子,系统地对 ZK ...

    分布式基础信息管理系统swall.zip

    swall是一个基于zookeeper实现的分布式基础信息管理系统(Infrastructure Management)可以用于管理特别是架构比较灵活的服务,比如游戏。用swall, 你不用登陆到具体的服务器去操作,你指需要在一台机器上面就可以...

    zookeeper应用场景

    基于对Paxos算法的实现,使该框架保证了分布式环境中数据的强一致性,也正是基于这样的特性,使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍,本文将结合作者身边的项目例子,系统地对ZK的应用...

    深入探索Zookeeper:从客户端使用到集群特性的全面指南

    本文深入探讨了Zookeeper的...此外,还介绍了Zookeeper在分布式环境中的经典应用场景,包括分布式锁和集群模式的特点。文章以其深入浅出的讲解和实用的代码示例,适合希望深入了解Zookeeper集群和客户端应用的开发者。

    Fourinone分布式计算框架

    FourInOne整体代码仅仅为70k,跟Hadoop, Zookeeper, Memcache, ActiveMq等开源产品代码上没有任何相似性,不需要任何依赖,引用一个jar包就可以嵌入式使用,良好支持window环境,可以在一台机器上模拟分布式环境,更...

    分布式调度任务架构elastic job的spring-boot-starter自动装载模块

    现分布式协调,加上支持分片、日志追踪、任务管理UI、高可性被大家熟知。 2.目前新的项目基本都是spring boot,如何通过约束、配置方式快速构建elastic job是一个必 要解决问题 ;所以博主自己开发了一个elastic ...

    Hbase+Spring boot实战分布式文件存储

    子模块-文件管理模块 Hos服务核心模块文件管理模块开发,包含Bucket的增删改查以及文件的增删改查操作,本节会通过zookeeper实现分布式锁,保证文件及文件夹的一致性。 12-1 Bucket管理模块开发 12-2 HDFS和HBASE...

    Zookeeper的应用场景.pdf

    Zookeeper是一个高可用的分布式数据管理和协调框架,并且能够很好的保证分布式环境中数据的一致性。在越来越多的分布式系统(Hadoop、HBase、Kafka)中,Zookeeper都作为核心组件使用。 Zookeeper的应用场景主要有...

Global site tag (gtag.js) - Google Analytics