你好,游客 登录
背景:
阅读新闻

5分钟了解VMware vSAN的分布式RAID

[日期:2015-01-13] 来源:高端存储知识  作者:西瓜哥 [字体: ]

  大家周二好。

  今天也是一样难受,感觉像便秘似的,到现在还不知道给大家分享什么。白天看了很多VMAX3的资料,但感觉还不到分享的时候。

  为了配合明天深圳分舵的活动,白菜群主要讲分布式存储,可惜我参加不了,不过我今晚我可以替他预热一下,讲讲我对VMware的Virtual SAN(vSAN)的数据保护的一些学习心得。

  大家知道,vSAN就是一种分布式存储,其数据保护技术不是采用传统的RAID方式,而是叫分布式RAID/RAIN。

  VSAN在主机之间使用RAID-1(同步镜像)来满足对系统中存储对象的可用性和可靠性的要求。虚拟机存储对象的镜像拷贝数量取决于虚拟机存储策略。根据虚拟机存储策略不同,一块虚拟磁盘最多可在一个32节点的VSAN上拥有3个镜像。

  说白了,就是采用多副本技术,VSAN支持2副本或者3副本(目前实现)。

  那么问题来了,为什么VSAN可以支持两副本呢?大家知道,很多的产品,比如基于hadoop的开源实现,还有包括华为的UDS,爱数的Anyshare这些商业产品,都是采用三副本技术。西瓜哥曾经和爱数的米香总聊过,为啥备份产品也搞三副本,不是有点浪费吗?米香总说三副本的可靠性比较高,如果一台主机失效,那两个副本还可以提供服务。如果是采用两副本,如果发生一个主机失效(比如心跳断了),这种脑裂特别难处理,因为,大家各有一个副本,到底哪个副本来提供服务呢?

  西瓜哥想了想,这个确实是一个问题。但VSAN是如何解决的呢?

  VSAN数据存储其实是一种对象存储。对象指的是一个独立的存储块设备。对象取代LUN成了VSAN的主要存储单元。在VSAN中最典型的对象就是VMDK、虚拟机交换文件、增量盘(快照)和虚拟机名字空间。

  VSAN中的每个对象都有自己的RAID树,组件是RAID树上的叶子。存储数据的副本就是一个组件,为了解决脑裂的问题,VSAN引入了一个非常重要的组件——见证(witness),也就是我们经常所的仲裁盘。

  如果大家对集群系统如微软的MSCS有所了解的话,都知道集群系统都会有一个仲裁的机制,一般是一个仲裁盘(LUN)。当发生脑裂的时候,谁可以访问这个仲裁盘,那么这个主机就来对外提供服务。其实存储里面的虚拟化网关,如华为的VIS、EMC VPLEX,IBM SVC都有这个仲裁的机制。

  VSAN的聪明之处,就是引入了见证。这样可以实现仲裁的效果,但由于见证只是一个逻辑组件,不是一个副本,没有数据,只有元数据(大小仅2MB),占用的空间非常小。因此,可以只实现两副本的分布式集群,使用率比三副本要高很多,但有效解决了脑裂的问题,可靠性也很高。

  VSAN中的一个对象要被认为可用,必须满足以下两个条件:

  RAID树必须允许数据访问(RAID-1必须最少有一个完好的副本,RAID-0必须所有的条带都完好)

  必须有超过50%的组件可用(注意,不包含等于哦)

  简单来说,哪个对象拥有超过一半的组件,那么这个对象就可以访问。其他的对象就不能对外提供服务,这样就防止了脑裂。

  这种规则的抽象,可以让VSAN支持不同的高可用策略。

  这个是VSAN中不同高可用策略对副本以及主机数的要求:

  有了见证这个组件,就可以支持不同的VSAN的高可用策略。比如,你允许故障数是2,那么你需要3个副本,5台主机。这个时候需要多少个见证呢?需要主机数减去副本数,也就是需要2个见证。也就是5个主机,每个主机上要么有一个副本,要么有一个见证,这样发生脑裂,只有拥有超过50%组件的对象才能提供服务。

  好了,超过5分钟了,总结一下。西瓜哥认为,见证(witness)是VSAN非常有技巧的一个实现,它可以支持不同的高可用策略,而且可以有效防止脑裂。这是实现方式使得两副本这种比较经济的方式,可以在大规模的分布式存储里面实现。

  延伸思考一下:IBM XIV也是采用两副本,15台主机,是否也有仲裁机制来防止脑裂呢?西瓜哥在红皮书没有看到,但考虑到XIV都在一个机柜了,工程上是一个紧密的系统,也就是主机坏了,网络不可能坏,网络不坏,心跳就可以正常通讯,就不会有脑裂的问题,或者脑裂的概率非常小。因此,不特别考虑也是可以理解的。

收藏 推荐 打印 | 录入:Cstor | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
热门评论