02
2024
06
02:28:47

【vsphere高可用】主机故障切换

目录


一、vSphere HA接入控制


1.接入控制的资源有3中类型


2.主要的限制操作包括


二、接入控制策略


1、计算插槽大小(获取插槽的大小)


2、计算群机内每台主机拥有的插槽数目


3、计算群集的当前故障切换容量


4、判断“当前故障切换容量”是否小于“配置的故障切换容量”(已配置使用的容量)


5、预留的群集资源的百分比


三、“指定故障切换主机”策略


四、选择接入控制应当考虑的因素


一、vSphere HA接入控制

通过对资源使用施加一些限制,来确保群集内具有足够的资源,以便提供故障切换,并确保虚拟机有足够的预留资源。


1.接入控制的资源有3中类型

(1)主机。确保有足够的资源来满足其上运行的所有虚拟机的预留。


(2)资源池。确保资源池有足够资源来满足其关联的所有虚拟机的预留、份额和限制。


(3)vSphere HA。确保预留足够的群集资源,以便在主机发生故障时恢复虚拟机。


2.主要的限制操作包括

(1)限制打开虚拟机电源;


(2)对虚拟机迁移到主机、群集或资源池中的限制;


(3)限制虚拟机添加CPU或内存预留。


通过接入控制可以保证预期数量的虚拟机能够在故障之后重新启动。


如果要执行测试或维护可以临时禁用vSphere HA接入控制。


接入控制可以流出容量,当故障发生时,用于重新启动虚拟机。


二、接入控制策略

“群集允许的主机故障数目”接入控制策略,用于设置允许几台主机出现故障,同时可以确保群集内留有足够的资源来对这些故障主机上的虚拟机进行故障切换,其工作原理如下:


1、计算插槽大小(获取插槽的大小)

  插槽是内存和CPU资源的逻辑表示。默认情况下,系统会自动调整插槽的大小来满足已打开电源的虚机的需要。。


(1)对于CPU。vSphere HA会获取每台已打开电源的虚机的CPU预留,并选择其中最大的CPU预留值。(如果没有预留,则默认情况下是32MHZ,可以使用高级选项das.vmcpuminmhz更改此值)。


(2)对于内存。则会获取每台已打开电源虚机的内存预留和内存开销,然后选择最大值。内存预留没有默认值。


(3)


2、计算群机内每台主机拥有的插槽数目

(1)获取每台主机的CPU和内存资源


(2)CPU资源/CPU插槽大小=CPU插槽数量,内存资源/内存插槽大小=内存资源插槽数量,选择CPU插槽数量和内存资源插槽数量中的最小值,即可以获得主机可以支持的插槽数量。


3、计算群集的当前故障切换容量

故障切换容量指的是允许执行故障切换的主机数。


4、判断“当前故障切换容量”是否小于“配置的故障切换容量”(已配置使用的容量)

如果是小于表示故障切换容量不能够满足故障的切换,则接入控制会限制用户所执行的操作(包括打开虚机电源、迁移和资源预留)


5、预留的群集资源的百分比

除了设置“群集允许的主机故障数目”接入控制策略外,还可以设置“预留的群集资源的百分比”设置接入控制策略,工作原理如下:


1、计算群机内已使用(已打开电源的虚拟机)的资源;


(1)加总已打开电源虚拟机的CPU预留。如果没有预留,则默认为32MHZ(可以使用高级选项das.vmcpuminmhz设置);


(2)加总已打开电源虚拟机的内存预留(以及内存开销)


2、计算主机资源总数;


这些值包含在活动主机的根资源池中,而不是主机的总物理资源(应该是可用于部署虚拟机的资源总数,有些资源用于物理主机其他应用不包含在内)。


3、计算群集的“当前的CPU故障切换容量”和“当前的内存故障切换容量”;


当前的CPU故障切换容量=(主机CPU资源总数-已被虚拟机使用的CPU资源)/主机CPU的资源总数


当前的内存故障切换容量=(主机内存资源总数-已被虚拟机使用的内存资源)/主机内存的资源总数


4、判断“当前的CPU故障切换容量”或“当前的内存故障切换容量”是否小于“配置的故障切换容量”(已配置使用的容量)


如果是小于表示故障切换容量不能够满足故障的切换,即目前已在用的虚拟机没有足够的资源实现故障奇幻,则接入控制会限制用户所执行的操作。


三、“指定故障切换主机”策略

配置了此策略后,vShpere ha将在指定的故障切换主机上重新启动虚拟机。


为了确保切换主机上拥有可用的空闲资源,vSphere HA将阻止打开虚拟机或使用vMotion将虚拟机迁移到故障切换主机。而且为了保持负载平衡,DRS也不会使用故障切换主机。


四、选择接入控制应当考虑的因素

(1)避免资源碎片。当有足够资源用于虚拟机故障切换时,将出现资源碎片(什么是资源碎片?无法利用的资源)


指定插槽大小或指定切换主机的策略不会出现碎片,如“群集允许的主机故障数目”和“指定故障切换主机”策略,因为这两个策略都是基于基本资源单位的策略,有固定的插槽大小限制和主机数目。


如果是“群集资源的百分比”策略,则不解决资源碎片的问题,因为它是通过资源的百分比来控制资源的。


(2)故障切换资源预留的灵活性。可以根据需要配置不同控制粒度的策略。


“群集允许的主机故障数目”是基于一个或多个主机的策略;


“群集资源的百分比”是基于资源百分比的策略;


“指定故障切换主机”也是基于一个或多个专用故障切换主机的策略。


(3)群集的异构性。异构指的是群集内虚拟机的CPU、内存资源大小不一致。异构性主要涉及的策略是“群集允许的主机故障数目”,它在计算插槽大小时要获取群集内虚拟机的最大CPU预留和内存预留,在计算故障切换容量时也要考虑拥有最多已打开电源的虚拟机的主机的故障切换(如,所有已打开的虚拟机出现故障,则故障时切换所需要的资源的主机数即为故障切换容量)。其他两个策略不受群集异构性影响。


vSphere HA在执行接入控制计算时,会包括FT辅助虚拟机的资源使用情况:对于“群集允许的主机故障数目”策略,将为辅助虚拟机分配一个插槽;而对于“群集资源的百分比”策略,在计算群集的可用容量时将考虑辅助虚拟机的资源使用情况。

————————————————


                            版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

                        

原文链接:https://blog.csdn.net/hongdi/article/details/125866837




推荐本站淘宝优惠价购买喜欢的宝贝:

image.png

本文链接:https://hqyman.cn/post/6416.html 非本站原创文章欢迎转载,原创文章需保留本站地址!

分享到:
打赏





休息一下~~


« 上一篇 下一篇 »

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

请先 登录 再评论,若不是会员请先 注册

您的IP地址是: