31
2024
05
14:47:10

vSAN 运行状况服务 - 网络运行状况 - vSAN 群集分区

Products

VMware vSAN

Issue/Introduction

Symptoms:
免责声明:本文为 vSAN Health Service - Network Health - vSAN Cluster Partition (2108011) 的翻译版本。尽管我们会不断努力为本文提供最佳翻译版本,但本地化的内容可能会过时。有关最新内容,请参见英文版本。


本文介绍了 vSAN 运行状况服务中的网络运行状况 – vSAN 群集分区检查,并详细介绍了可能报告错误的原因。

Environment

VMware vSAN 6.0.x

Resolution

问:“网络运行状况 – vSAN 群集分区”检查的用途是什么?
为了正常运行,所有 vSAN 主机都应能够通过多播和单播进行通信。
有关多播和单播的详细信息,请参见 vSAN Troubleshooting:Multicast
如果群集中有任一 ESXi 主机无法进行通信,vSAN 群集将拆分为多个网络分区。(例如 ESXi 主机的子组可以彼此进行通信,但是无法与其他子组进行通信)。
出现这种情况时,vSAN 对象可能变得不可用,直到解决了网络配置错误为止。为了生产 vSAN 群集的顺畅运行,拥有不含额外网络分区(即仅一个分区)的稳定网络非常重要。
该运行状况检查可以检查群集以了解存在多少个分区。如果 vSAN 群集中存在多个分区,则会显示错误。注意,该检查实际上只是为了确定是否存在网络问题,但不会尝试查找根本原因。要查找根本原因,需要运行其他网络运行状况检查。
问:如果该检查处于错误状态,意味着什么?
当仅找到一个分区时,该运行状况检查即为正常。一旦发现多个分区,就会认为群集不正常。
出现多分区问题时,vSphere Web Client 中可能会显示其他警告。例如,vSAN“常规”视图中的网络配置状态可能会说明检测到网络配置错误。
另一相关的视图是 vSAN 磁盘管理。该视图中有一列提供有关 ESXi 主机所属的网络分区组的信息。要了解群集已拆分为多少个分区,请检查该列。如果每个 ESXi 主机都位于它自己的网络分区组中,则整个群集都有问题。如果仅一个 ESXi 主机位于它自己的网络分区组中,并且所有其他 ESXi 主机都位于另一个网络分区组中,则仅该 ESXi 主机有问题。这将有助于隔离当前问题,进而专注于调查工作。

注意:运行状况用户界面会在该检查的详细信息部分中显示相同信息。
如何排除故障并修复错误状态?
必须确定网络配置问题并解决。有关网络的其他运行状况服务检查旨在帮助您查找导致网络分区的根本原因。这些原因的范围如下:子网配置错误(所有 ESXi 主机必须拥有匹配的子网)、vSAN 流量 VMkernel 适配器配置错误(所有 ESXi 主机必须配置了 vSAN vmknic)、VLAN 或常规网络通信配置错误问题以及特定的多播问题(所有 ESXi 主机拥有匹配的多播设置)。其他网络运行状况检查旨在隔离可能是根本原因,并能够与此运行状况检查并行查看的那些问题。
除配置错误以外,还可能在因网络过载而导致大量数据包被丢弃时进行分区。vSAN 允许丢弃少量数据包,但是一旦丢弃的数据包超过中等数量,就会发生性能问题。
如果任何配置错误检查都没有问题,建议观察丢弃的数据包计数器并执行主动网络性能测试。有关可从 RVC 启动的主动网络性能测试的讨论请见《vSAN 运行状况服务指南》。
要在 ESXi 主机上检查丢弃的数据包计数器,请使用 esxtop 网络视图(按 n)并检查字段 %DRPRX 以获得过多丢弃的数据包。您可能还需要查看交换机和交换机端口,因为它们也可能会丢弃数据包。还应该检查另一个衡量指标,即暂停帧,暂停帧过量会降低网络速度和性能。




推荐本站淘宝优惠价购买喜欢的宝贝:

image.png

本文链接:https://hqyman.cn/post/6391.html 非本站原创文章欢迎转载,原创文章需保留本站地址!

分享到:
打赏





休息一下~~


« 上一篇 下一篇 »

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

请先 登录 再评论,若不是会员请先 注册

您的IP地址是: