5.11 How Much Capacity do I need?

vSAN 설계에 필요한 용량을 결정할 때 ‘NumberOfFailuresToTolerate’ 정책 설정은 이 고려 사항에서 중요한 역할을 합니다. NumberOfFailuresToTolerate와 생성된 복제본 수 사이에는 직접적인 관계가 있습니다. 예를 들어 가상 머신 스토리지 정책에서 NumberOfFailuresToTolerate가 1로 설정되어 있으면 다른 호스트의 용량 계층에 VMDK의 복제본이 하나 더 생성됩니다(데이터 사본 2개). NumberOfFailuresToTolerate가 2로 설정되어 있으면 클러스터 전체에 VMDK의 복제본이 2개(데이터 사본 3개)가 있습니다.

이 시점에서 용량은 장애에 대비하여 크기가 조정됩니다. 그러나 장애 발생 시 클러스터의 남은 용량에서 누락되거나 실패한 구성 요소를 vSAN이 재구축할 수 있도록 충분한 용량을 확보하고 싶을 수 있습니다. 또한 유지 관리를 위해 호스트를 클러스터에서 제거할 때 가상 머신의 전체 가용성을 유지하려는 요구가 있을 수 있습니다.

또 다른 근본적인 질문은 유지 관리 중에 vSAN이 클러스터의 다른 곳으로 구성 요소를 마이그레이션하고 재보호(또는 장애 발생 시 구성 요소를 재구축)할 수 있도록 설계해야 하는지 여부입니다. 호스트가 유지 관리 모드로 전환되고 스토리지 오브젝트가 재구축되지 않으면 이 기간 동안 디바이스에 장애가 발생하면 데이터가 손실될 수 있으므로 중요한 고려 사항입니다. 이는 클러스터에 노드가 3개 이상인 경우에만 가능합니다. 3노드 클러스터만 있는 경우에는 장애 발생 시 vSAN이 구성 요소를 다시 빌드할 수 없습니다. 그러나 vSAN이 장애를 처리하고 I/O는 계속되지만 장애가 해결되어야만 vSAN이 구성 요소를 다시 빌드하고 다시 완전히 보호될 수 있습니다. 클러스터에 3개 이상의 노드가 포함되어 있고 장애 발생 시 또는 유지 관리 활동 중에 구성 요소를 다시 빌드해야 하는 경우 이를 위해 일정량의 추가 디스크 공간을 확보해야 합니다. 장애가 발생할 경우 재구축해야 하는 데이터의 양이 최대이므로 한 호스트 분량의 여유 스토리지를 남겨 두는 것이 좋습니다. 설계가 두 번의 장애를 견뎌야 하는 경우, 추가로 2개의 노드에 해당하는 여유 스토리지가 필요합니다. 이는 16개, 32개 또는 64개 노드 구성에서도 동일합니다. 얼마나 많은 추가 용량이 필요한지 결정하는 요소는 NumberOfFailuresToTolerate 설정에 따라 달라집니다.

설계 결정: vSAN 용량을 설계할 때는 항상 NumberOfFailuresToTolerate 설정을 포함해야 합니다.

설계 결정: 장애 발생 후 구성 요소를 재구축해야 하는 경우 각 장애를 견딜 수 있는 여유 호스트 용량이 확보되도록 설계 규모를 결정해야 합니다. 한 번의 장애 후 또는 유지보수 중에 구성 요소를 재구축하려면 전체 호스트에 해당하는 용량이 한 개 여유가 있어야 합니다. 두 번째 장애 후 구성 요소를 재구축하려면 두 개의 전체 호스트 상당의 여유 용량이 있어야 합니다.