5.14 Choosing a Storage I/O Controller
스토리지 설계에서 가장 중요한 측면은 선택한 구성 요소가 VMware 호환성 가이드(VCG)에 표시되는지 확인하는 것입니다. VCG를 확인하면 VMware가 스토리지 I/O 컨트롤러와 솔리드 스테이트 디스크 또는 PCIe 플래시 디바이스를 지원하는지 확인할 수 있습니다. 스토리지 하드웨어에 대한 몇 가지 설계 고려 사항이 여기에 나열되어 있습니다.
선택해야 할 컨트롤러의 종류
RAID 컨트롤러는 추가 비용과 복잡성을 추가합니다. 순수 패스스루 HBA를 사용하면 더 높은 성능과 일관된 운영을 경험할 수 있습니다. NVMe 장치는 SAS 컨트롤러를 사용하지 않으며 드라이브에 내장된 컨트롤러를 포함합니다.
설계 결정: VMware는 앞으로 SAS/SATA 드라이브를 사용할 때 RAID 컨트롤러 대신 HBA를 선택할 것을 권장합니다.
여러 컨트롤러 및 SAS 확장기(Expander)
vSAN은 ESXi 호스트당 여러 컨트롤러를 지원합니다. 호스트당 최대 디스크 수는 35개(디스크 그룹당 디스크 7개, 호스트당 디스크 그룹 5개)입니다. 일부 컨트롤러는 16개의 포트를 지원하므로 하나의 컨트롤러 뒤에 최대 16개의 디스크를 배치할 수 있습니다. 한 호스트에 이러한 컨트롤러를 두 개 사용하면 최대치에 근접하게 됩니다. 그러나 일부 컨트롤러는 8개의 포트만 지원하므로 최대치에 도달하려면 총 4개 또는 5개의 컨트롤러가 필요합니다.
SAS 확장기는 단일 스토리지 I/O 컨트롤러로 구성할 수 있는 스토리지 디바이스 수를 늘리기 위해 고려되기도 합니다. VMware는 vSAN에서 SAS 확장기를 광범위하게 테스트하지 않았으므로 사용을 권장하지 않습니다. 잠재적인 호환성 문제 외에도 SAS 확장기를 사용하면 성능에 영향을 미치고 디스크 그룹 장애의 영향이 증가할 수 있습니다. SAS 확장기는 케이스별로 레디 노드를 사용하여 제한된 경우에만 테스트되었습니다. 이러한 준비 노드는 확장기로 인증된 드라이브 수에 대해 최대 “최대” 한도를 가질 수 있습니다. 인증이 완료되고 지원되는 SAS 확장기를 확인하려면 vSAN VCG를 참조하십시오.
인텔 VMD
인텔 볼륨 관리 디바이스는 검증을 완료한 ReadyNode에서 지원됩니다. 목록은 vSAN VCG에서 확인할 수 있습니다. 인텔 VMD는 핫 플러그 지원, 드라이브 라이트 지원 등의 서비스 기능을 추가합니다.
NVMe 핫 플러그 지원
vSphere 네이티브 NVMe 핫 플러그가 지원되는 서버가 포함된 vSAN VCG ReadyNode 목록은 여기에서 확인할 수 있습니다.
트라이-모드 컨트롤러
SATA/SAS/NVMe를 지원하는 개별 RAID 컨트롤러를 흔히 “트라이 모드 컨트롤러"라고 합니다. 이러한 디바이스 중 일부는 vSAN VCG에서 인증을 받을 수 있지만 NVMe 디바이스를 연결하고 이를 통해 IO를 전달하는 데는 지원되지 않습니다. 트라이 모드 컨트롤러는 SAS 및 SATA 디바이스에만 사용할 수 있습니다. NVMe 드라이브는 RAID 컨트롤러를 거치지 않고 PCI-E에 연결해야 합니다. 고집적 서버 구성을 지원하기 위해 추가 PCI-E 레인이 필요한 경우 PCI 스위치가 지원되는 대안입니다.
PCIe 스위치
SAS 확장기와 유사하게, 일부 서버에는 NVMe 드라이브에 PCIe 채널을 초과 구독할 수 있는 PCIe 스위치가 포함되어 있습니다. 이러한 스위치에 대한 지원 정책은 ReadyNode가 인증된 서버 플랫폼에서만 지원된다는 점에서 SAS 확장기와 동일합니다. VCG의 예를 들어, 검색에 PCIe 스위치를 포함하도록 지정할 수 있습니다.
여러 컨트롤러와 단일 컨트롤러 비교
여러 스토리지 컨트롤러로 ESXi 호스트를 구성하는 것과 단일 컨트롤러로 구성하는 것의 차이점은 전자의 경우 잠재적으로 더 높은 성능을 달성할 수 있을 뿐만 아니라 컨트롤러 장애를 디스크 그룹의 더 작은 하위 집합으로 격리할 수 있다는 점입니다.
단일 컨트롤러를 사용하면 호스트에 여러 개의 디스크 그룹이 배포되어 있더라도 호스트의 모든 디바이스가 동일한 컨트롤러 뒤에 배치됩니다. 따라서 컨트롤러에 장애가 발생하면 이 호스트의 모든 스토리지에 영향을 미칩니다.
컨트롤러가 여러 대인 경우, 일부 장치는 한 컨트롤러 뒤에, 다른 장치는 다른 컨트롤러 뒤에 배치할 수 있습니다. 이렇게 하면 단일 컨트롤러에 장애가 발생할 경우 장애 도메인을 줄일 수 있을 뿐만 아니라 성능도 향상됩니다.
설계 결정: 호스트당 여러 개의 스토리지 I/O 컨트롤러를 사용하면 장애 도메인을 줄일 수 있으며 성능도 개선할 수 있습니다.
스토리지 컨트롤러 큐 깊이
스토리지 I/O 컨트롤러에 대해 VCG가 표시하는 두 가지 중요한 항목에 주목해야 합니다. 첫 번째는 “기능"이고 두 번째는 큐 깊이입니다.
큐 깊이가 매우 작은 컨트롤러에서 문제가 관찰되었기 때문에 큐 깊이는 매우 중요합니다. 특히 대기열 깊이(256 미만)가 작은 컨트롤러는 장애로 인해 또는 유지 관리 모드로 전환할 때 요청에 따라 vSAN이 구성 요소를 다시 빌드할 때 가상 머신 I/O 성능에 영향을 미칠 수 있습니다.
설계 결정: 큐 깊이가 가능한 한 큰 스토리지 I/O 컨트롤러를 선택합니다. 256개가 최소값이지만 가능하면 대기열 깊이가 훨씬 더 큰 컨트롤러를 선택하는 것이 좋습니다.
RAID-0과 패스스루 비교
두 번째로 중요한 항목은 “기능” 열로, vSAN에서 물리적 디스크 프레젠테이션을 vSAN에 지원하는 방식을 표시합니다. RAID 0과 패스스루를 나타내는 항목이 있습니다. 패스스루는 이 컨트롤러가 자기 디스크를 ESXi 호스트에 직접 제시하는 모드에서 작동할 수 있음을 의미합니다. RAID 0은 각 마그네틱 디스크를 RAID 0 볼륨으로 구성해야 ESXi 호스트에서 볼 수 있음을 의미합니다. RAID 0에는 추가 고려 사항이 있습니다. 예를 들어 관리자는 장애가 발생한 드라이브를 교체하기 위해 추가적인 수동 단계를 수행해야 할 수 있습니다. 이러한 단계에는 단순히 교체용 빈 디스크를 호스트에 연결하고 vSAN이 이를 클레임하도록 허용하는 대신 새 RAID 0 볼륨을 다시 구축하는 작업이 포함됩니다.
설계 결정: RAID 0 모드를 제공하는 스토리지 I/O 컨트롤러는 일반적으로 운영 관점에서 패스스루 드라이브보다 설치 및 교체하는 데 시간이 더 오래 걸립니다. 가능하면 패스스루 컨트롤러를 사용하십시오.
스토리지 컨트롤러 캐시 고려 사항
VMware의 권장 사항은 가능하면 컨트롤러의 캐시를 비활성화하는 것입니다. vSAN은 이미 스토리지 계층에서 데이터를 캐싱하고 있으므로 컨트롤러 계층에서 다시 캐싱할 필요가 없습니다. 스토리지 컨트롤러의 제한으로 인해 이 작업을 수행할 수 없는 경우 캐시를 100% 읽기로 설정하는 것이 좋습니다.
고급 컨트롤러 기능
일부 컨트롤러 공급업체는 가속을 위한 타사 기능을 제공합니다. 예를 들어 HP에는 Smart Path라는 기능이 있고 LSI에는 Fast Path라는 기능이 있습니다. VMware는 vSAN 환경에서 컨트롤러를 사용하는 경우 가속을 위한 고급 기능을 사용하지 않도록 설정할 것을 권장합니다.
설계 결정: 스토리지 I/O 컨트롤러를 선택할 때 해당 컨트롤러가 VCG에 있는지 확인하고 캐시가 비활성화되어 있는지 확인하며 타사 가속 기능이 비활성화되어 있는지 확인합니다. 컨트롤러가 RAID 0과 패스스루를 모두 지원하는 경우 패스스루를 사용하면 디스크 교체와 같은 유지 관리 작업이 훨씬 쉬워지므로 패스스루 사용을 고려하세요.
KB 관련 컨트롤러 문제
vSAN Online 상태 서비스는 필요한 컨트롤러 구성 설정을 식별하고 드라이버 및 펌웨어 버전을 식별할 수 있습니다.
특정 컨트롤러에 대해 알려진 구성 문제를 확인하려면 kb.vmware.com에서 검색을 수행해야 합니다.
Dell H730 컨트롤러 제품군(H730, H730p, H730 mini)의 경우 VMware KB 2109665 를 참조하십시오.