4.4 vSphere vMotion

vSphere vMotion은 VM이 온라인 상태를 유지하고 서비스를 계속 제공하는 동안 호스트에서 호스트로, 네트워크에서 네트워크로, 스토리지에서 스토리지로, 데이터 센터에서 데이터 센터로 이동할 수 있는 기능을 제공합니다. 즉, 게스트에서 SQL Server가 실행 중인 경우 다운타임이 발생하지 않으므로 애플리케이션과 최종 사용자는 마이그레이션 중에도 다운타임 없이 성능에 미치는 영향을 최소화하면서 계속 사용할 수 있습니다. 이는 리호스팅해야 하는 미션 크리티컬 워크로드의 경우 vMotion의 가장 큰 이점 중 하나입니다. 또한 이러한 방식으로 vMotion을 사용하면 다운타임 없이 vSphere 아키텍처에 대한 원활한 하드웨어 마이그레이션을 수행할 수 있습니다.

권장 구성 정보 및 SQL Server 클러스터링에 대한 vMotion 지원 고려 사항에 대한 고려 사항은 WSFC에 대한 vMotion 지원을 참조하십시오. 프로덕션 엔터프라이즈급 SQL Server 인스턴스에 대한 vMotion 사용을 최적으로 지원하도록 VMware 인프라를 설계하는 데 필요한 추가 정보는 VMware vSphere에서 Microsoft SQL Server 아키텍처 설계에서 확인할 수 있습니다.

vMotion은 vSphere 인프라의 표준 기능이므로 VM이 vMotion을 지원하거나 vMotion과 호환되도록 하기 위해 VM별 구성이 필요하지 않습니다. vMotion의 개선 사항으로 인해 기업에서 가장 까다로운 SQL Server 인스턴스에도 적합하고 중단 없이 사용할 수 있습니다.

SQL Server의 클러스터된 구성에 참여하는 가상 머신에서 vMotion 작업을 수행할 때 흔히 발생하는 문제 중 하나는 일시적인 서비스 중단 가능성입니다. 따라서 이 중단을 트리거하는 조건을 설명하는 것이 유용합니다.

관리자가 수동으로 또는 DRS에 의해 자동으로 vMotion 작업을 호출하면 vSphere는 VM의 상태를 현재 호스트에서 대상 호스트로 복사합니다. 이 복사 작업은 반복적이고 증분적으로 수행됩니다. 복사 작업의 지속 시간은 다음과 같은 요인에 의해 결정됩니다:

  • VM에 할당된 컴퓨팅 리소스의 크기
  • 대상 호스트에서 사용 가능한 컴퓨팅 리소스의 크기
  • VM의 게스트 운영 체제 변경 빈도
  • 네트워크 대역폭 및 처리량

vSphere가 VM의 상태를 충분히 복사하고 남은 상태를 한 번의 트랜잭션으로 복사할 수 있다고 판단되면 vMotion은 Windows VSS(볼륨 섀도 서비스)를 호출하고 vMotion이 마지막 복사를 수행할 수 있도록 VM을 동결하도록 요청합니다. Windows가 VM을 동결하면 Windows 내의 모든 작업이 일시 중단됩니다. 이 일시 중단된 상태에서는 VM이 WSFC 피어와 통신할 수 없으므로 클러스터 하트비트 프로브를 보내거나 받을 수 없습니다. 이전 버전의 Windows에서 WSFC가 노드를 사용할 수 없는 것으로 선언하기 전에 하트비트 누락에 대한 임계값은 5초입니다. 즉, VM이 5분 이상 일시 중단된 상태로 유지되면 WSFC가 클러스터의 다른 노드로 리소스 장애 조치를 트리거합니다.

이것이 바로 장애 조치 중에 클러스터된 SQL Server 노드에서 의도하지 않은 리소스 장애 조치 사고가 발생하는 이유입니다. 이 동작은 가상화된 SQL Server 인스턴스만의 특이한 것도 아니고 고유한 것도 아닙니다. 물리적 서버의 SQL Server 인스턴스에서도 동일한 방식으로 발생합니다. 트리거는 Windows Server의 특정 시점 스냅샷을 만들어야 하는 모든 작업 또는 프로세스에서 VSS를 호출하는 것입니다.

이후 버전의 Windows Server에서는 이 임계값이 10초(동일한 서브넷에 위치한 클러스터 노드의 경우) 및 20초(다른 네트워크 세그먼트에 위치한 클러스터 노드의 경우)로 증가했습니다. 적절하게 구성된 vSphere 인프라스트럭처(예: 적절한 컴퓨팅 리소스를 사용할 수 있고, 10G 네트워크 카드가 사용 중이며, 멀티 NIC vMotion 포트 그룹이 구성되었고, 기본 네트워크 인프라스트럭처에 점보 프레임이 활성화되어 있는 경우 등)에서는 WSFC의 리소스 장애 조치 동작이 트리거되기 훨씬 전에 vMotion의 마지막 복사본 작업이 완료되어야 합니다.

선호도/반선호도 규칙이 DRS/SDRS와 함께 사용되는 경우 수동 vMotion이 이를 위반할 수 있습니다. DRS/SDRS 규칙은 주기적으로 실행되므로 이 문제는 저절로 해결되며 규칙에 따라 함께 있어야 하거나 떨어져 있어야 하는 VM이 vSphere 호스트 전체에 걸쳐 있어야 하는 위치에 배치됩니다.

SQL Server의 관점에서 볼 때 vMotion의 가장 큰 장점 중 하나는 실행 계획 및 캐시의 최근 사용 데이터와 같이 메모리에 있는 모든 것이 그대로 유지된다는 점입니다. 따라서 기존 페일오버에서 재설정 버튼을 누르는 대신 SQL Server 인스턴스 및 데이터베이스의 성능이 동일하게 유지됩니다. 호스트 전환 중에 잠깐의 영향이 있을 수 있지만 애플리케이션은 실제로 알아차리지 못할 것입니다.