vRealize Log Insight Kullanarak Host Fail Durumundan Etkilenen VM leri Tespit Etmek
Merhaba,
Bildiğiniz üzere VMware sanallaştırma platformu yıllar içerisinde stabilitesini kanıtlamış ve HA (High Availability) olarak bilinen ve olası host hataları durumunda problem yaşanan host üzerinde ki sanal makineleri cluster içerisinde ki diğer host lar üzerine taşıyarak yeniden başlatabilen böylece hizmet kesintilerinin minimize edilmesini sağlayan bir teknolojiye sahip.
Problemin oluşması sonrasında hangi VM lerin bu yöntem kullanılarak yeniden başlatıldığının tespiti ise ayrı bir operasyon işlemi olmaktadır. Genellikle ilgili sanal makinelerin sahiplerinin operasyon ekibine İşletim sisteminin başlamaması, Sanal makinenin System Recovery Mode da açılmış olması ya da işletim sistemi içerisinde ki bir servisin başlamaması gibi nedenler ile ilgili geri dönüşleri sonucunda Host Fail işleminden etkilenen sanal makineler tespit edilebilmektedir.
Bu makalemde sizlere VMware in vRealize Suite paketi içerisinde birlikte gelen vRealize Log Insight ürünü ile bu VM lerin nasıl tespit edilebileceğini anlatmaya çalışacağım. Test ortamımızda bir vCenter ve 3 node (sanal ESXi) dan oluşan bir vSAN Cluster mız bulunmaktadır. Bu cluster içerisinde sırasıyla isimleri HA-TEST-VM, HA-TEST-VM-2 ve HA-TEST-VM-3 olan 3 adet Windows Server işletim sistemi çalıştıran sanal makinemiz bulunmakta.
Not: Ek olarak öncesinde vRealize Log Insight konfigürasyonunun tamamlanmış olduğunu ve vCenter Server ile ESXi Host larımızın syslog larının Log Insight a forward edildiğini belirtmek isterim. Sanal makinelerimizin hangi host lar üzerinde çalışmakta olduğuna baktığımızda HA-TEST-VM ve HA-TEST-VM-2 isimli sanal makinelerimizin 192.168.233.10 ip adresli ilk host üzerinde olduğunu vCenter Server üzerinden görebiliriz.
Şimdi Host Fail durumunu tespit edebilmek için vRealize Log Insight konsolunu açalım ve Interactive Analytics bölümüne geçelim.
Boş durumda olan Query bölümüne com.vmware.vc.ha.VmRestartedByHAEvent ifadesini yazalım.
Ardından Query bölümünün altında bulunan + ADD FILTER ifadesine tıklayalım ve boş bir filtre ekleyelim. Ardından filtre bölümünün text yazan bölümüne vmw_vm_vmx_name yazalım (Bu ifadeyi yazarken size öneri olarak gelecektir. İfadenin tamamını yazmak yerine tıklayarak seçebilirsiniz) ve yanında bulunan dropdown box dan exists ifadesini seçelim.
İkinci bir filtre eklemek için yeniden + ADD FILTER ifadesine tıklayalım ve eklenen filtrede text yazan bölüme vmw_opid ifadesini yazalım ve sağında ki koşul ifadesini de exists olarak seçelim. Bu filtreyi de ekledikten sonra oluşturduğumuz Query aşağıda ki şekilde gözükecektir.
Son olarak yazmış olduğumuz query nin üzerinde bulunan over time a tıklayalım ve açılan menü de sırasıyla Non-time series i seçelim ardından Group by bölümünde ise vmw_vm_vmx_name (VMware – vSphere) seçeneğini işaretleyelim ve ardından Apply butonuna tıklayarak ayarımızı uygulayalım.
Oluşturmuş olduğumuz Query nin son hali aşağıda ki şekilde olacaktır.
Şimdi oluşturmuş olduğumuz Query nin sonucunu görmek için HA-TEST-VM ve HA-TEST-VM-3 isimli sanal makineleri çalıştıran 192.168.233.80 ip li host muzu kapatarak kasıtlı olarak fail etmesini sağlıyoruz.
Bunun sonucunda kapanan host üzerinde çalışmakta olan HA-TEST-VM ve HA-TEST-VM-3 isimli sanal makineler otomatik olarak cluster içerisinde uygun kaynağa sahip olan host lara taşınıp burada açılacaktır. Host un kapanma durumundan etkilenmiş olan VM leri Log Insight üzerinde yukarıda oluşturduğumuz Query yi çalıştırdığımızda aşağıda ki şekilde bir sonuç görüntülüyor olacağız.
Şimdi de Log Insight ın host un fail etmesi durumundan etkilenen VM leri gösterdiği Query yi kullanarak bir User Alert oluşturalım ve böylece bu şekilde ki bir hata sonucunda mail yolu ile direk bildirim alabilelim. Bunun için oluşturmuş olduğumuz query de sağ tarafta bulunan Kırmızı Çan logosuna tıkladıktan sonra açılan menüden “Create Alert from Query…” seçeneğine tıklayalım.
Ardından açılan ekranda ilgili yerleri aşağıda ki şekilde doldurup Save ile kayıt ettikten sonra bir daha bu tarz bir hatanın Log Insight tarafından yakalanması durumunda mail yolu ile bilgilendirme alabileceğiz.
Not: Dilerseniz “Send to vRealize Operations Manager” seçeneğini işaretleyip vROps Instance nızı seçerek bu hata ile ilgili bildirimin vROps a Alert olarak gönderilmesini de sağlayabilirsiniz.
Bu makalemde sizlere VMware in vRealize Suite paketi içerisinde birlikte gelen vRealize Log Insight ürünü ile bir cluster içerisinde ki host ya da host lar fail ettiğinde bu durumdan etkilenen VM lerin nasıl tespit edilebileceğini anlatmaya çalıştım.
Faydalı olması dileğiyle…