Sibersunucu logo
VMware ESXi sorunlarını anlatan içerik için veri merkezi sunucu rackleri ve altyapı görseli

VMware ESXi Üzerinde En Sık Yaşanan Problemler ve Çözüm Rehberi

VMware ESXi, veri merkezi ve sanallaştırma dünyasında uzun yıllardır standart kabul edilen bir hypervisor. Tek bir fiziksel sunucu üzerinde onlarca sanal makine çalıştırmak, kaynakları verimli kullanmak ve ölçeklenebilir bir altyapı kurmak için ESXi güçlü bir tercih. Ancak bu gücün yanında, doğru izleme ve bakım yapılmadığında bazı tipik problemler kaçınılmaz olur.

Sibersunucu olarak sahada ESXi kullanan kurumların en sık yaşadığı sorunları analiz ediyoruz. Bu rehberde, her problemi anlaşılır şekilde açıklayıp, nedenlerini netleştiriyor ve adım adım çözüm yollarını paylaşıyoruz.

Mavi ışıklı ağ rafları ve veri merkezi altyapısını gösteren teknik fotoğraf

İçindekiler

  • ESXi host unreachable hatası
  • Datastore dolu / datastore erişim hatası
  • VM açılmıyor / power on failed
  • Network switch / port group yanlış yapılandırma
  • ESXi update ve patch sorunları
  • Snapshot birikmesi ve performans düşüşü
  • vCenter bağlantı problemleri
  • RAID / disk arızası belirtileri
  • ESXi log kontrolü (vmkernel.log, hostd.log)

ESXi host unreachable hatası

“Host unreachable” hatası, vCenter veya doğrudan erişimde ESXi sunucusunun ulaşılamadığını gösterir. Bu durum ağ bağlantısı kesintisi, yönetim arayüzü IP değişikliği veya servislerin yanıt vermemesi gibi sebeplerden kaynaklanır.

Çözüm adımları:

  • Fiziksel ağ bağlantılarını kontrol edin.
  • Management IP ve gateway ayarlarını doğrulayın.
  • ESXi servislerinin çalıştığından emin olun.
  • Gerekirse host’u yeniden vCenter’a ekleyin.

Dikkat edilmesi gerekenler: Host’u kaldırıp yeniden eklerken bakım modunu aktif edin.

Datastore dolu / datastore erişim hatası

Datastore doluluğu, VM’lerin disk yazma işlemlerini durdurur ve snapshot birikmesine yol açar. Erişim hataları ise çoğunlukla storage bağlantısında problem olduğu anlamına gelir.

Çözüm adımları:

  • Datastore kullanım oranını kontrol edin.
  • Gereksiz ISO ve yedek dosyalarını temizleyin.
  • Snapshot birikmelerini konsolide edin.
  • Storage bağlantısını (NFS/iSCSI) test edin.

Dikkat edilmesi gerekenler: Datastore kritik seviyeye gelirse VM’ler durabilir.

VM açılmıyor / power on failed

“Power on failed” hatası, VM’in başlatılamadığını gösterir. Bu sorun disk kilitlenmesi, snapshot çakışması veya bozuk VMX yapılandırması nedeniyle ortaya çıkabilir.

Çözüm adımları:

  • VM dosyalarının kilitli olup olmadığını kontrol edin.
  • Snapshot zincirini konsolide edin.
  • VMX dosyasını yeniden oluşturmayı deneyin.
  • VM’i farklı bir host üzerinde test edin.

Dikkat edilmesi gerekenler: Disk kilidi kaldırırken yanlış dosyaya müdahale etmeyin.

Network switch / port group yanlış yapılandırma

Sanal makineler ağ erişimi sağlayamıyorsa, çoğu zaman port group veya vSwitch ayarları hatalıdır. Yanlış VLAN ID seçimi veya trunk port hatası, VM’leri ağdan izole eder.

Çözüm adımları:

  • vSwitch ve port group VLAN ayarlarını kontrol edin.
  • Fiziksel switch trunk portlarını doğrulayın.
  • VM’in doğru port group’a bağlı olduğundan emin olun.
  • Gerekirse yeni bir test port group oluşturun.

Veri merkezinde sunucuları izleyen teknik personeli gösteren gerçek fotoğraf

Dikkat edilmesi gerekenler: VLAN değişiklikleri kısa süreli kesinti yaratabilir.

ESXi update ve patch sorunları

Update sırasında hata alınması, bozuk depot dosyaları veya yetersiz disk alanından kaynaklanabilir. Güncelleme yarıda kalırsa host kararsız hale gelebilir.

Çözüm adımları:

  • Güncelleme öncesi yedek alın ve bakım modu kullanın.
  • Yeterli disk alanı olduğundan emin olun.
  • Offline bundle ve image profile doğrulaması yapın.
  • Güncelleme loglarını inceleyin.

Güncelleme loglarını görmek için aşağıdaki komutu kullanın.

tail -n 200 /var/log/esxupdate.log

Dikkat edilmesi gerekenler: Yanlış patch uygulanması host’un boot edememesine yol açabilir.

Snapshot birikmesi ve performans düşüşü

Snapshot’lar geçici bir güvenlik katmanı sağlar, ancak uzun süre tutulursa performans sorunlarına yol açar. Büyük snapshot dosyaları hem disk kullanımını artırır hem de I/O gecikmesine neden olur.

Çözüm adımları:

  • Uzun süre açık kalan snapshot’ları tespit edin.
  • Snapshot konsolidasyonu yapın.
  • Gereksiz snapshot’ları silin.
  • Snapshot politikası oluşturun.

Dikkat edilmesi gerekenler: Büyük snapshot silme işlemi uzun sürebilir.

vCenter bağlantı problemleri

vCenter bağlantı sorunları genellikle servis durması, sertifika problemi veya DNS çözümleme hataları nedeniyle oluşur. vCenter devre dışı kaldığında, cluster yönetimi kesintiye uğrar.

Çözüm adımları:

  • vCenter servislerini kontrol edin ve yeniden başlatın.
  • DNS ve NTP ayarlarının doğru olduğundan emin olun.
  • Sertifika hatalarını inceleyin.
  • Host’ları yeniden senkronize edin.

Dikkat edilmesi gerekenler: NTP farklılığı bağlantı kopmalarına neden olabilir.

RAID / disk arızası belirtileri

Disk arızası belirtileri, performans düşüşü, I/O hataları ve loglarda disk uyarıları şeklinde görülür. RAID kartı hataları da aynı şekilde datastore erişimini etkiler.

Çözüm adımları:

  • RAID kart loglarını kontrol edin.
  • Disk health durumlarını doğrulayın.
  • Bozuk diski değiştirin ve rebuild sürecini izleyin.
  • Yedeklerin güncel olduğundan emin olun.

Dikkat edilmesi gerekenler: Rebuild sırasında performans düşüşü normaldir.

ESXi log kontrolü (vmkernel.log, hostd.log)

Loglar, ESXi’de yaşanan sorunları teşhis etmenin en net yoludur. vmkernel.log, kernel seviyesindeki hataları; hostd.log ise yönetim servisleri ile ilgili problemleri gösterir.

Çözüm adımları:

  • vmkernel.log dosyasını inceleyin.
  • hostd.log içindeki hata satırlarını analiz edin.
  • Logları merkezi bir syslog sunucusuna yönlendirin.
  • Tekrarlayan hatalar için alert mekanizması kurun.

vmkernel logunu hızlıca incelemek için şu komutu çalıştırın.

tail -n 200 /var/log/vmkernel.log

Dikkat edilmesi gerekenler: Loglar düzenli rotasyonla yönetilmelidir.

ESXi bakım önerileri

  • Düzenli patch ve update planı oluşturun.
  • Snapshot kullanımını politika ile sınırlandırın.
  • Datastore kapasitesini düzenli izleyin.
  • RAID ve disk health kontrollerini otomatikleştirin.
  • NTP ve DNS ayarlarını standart hale getirin.

Sibersunucu destek ekibi, ESXi altyapınızın stabil çalışması için her zaman yanınızda. `;

  • Share On:

  • Tags:

  • #esxi#datastore#vcenter#snapshot#vm