GitHub Actions çöktü
(githubstatus.com)- GitHub durum sayfası şu anda All Systems Operational gösteriyor ve 27 Mayıs 2026 için bildirilen bir incident yok
- Son 90 günde tüm ana bileşenler Operational durumda; Actions kullanılabilirliği %99,66, Pull Requests ise %99,55
- 26 Mayıs'ta Actions ve Pages tarafında kimlik doğrulama sorunları nedeniyle çalıştırma başlatma ve action indirme hataları yaşandı; Actions çalıştırmalarının çoğu etkilendi
- 20 Mayıs'taki Actions gecikmesinin nedeni yanlış yapılandırılmış bir health check idi; tüm çalıştırmaların %4,5'i ve scale set işlerinin %30'u gecikti
- 15 Mayıs'taki Actions bozulması, planlı failover sırasında yaşanan yönlendirme sorunundan kaynaklandı ve en yüksek noktada çalıştırmaların %42'si başarısız oldu
Mevcut hizmet durumu
- GitHub durum sayfası şu anda All Systems Operational olarak görünüyor
- 27 Mayıs 2026 için bildirilmiş incident yok olarak işaretlenmiş
- Son 90 günde ana bileşenlerin tamamı Operational durumda
- Git Operations: %99,83 kullanılabilirlik
- Webhooks: %99,73 kullanılabilirlik
- API Requests: %99,98 kullanılabilirlik
- Issues: %99,86 kullanılabilirlik
- Pull Requests: %99,55 kullanılabilirlik
- Actions: %99,66 kullanılabilirlik
- Packages: %99,98 kullanılabilirlik
- Pages: %99,96 kullanılabilirlik
- Copilot: %99,91 kullanılabilirlik
- Codespaces: %99,77 kullanılabilirlik
- Copilot AI Model Providers: %100,0 kullanılabilirlik
- GitHub Enterprise Cloud için bölgesel durum sayfaları da ayrıca sunuluyor
26 Mayıs 2026 Actions ve Pages incident'ı
-
Actions ve Pages incident'ı
- 10:57 UTC'de Actions ve Pages performans düşüşü için inceleme başlatıldı
- 11:19 UTC'de Actions tarafında kullanılabilirlik düşüşü doğrulandı
- 11:53 UTC'de Actions çalıştırmalarının başlatılamamasına ve action indirme hatalarına yol açan kimlik doğrulama sorunu inceleniyordu; o sırada Actions çalıştırmalarının büyük bölümü etkilenmişti
- 12:37 UTC'de GitHub Actions'ı etkileyen kimlik doğrulama sorununun kök nedeni belirlendi ve hafifletme çalışmaları başlatıldı
- 13:00 UTC'de Actions ve Pages tarafındaki bozulma hafifletildi ve kararlılığı doğrulamak için izleme aşamasına geçildi
- 13:18 UTC'de incident çözüldü; ayrıntılı kök neden analizi hazır olduğunda paylaşılacak
20 Mayıs 2026 Actions incident'ı
-
Actions incident'ı
- 16:00 ile 17:45 UTC arasında GitHub Actions müşterileri 5 dakikayı aşan çalıştırma başlatma gecikmeleri yaşadı
- Etki süresi boyunca tüm çalıştırmaların yaklaşık %4,5'i gecikti ve scale set işleri daha ağır etkilendi
- scale set işlerinin %30'u gecikti, %4'ü ise hiç başlayamadı
- Neden, runner'lara iş atayan dahili servisteki yanlış yapılandırılmış health check idi
- Üst bağımlılıklardaki kısa süreli gecikme artışı, birden çok pod'da health check başarısızlıklarını tetikledi; bu pod'lar servisten çıkarılınca yük kalan kapasite üzerine yığıldı
- Ek yük bellek baskısına yol açtı ve bir bölgesel cluster'da zincirleme arıza büyüyerek kendi kendine toparlanamaz hale geldi
- Müdahale, sağlıklı bölgesel cluster'ın kapasitesini artırıp bozulmuş bölgesel cluster'dan trafiği çıkarmak şeklinde yapıldı; ardından çalıştırma başlatma gecikmeleri düzeldi
- Tekrarını önlemek için health check yapılandırması, zincirleme arıza senaryolarını önleyecek şekilde güçlendiriliyor; ayrıca bölgesel bozulmalarda trafiği yeniden dağıtacak otomatik hafifletme yöntemleri değerlendiriliyor
- 20:14 UTC'de incident çözüldü
15 Mayıs 2026 Actions kullanılabilirlik düşüşü
-
Actions kullanılabilirlik düşüşü
- 07:43 ile 08:48 UTC arasında GitHub Actions'ta bazı müşteriler için workflow çalıştırma başarısızlıkları veya başlatma gecikmeleri yaşandı
- Incident, GitHub Actions'ın kullandığı destek altyapısındaki planlı failover sürecinde başladı
- Failover sırasında otomatik servis keşfi güncellemesi doğru şekilde yayılmadı, bu yüzden trafik yanlış yönlendirildi ve workflow orkestrasyonunun kritik bir bağımlılığında istek zaman aşımları arttı
- En yoğun etki anında Actions çalıştırmalarının %42'si başarısız oldu
- Actions workflow çalıştırmalarına bağımlı downstream servisler de etkilendi; buna GitHub Pages ve Copilot cloud services dahildi
- 08:12 UTC'de müdahale ekibi servis keşfi yönlendirme sorununu manuel olarak düzeltti
- Zaman aşımları ve hata oranları kısa süre içinde toparlandı, etkilenen tüm servisler kararlı hale gelene kadar izleme sürdürüldü
- Tekrarını önlemek için, failover tamamlanmadan önce servis keşfi durumunu doğrulayan failover guardrail'leri, daha güçlü öncesi/sonrası doğrulamalar ve altyapı olayları sırasında zaman aşımı zincirlerini azaltacak bağımlılık dayanıklılığı iyileştirmeleri üzerinde çalışılıyor
- 08:48 UTC'de incident çözüldü
1 yorum
Hacker News yorumları