TT'deki servis kesintisi analizi
Merak edenler için Turk Telekom'daki servis kesintisine istinaden yaptığımız incelemenin biraz teknik de olsa detayını paylaşayım. Yaptığımız inceleme Turk Telekom ortamına erişimimiz olmadığı için bazı durumlarda varsayımlardan ibaret kaldı. Ancak bunları diğer ihtimalleri de düşünerek doğrulamaya çalıştık.
Turk Telekom'um uzun süre servis kesintisi vermesinin nedeni bir nevi baz istasyonları için DNS servisi gibi çalışan MME sunucularına olan kesintiden kaynaklanıyor. MME sunucuları, baz istasyonlarına cep telefonu ile ilk bağlantı yapıldığında hangi operatöre kayıtlı olduğunuzun sorgulandığı (HSS Service), aynı zamanda telefon görüşmesi yapacağınız kişinin hangi operatörün hangi baz istasyonuna bağlı olduğunu bulup aradaki bağlantıyı sağlayan, her operatörün bölge başına en az bir adet bulundurduğu servislerdir. Aldığımız duyuma göre (TT ortamına erişimimiz olmadığı için bu kısım duyum olarak kaldı) İstanbul bölgesinde master olarak ayarlanan MME sunucusu çöktüğünde İstanbul bölgesine yedek (slave) olarak çalışan MME sunucusunun devreye girmesi gerekiyordu. Ancak bütün MME servisleri master olarak ayarlandığı için (yanlış konfigürasyon yapılmış) ilk etapta prioritization yapılamadı ve yedek MME servisine erişilemedi. Bu durum detaylı analizler yapıldıktan sonra anlaşılabildi ve hata düzeltildi. Konfigürasyon değişikliği olduğundan durumun düzelmesi zaman aldı. Bu tahminimiz şu şekilde doğrulayabildik: Bazı kullanıcılar cep telefonları ile internete girebilmelerine rağmen başkalarını arayamadılar. Çünkü baz istasyonlarında veri iletimi S1-U denilen ayrı bir bağlantı ucundan sağlanmaktadır. Daha detaylı bilgi için: https://www.netmanias.com/en/?m=view&id=blog&no=5926
TT'den yapılan açıklamada servis kesintisine nedenin trafik yoğunluğu olduğu belirtildi. Ancak operatörlerde operasyonel olarak afet yönetimi kapsamında alınması gereken önlemler var ve bu önlemler yeterince alınmamış görünüyor. Trafik yoğunluğu ülke genelinde yaşandı ama diğer operatörlerde bu tür kesintiler olmadı. Bu durum diğer operatörlerde kriz yönetiminin daha etkin şekilde yapıldığını gösteriyor.