Крупный сбой в работе AT&T в этом году оказался хуже, чем мы думали
Еще 22 февраля этого года в AT&T произошел массовый сбой после неудачного обновления сети. Теперь, несколько месяцев спустя, стал известен полный масштаб сбоя — и он намного больше, чем мы думали в то время.
«Все услуги голосовой связи и передачи данных 5G для клиентов беспроводной связи AT&T были недоступны, что затронуло более 125 миллионов устройств, заблокировав более 92 миллионов голосовых вызовов и предотвратив более 25 000 вызовов в 911 колл-центров», — заявила Федеральная комиссия по связи (FCC) в докладе. его отчет .
Аварии 911 являются здесь самой большой проблемой по причинам, которые легко понять. Нет ничего хуже, чем попытаться дозвониться в службу 911 в чрезвычайной ситуации и оказаться не в состоянии дозвониться. В отчете FCC показано, что AT&T попыталась восстановить FirstNet (сетевой орган первого реагирования) раньше, чем жилые и коммерческие пользователи AT&T, что звучит как правильный путь.
Однако FCC также раскритиковала AT&T за несколько неудач , а также за неспособность протестировать реализацию изменений в сети. Федеральная комиссия по связи указала на отсутствие надзора и контроля для проверки соблюдения процессов или на то, что сами процессы являются недостаточными. AT&T также не была готова к перегрузкам, вызванным попытками пользовательских устройств одновременно повторно подключиться к сети. Сеть AT&T была недостаточно надежной, чтобы уменьшить перегрузку.
Отключение электроэнергии затронуло все 50 штатов и территорий, включая Вашингтон (округ Колумбия), Пуэрто-Рико и Виргинские острова США. В отчете FCC раскритиковала AT&T за несоблюдение передового опыта, согласно которому все изменения в сети должны тщательно тестироваться, анализироваться и утверждаться перед внедрением. AT&T потребовалось более 12 часов, чтобы устранить и полностью восстановить обслуживание.
Если это звучит немного знакомо, то это потому, что это очень похоже на сбой Crowdstrike , который на прошлой неделе вывел из строя устройства Microsoft по всему миру, а также повлек за собой выпуск непроверенного обновления с ошибочным кодом, который сломал все. Это также довольно знакомо, потому что у Verizon произошел аналогичный сбой из-за ошибочного файла обновления в декабре 2022 года, из-за чего компания была оштрафована FCC и подверглась постановлению о согласии.
К чести AT&T, оператор, по крайней мере, признал ответственность за сбой и предоставил пострадавшим клиентам кредит в размере 5 долларов , который, вероятно, не покрыл даже часть телефонных счетов большинства людей. С другой стороны, последствия со стороны FCC, вероятно, будут более серьезными: Бюро общественной и внутренней безопасности передаст дело в Правоприменительное бюро FCC для расследования потенциального нарушения правил FCC.
В случае признания виновной AT&T может быть вынуждена выплатить более значительный штраф и внедрить план обеспечения соответствия, как это сделала Verizon в прошлом месяце, когда ей пришлось заплатить штраф в размере 1,05 миллиона долларов за сбой в декабре 2022 года. Что касается исправлений, в течение двух дней после сбоя AT&T внедрила новые технические средства контроля.
«Это включало сканирование сети на предмет любых сетевых элементов, у которых отсутствуют элементы управления, которые могли бы предотвратить сбой, и оперативное введение этих средств контроля. AT&T постоянно проводит судебно-медицинскую экспертизу и внедрила дополнительные улучшения для повышения надежности и отказоустойчивости сети», — заявили в FCC. Компания также «внедрила дополнительные шаги для экспертной проверки и приняла процедуры, гарантирующие, что работы по техническому обслуживанию не могут проводиться без подтверждения того, что необходимые экспертные проверки были завершены».
Это должно помочь предотвратить будущие сбои, по крайней мере, для AT&T. Тем не менее, похоже, что сбои, которые приводят к выпуску непроверенных обновлений, широко распространены в отрасли, поэтому мы надеемся, что это послужит тревожным сигналом для компаний.