По данным ТСН, проблемы стартовали около 13:48 по киевскому времени 18 ноября. На официальной странице Cloudflare появилось сообщение о «внутренней деградации сервисов», после чего пользователи со всего мира начали жаловаться на недоступность популярных сайтов - среди них X (Twitter), ChatGPT, Canva, и другие.
Пострадали также инструменты Access и WARP, которые временно перестали отвечать на запросы.
Около 16:42 Cloudflare сообщила, что исправление готово. Хотя большинство сервисов возобновили работу, аналитические панели и журналы ошибок оставались частично недоступными еще несколько часов. Инженеры продолжали отслеживать остаточные эффекты.
Масштабность сбоя объясняется тем, что модуль защиты от ботов Cloudflare стоит непосредственно на пути пользовательского трафика, поэтому любая его неисправность автоматически блокирует запросы даже от реальных пользователей.
По данным Reuters, из-за инцидента в пиковый момент пострадала примерно пятая часть мирового интернет-трафика. Технический директор Cloudflare Дейн Кнехт рассказал, что произошло на самом деле. По словам Кнехта, причиной инцидента стал сбой в сервисе, который отвечает за защиту от ботов. Во время рутинной смены конфигурации обнаружился «спящий» баг, который спровоцировал цепную деградацию инфраструктуры.
«Мы зафиксировали всплеск необычного трафика к одному из сервисов Cloudflare. Это повлекло ошибки в трафике, который проходил через сеть», - признал технический директор Cloudflare.
Компания опубликовала извинения, заверив, что уже проводит внутренний аудит, чтобы предотвратить подобные инциденты в будущем.
«Мы активно работаем над тем, чтобы обеспечить корректную доставку всего трафика без ошибок», - говорится в заявлении сервиса.