Facebook рассказала о причинах недавнего сбоя работы социальных сетей

0
54

Только сейчас корпорация Facebook опубликовала официальное сообщение в своём блоге, в котором компания подробным образом рассказывается о том, что же именно произошло 4 октября с продуктами компании, почему же к ним нельзя было получить доступ по всему миру. После массового сбоя в работе различных служб и социальных сетей компании, вице-президента компании по инфраструктуре, Сантоша Джанардхана заявил о том, что данное отключение началось с того, что изначально должно было стать внутри компании простым плановым обслуживанием собственных мессенджеров и социальных сетей.

4 октября в какой-то момент была подана команда, которая в свою очередь должна была оценить доступность магистральной сети, соединяющей все разрозненные вычислительные мощности корпорации Facebook. Однако же вместо этого «приказ» непреднамеренно прервал все эти связи. Сантоша Джанардхана утверждает, что ошибка в системе внутреннего аудита компании не помешала должным образом выполнить команду. Так что хоть система и понимала, что «что-то идёт не так», процесс остановлен не был. Данная неполадка в свою очередь вызвала вторичную проблему, которая в конечном итоге превратила этот самый, на первый взгляд незначительный сбой в действительно инцидент международного масштаба.

В тот самый момент, когда DNS-серверы Facebook не смогли подключиться к основным центрам обработки данных компании, они сразу же перестали публиковать информацию о маршрутизации протокола пограничного шлюза, которая как раз таки является необходимой для каждого без исключения устройства в Интернете для подключения к серверу. «Конечным результатом стало то, что наши DNS-серверы стали недоступными, хотя они всё ещё находились в рабочем состоянии. Это сделало невозможным для остальной части Интернета найти наши серверы», — пояснил Сантоша Джанардхана. Более того, известно также стало и о том, что и без того весьма сложную ситуацию усугубляло то, что по причине сбоя даже сами инженеры Facebook не смогли подключиться к серверам, которые им и нужно было исправить.

Более того, потеря функциональности DNS-серверов означала, что они не могли использовать многие внутренние инструменты, от которых они зависят. То есть, они не могли должным образом заняться исследованием корня проблемы, и, следовательно, решить главные сетевые проблемы в сложившихся обстоятельствах. В результате компании пришлось физически отправлять персонал в свои центры обработки данных для урегулирования проблемы. Но даже данный этап осложнялся физическими мерами безопасности, установленными в этих местах.

ОСТАВЬТЕ ОТВЕТ

Please enter your comment!
Please enter your name here