Digital Доктор

Один день из жизни Доктора

Все вы знаете, что я занимаюсь бизнесом в интернете.

Недавно с моим самым большим проектом, который ежедневно посещают около 150.000 человек в день, случилось одно приключение, о котором я хотел бы вам поведать. Чтобы вы могли, так сказать, влезть в шкуру предпринимателя.

Что ж, начнем.

Когда у вас проект на 4,5 млн. уникальных посещений в месяц, да еще и с активными действиями пользователей внутри, то это перестает быть похожим на поддержку привычных простеньких сайтов и блогов.

Ваш сайт, который еще недавно требовал оплаты хостинга на пару сотен баксов в месяц, превращается в подобие космического корабля.

Я говорю абсолютно серьезно: разработка и поддержание highload-проекта (то есть, высоконагруженного), это точь-в-точь как запуск ракеты.

Все системы должны быть задублированы, а еще лучше – утроены, на случай каких-либо сбоев. Кроме того, каждая система вашего сайта должна содержать в себе подсистему контроля за правильностью ее работы, которая в идеале также должна быть задублирована. В общем, как я уже сказал, как в космическом корабле: все дублируется, все проверяется и потом еще раз перепроверяется. На любое отклонение от нормы есть сотни различных уведомлений и круглосуточный дежурный в посменном формате.

Так вот, когда вы внедряете подобную систему, то оплата хостинга начинает стоить не 200-300 долларов в месяц, а все 8.000-10.000$. Ведь все системы проверки тоже очень активно кушают ресурсы.

И не забывайте о возросших затратах на администрирование ваших серверов и круглосуточную работу живого человека, который должен держать все это на контроле.

Имея уже 10-летний опыт копошения в этом Rocket Science, начинаешь выбирать хостинг-провайдера очень специфично. Когда вы хотите сделать дубль вашей системы в другом вычислительном центре, вы начинаете выяснять, не находятся ли они в одном районе города с текущим (возможность отключения света во всем районе), какие у них есть резервы по увеличению мощности при необходимости (при наплыве трафика вы просто не сможете быстро докупить мощностей), из каких материалов и как именно построены их центры (риск возгорания), не подключены ли они к одному и тому же провайдеру интернета (отрубится сразу у всех). В общем, со стороны можно подумать, что ты просто становишься психом, узнавая такие подробности.

Но практика показывает, что все это не зря. Примерно полгода назад в нашем проекте случился «идеальный шторм». На тот момент мы имели двойную резервную копию системы на случай неполадок. То есть, все дублировалось в реальном времени дважды. Это значит, что за 10 минут можно переключиться с упавшего хостинга на резервный, и пользователи практически ничего не заметят.

И вот, у основного хостинга случился пожар (натурально загорелись сервера), и все упало. Наш сотрудник по инструкции перекинул сайт на первую резервную копию у другого хостинг-провайдера. Эти провайдеры находились в одном районе города. Пожар и перегрузка, связанная с ним, вызвала перебои электричества во всем районе, в результате чего у второго провайдера также начались проблемы с доступностью.

Пришлось переходить на последнюю резервную систему. Ради экономии она была меньшего размера, и когда на нее хлынул трафик, то она начала жестко виснуть. Мы думали, что легко сможем ее масштабировать за пару минут просто доплатив, но оказалось, что у этого провайдера просто нет мощностей в резерве.

В итоге со всем нашим двойным дублированием мы оказались в полной жопе. Сайт сильно тупил (хоть и не ушел в офлайн) и Google уже через 12 часов отреагировал на это, начав снижать нам SEO-трафик. В общем, сутки героической работы нашей команды помогли восстановить работоспособность, но эти простои безусловно вызвали у компании финансовые потери.

После этого мы стали использовать больше облачных технологий, но и там далеко не все идеально, друзья)

Поэтому, когда меня спрашивают, каково это – работать с highload-проектом, я отвечаю, что это как будто вы каждую неделю запускаете человека на Луну.