Когда у офиса на 100 человек пропадает интернет, через 15 минут начинают звонить из коммерческого отдела, через 30 минут пишет генеральный, через час кто-то едет в магазин за LTE-модемом. К концу дня бухгалтерия считает, во сколько обошлась эта «небольшая авария» у провайдера.
Резервирование интернета — это не «вторая железка в стойке». Это бизнес-решение, у которого есть цена входа и цена отказа. Эта статья — для CIO (директор по ИТ), руководителя административно-хозяйственного отдела или системного администратора, который должен обосновать бюджет на отказоустойчивость перед финансовым директором.
Разберём по порядку: сколько реально стоит час простоя, какие три схемы резервирования существуют, что происходит с VoIP-звонками в момент переключения, что должно быть в SLA провайдера и какие пять ошибок повторяют чаще всего.
Сколько стоит час простоя — расчёт по статьям
Чтобы говорить о резервировании на языке бизнеса, нужны цифры. Возьмём типовой офис: 100 сотрудников, средняя зарплата с налогами 120–180 тыс. руб./мес., 168 рабочих часов в месяц.
Статья 1. ФОТ простаивающих сотрудников. ФОТ (фонд оплаты труда) на час работы одного сотрудника — в диапазоне 720–1 080 руб. На 100 человек это 72 000–108 000 руб./час «сгорает» при полном простое. На практике не все 100 % сотрудников зависят от интернета — кто-то пишет в Word, кто-то на встрече. Реальный коэффициент простоя — как правило, 60–80 %, то есть 45 000–85 000 руб./час прямых потерь по ФОТ.
Статья 2. Упущенная выручка. Если в офисе сидит отдел продаж или клиентская поддержка, час простоя означает несостоявшиеся звонки и непринятые заявки. Для компании с месячной выручкой 30–60 млн руб. и равномерным потоком сделок час «слепоты» — это 50–150 тыс. руб. упущенной выручки. В пиковые часы (понедельник утром, конец квартала) цифра увеличивается в 1,5–2 раза.
Статья 3. Потерянные звонки и сорванные коммуникации. VoIP (передача голоса через интернет) при отказе канала отваливается мгновенно. Клиент, который дозванивался 10 минут и услышал «абонент недоступен», уходит к конкуренту — обычно безвозвратно. Один потерянный B2B-лид (потенциальный клиент) с LTV (lifetime value — пожизненная ценность) 200–500 тыс. руб. — это уже половина годового бюджета на резервирование.
Статья 4. Репутационный ущерб. Сложно оцифровать, но реален: клиент, не дозвонившийся в техподдержку, оставляет отзыв. Один негативный отзыв в Яндексе для сервисной компании стоит, как правило, 2–5 новых клиентов.
Итого: час полного простоя интернета в офисе на 100 человек — 150 000–400 000 руб. прямых и косвенных потерь. Восьмичасовой простой по причине обрыва магистрали у единственного провайдера — это легко миллион рублей. Бюджет на резервирование начинается от 15–40 тыс. руб./мес. — окупается, как правило, одной предотвращённой аварией в год.
Это не «теоретические страшилки». Аварии на магистральных линиях, отключения за неуплату на ЦОДе, обрывы кабеля при ремонте теплотрассы — происходят с любым провайдером. Вопрос не «если», а «когда».
Три схемы резервирования — детальный разбор
Архитектурно есть три рабочих сценария. У каждого свой бюджет, свои ограничения и своя скорость переключения.
Схема 1. Два провайдера + NAT-failover на роутере (5–60 секунд)
Самая распространённая и доступная схема. В офис заведено два независимых канала от двух провайдеров (в идеале — по разным физическим трассам). На границе сети стоит роутер (MikroTik, Cisco, Keenetic для совсем небольших офисов), который умеет работать с двумя WAN-портами.
Как работает: - основной канал активен, через него идёт весь трафик; - роутер каждые 1–3 секунды проверяет доступность интернета через основной канал (пингом на 8.8.8.8 или нескольких хостов); - при потере 3–5 проверок подряд роутер автоматически переключает default route (маршрут по умолчанию) на резервный канал; - NAT (преобразование сетевых адресов) пересобирается, исходящие соединения идут через IP резервного провайдера; - при восстановлении основного канала — обратное переключение.
Скорость переключения: 5–60 секунд в зависимости от настройки таймеров. Меньше 5 секунд опасно — есть риск ложных срабатываний при кратковременных «морганиях».
Стоимость: 10–30 тыс. руб./мес. за второй канал + 30–80 тыс. руб. разово на роутер с лицензией.
Минус: все активные TCP-сессии (включая VoIP-звонки, RDP, VPN) рвутся — у нового канала другой публичный IP. Клиент после переключения должен переподключиться заново.
Кому подходит: офисы 20–200 человек, где критичны почта и веб, а голос работает через корпоративный PBX (private branch exchange — офисная АТС) с авторегистрацией.
В нашей практике 80 % B2B-офисов берут именно эту схему. Когда оба канала идут от одного провайдера (наш случай), цена входа падает в 1,5–2 раза: один договор, один счёт, одна точка ответственности — про SLA-эскалацию мы подробно писали в материале про NOC 24/7 (Network Operations Center — центр управления сетью).
Схема 2. BGP с собственным AS и PI-блоком IP (мгновенное переключение)
Корпоративный уровень. Подходит для компаний, у которых интернет — это бизнес: интернет-магазин с собственными серверами, биржа, банк, телемедицина, любой публичный сервис.
Как работает: - компания получает собственный ASN (autonomous system number — номер автономной системы) от RIPE NCC — европейского регистратора; - получает блок PI-адресов (provider independent — независимый от провайдера блок IP), например, /24 (256 адресов); - анонсирует свой блок через BGP (border gateway protocol — протокол граничного шлюза) одновременно у двух провайдеров; - при падении одного канала BGP автоматически «снимает» анонс с упавшего стыка, мировой интернет за 30–180 секунд узнаёт, что трафик нужно слать через второго провайдера; - публичные IP остаются теми же — активные TCP-сессии не рвутся (если оборудование внутри корректно держит state).
Скорость: для исходящих соединений — практически мгновенно. Для входящих — зависит от скорости сходимости BGP-таблиц у соседей, обычно 30–180 секунд.
Стоимость: 100–200 тыс. руб. разово на проектирование, оборудование класса Cisco ISR / Juniper / MikroTik CCR + 50–150 тыс. руб./мес. за два канала с поддержкой BGP. Плюс ежегодные взносы в RIPE.
Минус: нужен квалифицированный сетевик в штате или на ретейнере (ежемесячный фикс-договор). Ошибка в BGP-фильтрах может на пару часов «увести» трафик в чужую сеть — это публичный инцидент, такие истории попадают в новости.
Кому подходит: компании с собственными публичными сервисами, IT-аутсорсеры с инфраструктурой клиентов, любой бизнес, где даже минута простоя стоит дороже годового бюджета BGP-решения.
Схема 3. Основной канал + LTE/4G как резерв (бюджетный backup)
«Поясная сумка» на случай совсем неприятного дня. Дёшево, ставится за час, но скорость и стабильность сильно проигрывают полноценному второму каналу.
Как работает: - основной проводной канал — основной; - в роутер вставлен USB-модем или подключён отдельный LTE-роутер с SIM-картой корпоративного оператора; - логика та же, что в схеме 1 — переключение по failover; - при отказе провода трафик идёт через сотовую сеть.
Скорость переключения: 10–60 секунд.
Стоимость: 3–8 тыс. руб./мес. за корпоративный безлимит + 15–40 тыс. руб. разово на модем/роутер.
Минусы: - скорость LTE в офисном здании в час пик — обычно 5–30 Мбит/с (а провод даёт 100–1000 Мбит/с). Видеоконференции тормозят, файлы по 200 МБ грузятся минутами; - скрытые сервера и удалённый доступ через LTE работают плохо — у оператора NAT (Carrier-Grade NAT), внешний IP «серый»; - при массовой аварии в районе (отключение электричества, авария на узле) LTE-сеть тоже перегружена.
Кому подходит: маленькие офисы 5–30 человек, точки продаж, временные офисы, как третий уровень резервирования для филиалов. Для серверной инфраструктуры — категорически нет.
VoIP во время переключения — главная боль
При смене канала с публичным IP — даже при переключении за 5 секунд — текущие голосовые звонки оборвутся. Это техническое свойство SIP (Session Initiation Protocol — протокол установления голосовой сессии): сессия привязана к IP-адресу.
Есть три способа сделать так, чтобы звонки не пропадали.
Способ 1. SBC (Session Border Controller — пограничный контроллер сессий). Устройство (или софт) между офисным PBX и оператором VoIP, которое «маскирует» смену IP. При переключении канала SBC удерживает сессию активной и переподключается к SIP-серверу заново — для клиента и оператора это незаметно, разговор продолжается. Стоимость — от 80 тыс. руб. за младшую модель.
Способ 2. Регистрация PBX на двух SIP-trunk одновременно. Современные АТС (Asterisk, FreePBX, 3CX, Mango) умеют держать одновременно два SIP-аккаунта у разных операторов. При отказе одного — звонки маршрутизируются через второй. Текущий разговор всё равно прервётся, но новый звонок пройдёт через 5–10 секунд.
Способ 3. Локальный PBX с буфером и BGP (схема 2). Если используется схема 2 с BGP и публичный IP сохраняется, локальный PBX продолжит работу без обрыва. Это единственный сценарий, в котором текущий разговор гарантированно не прервётся при отказе провайдера.
Для большинства офисов реалистичная цель: новые звонки начинают проходить через 10–30 секунд после аварии, текущие 1–2 разговора могут оборваться. Это приемлемый компромисс между ценой и качеством.
Что должно быть в SLA провайдера — чек-лист 7 пунктов
SLA (Service Level Agreement — соглашение об уровне сервиса) — это контракт, в котором провайдер берёт на себя финансовые обязательства за качество услуги. Без жёсткого SLA «второй канал» — это просто две одинаковые лотереи.
Что обязательно проверить перед подписанием:
- Гарантированное время восстановления (MTTR — mean time to restore). Не «реагируем за 30 минут», а «восстанавливаем за 4 часа». Обычная норма для бизнес-канала — 4–8 часов.
- Время реакции на заявку. 15 минут в режиме 24/7 — норма. Если провайдер реагирует «в рабочее время с 9 до 18» — это не корпоративный SLA.
- Разные физические трассы для двух каналов. Если оба кабеля идут в одну муфту, при обрыве экскаватором отвалятся оба. В SLA должна быть прописана геораспределённость.
- Разное оборудование на узлах. Каналы не должны замыкаться на одну железку у провайдера. Эту деталь обычно скрывают — спрашивайте прямо.
- Финансовая компенсация за простой. Стандарт — возврат абонентской платы пропорционально времени простоя сверх SLA. Хороший SLA — компенсация в 2–5х от стоимости услуги.
- Outage report (отчёт по инциденту). Провайдер обязан в течение 24–48 часов прислать формальное объяснение причины аварии. Это дисциплинирует обе стороны.
- Эскалация инцидентов. Прямые контакты дежурного инженера, тех. директора, коммерческого директора — не общая «горячая линия».
Подробнее о том, как читать SLA и какие подводные камни в типовых договорах — мы разбирали в статье про SLA и юридические нюансы для B2B-связи.
Типичные ошибки резервирования — 5 пунктов
- Оба канала от одного провайдера через одну точку входа. Кажется, что «два канала есть» — формально да. Но при пожаре в кроссовой или отключении узла провайдера падают оба. Это псевдорезервирование. Решение: либо два разных провайдера, либо один провайдер, но с подтверждёнными разными трассами и оборудованием.
- Не тестируют переключение. Failover настроили год назад, с тех пор не проверяли. В день аварии выясняется, что у роутера слетела лицензия / у резервного канала истёк IP / SIM-карта заблокирована за неактивность. Тестировать переключение — раз в квартал, в нерабочее время.
- Резерв медленнее основного в 10 раз. Основной — 1 Гбит/с, резервный — 100 Мбит/с. При переключении видеоконференция стоит, файлы не выгружаются. Резерв должен покрывать минимум 60–70 % от основного канала.
- Игнорируют DNS. При переключении на резервный канал DNS-резолверы провайдера 1 могут быть недоступны, а на новых DNS закэшированы старые записи. Решение — использовать публичные DNS (1.1.1.1, 8.8.8.8) или собственный DNS-сервер в офисе.
- Резервируют интернет, но не электричество. При отключении света роутер выключается, и неважно, сколько у вас провайдеров. ИБП (источник бесперебойного питания) на роутер и PBX — обязательное условие, иначе вся схема не имеет смысла.
Сравнительная таблица: 3 схемы
| Параметр | Схема 1: NAT-failover | Схема 2: BGP + ASN | Схема 3: LTE-резерв |
|---|---|---|---|
| Скорость переключения | 5–60 сек | мгновенно для исходящих, 30–180 сек для входящих | 10–60 сек |
| Обрыв активных сессий | да | нет | да |
| Стоимость входа (разово) | 30–80 тыс. руб. | 100–200 тыс. руб. + взносы RIPE | 15–40 тыс. руб. |
| Стоимость владения (мес.) | 10–30 тыс. руб. за 2-й канал | 50–150 тыс. руб. за 2 канала с BGP | 3–8 тыс. руб. |
| Скорость резерва | равна основному | равна основному | в 5–20 раз ниже |
| Требует штатного сетевика | желательно | обязательно | нет |
| Подходит для | офисов 20–200 чел. | публичные сервисы, биржи, телемед | малые офисы, временные точки |
FAQ
Можно ли получить второй канал у того же провайдера, что и основной? Можно и часто разумно — при условии, что провайдер подтверждает разные физические трассы и разное оборудование на узлах. Плюсы: один договор, единая поддержка, одна точка ответственности при инциденте. Минус: общий риск, если у провайдера падает магистраль целиком — что случается редко, но случается.
Сколько времени занимает подключение второго канала? Если канал технически доступен (есть кабель в БЦ) — 5–10 рабочих дней. Если нужна прокладка кабеля по дому или согласование с управляющей компанией — 3–8 недель.
Нужен ли BGP, если у нас «обычный» офис без публичных серверов? Как правило, нет. BGP оправдан, когда компания держит у себя публичные сервисы (сайт, почтовый сервер, VPN-концентратор) и не может позволить себе смену внешнего IP. Для офиса с облачной 1С и Microsoft 365 хватает схемы 1 с NAT-failover.
Защитит ли резервирование от DDoS-атаки? Нет. Резервирование — про физический отказ канала. От DDoS защищает специализированный сервис очистки трафика на стороне провайдера или внешнего фильтра (Qrator, StormWall, Cloudflare).
Может ли LTE быть единственным резервом для офиса на 50 человек? Может — как временное решение или для офиса, где интернет нужен только для почты и веба. Для VoIP-нагрузки в 30+ одновременных звонков и активной работы с облачными ERP/CRM (системами управления ресурсами и клиентами) — нет, LTE не вытянет.
Как часто нужно тестировать переключение на резерв? Раз в квартал — минимально. Хорошая практика — раз в месяц, в субботу утром, с уведомлением сотрудников. Тестирование занимает 20–30 минут.
Что делать, если бюджета на полноценный второй канал нет? Начать с LTE-резерва и качественного SLA у основного провайдера — это даст 80 % защиты за 20 % бюджета. Через полгода-год, когда руководство увидит счёт за один реальный простой, бюджет на полноценный второй канал согласуется быстрее.
Вывод
Резервирование интернета — не техническая прихоть, а финансовый расчёт. Бюджет 15–40 тыс. руб./мес. на второй канал окупается, как правило, одной предотвращённой аварией в год: при потерях 150–400 тыс. руб./час даже четыре часа простоя стоят дороже годового резервирования.
Для большинства B2B-офисов 20–200 человек оптимум — схема 1: два канала с NAT-failover на корпоративном роутере, переключение за 10–30 секунд, корректная работа VoIP через двойную регистрацию PBX. Сложные схемы с BGP и собственным ASN — для компаний с публичными сервисами, где даже короткий обрыв TCP-сессии критичен.
Главное — не «купить вторую железку», а заранее протестировать переключение, прописать жёсткий SLA с конкретными цифрами MTTR и компенсаций и обеспечить ИБП на ключевое оборудование. Без этих трёх условий резервирование существует только на бумаге.
Если разбираете архитектуру для своего офиса и нужен независимый расчёт по трём схемам с привязкой к вашему БЦ и текущему провайдеру — напишите нам, подготовим сравнительную смету и схему стыков.
Получите расчёт IT-аутсорсинга для вашей инфраструктуры
Бесплатный аудит, письменный отчёт и смета — за 1 рабочий день. Аудит ни к чему не обязывает.