Математика очередей и ресурсов: от телефонных станций до нейросетей

Как математика помогает справляться с очередями, почему биологические клетки похожи на компьютерные сети и во что обходится планете каждый запрос к ChatGPT? В рамках лекции в The Royal Institution Джейн Хиллстон (Jane Hillston), профессор и специалист в области компьютерных наук, рассказала о механизмах оптимизации систем — от почтовых отделений до нейросетей нового поколения.

🚶 Теория очередей: почему мы всегда ждем 1:05

Очереди часто воспринимаются как нечто специфически британское, однако, по словам Джейн Хиллстон, это универсальный феномен, возникающий везде, где есть ограниченный ресурс . С математической точки зрения очередь — это прямое следствие дефицита.

Существует два радикально разных взгляда на любую систему:

Пользователь хочет «бесконечного ресурса», когда новое окно обслуживания открывается мгновенно именно для него .
Оператор системы стремится к эффективности и минимизации простоев, чтобы сотрудники или оборудование не работали «вхолостую» .

В этой дихотомии и рождается дисциплина под названием «моделирование производительности» (performance modeling) . Её цель — найти «золотую середину», где пользователи удовлетворены временем отклика, а система остается устойчивой и экономически выгодной . При этом 100%-я загрузка ресурсов почти всегда делает систему хрупкой и ведет к коллапсу при малейшем сбое .

☎️ От телефонных станций к формуле Эрланга 9:21

Основы современной теории оптимизации были заложены в начале XX века датским математиком Агнером Эрлангом. Работая в телекоммуникационной компании, он решал задачу: сколько соединительных линий нужно телефонной станции, чтобы абоненты не получали отказ при попытке дозвониться .

Эрланг вывел формулу, которая до сих пор используется в современных кол-центрах и банковских системах. Ключевой параметр в ней — E (Эрланг), безразмерная величина, описывающая нагрузку на систему .

Параметры формулы включают:

Частоту поступления заявок (как часто люди звонят).
Среднюю продолжительность обслуживания (как долго длится разговор).
Количество серверов (M) (сколько каналов связи доступно) .

Произведение частоты заявок на среднее время их обработки дает объем работы, который система должна выполнить. Если количество ресурсов (M) подобрано неправильно, вероятность блокировки (отказа в обслуживании) резко возрастает .

📉 Закон Литтла и магия случайности 20:03

В 1961 году Джон Литтл математически доказал формулу, которая была известна ранее, но считалась применимой только для простых случаев. Закон Литтла гласит, что среднее количество клиентов в системе (L) равно произведению интенсивности входящего потока (λ) на среднее время пребывания клиента в системе (W) .

Джейн Хиллстон подчеркивает уникальность этого закона: он работает для любой системы, независимо от того, в каком порядке обслуживаются клиенты (первым пришел — первым ушел или в порядке приоритетности) и распределения времени обслуживания .

Однако на практике «человеческий фактор» и случайность вносят хаос:

Детерминированная система: если клиенты приходят строго раз в 2 минуты, а обслуживание длится ровно 1 минуту, очереди никогда не будет .
Случайная система: если при той же средней частоте клиенты приходят «пачками» (bursty arrival), а время обслуживания варьируется, начинают расти огромные очереди, даже если система загружена всего на 50% .

Для описания таких процессов математики используют цепи Маркова — модели, где система переходит из одного состояния в другое (например, количество людей в очереди увеличивается или уменьшается) с определенной вероятностью .

💻 Процессные алгебры: когда системы становятся сложными 34:57

Традиционная теория очередей хорошо работала до 1980-х годов, пока компьютеры были изолированными устройствами. С появлением интернета системы стали распределенными и параллельными . Современный запрос (например, бронирование отеля на Expedia) одновременно запускает десятки подзапросов к разным авиакомпаниям и базам данных .

Для моделирования таких процессов Джейн Хиллстон и её коллеги разработали PEPA (Performance Evaluation Process Algebra) — язык программирования, который компилируется не в машинный код, а в математические модели (цепи Маркова) .

Примеры применения PEPA:

Логистика в Бельгии: оптимизация движения грузовых судов через шлюзы и мосты, которые являются «узкими местами» каналов .
Мобильные сети 3G: расчет необходимого количества частот и расположения базовых станций для обслуживания абонентов .
Автобусные системы в Италии: проверка скорости передачи сигналов от датчиков к водителю для обеспечения безопасности движения .

🧪 Биология как вычислительная система 45:38

Удивительным открытием для ученых стало то, что методы оптимизации компьютерных сетей идеально подходят для описания живых организмов. В клетках ресурсами выступают белки, а в экосистемах — пространство или питательные вещества .

Джейн Хиллстон приводит в пример модель клеточного цикла, основанную на работе Альберта Голдбетера (1991). В ней белок циклин управляет делением клеток через цепочку химических реакций . Применение «компьютерного» моделирования к биологии требует перехода от счета отдельных молекул к анализу их концентрации с помощью обыкновенных дифференциальных уравнений (ODE) . Математика позволяет увидеть, как мутация одного белка ломает ритм деления клеток, что может приводить к развитию заболеваний .

🤖 Цена интеллекта: энергетический кризис ИИ 50:47

Современный этап развития ИИ, по мнению Джейн Хиллстон, характеризуется опасным игнорированием ресурсов. Разработчики больших языковых моделей (LLM) десятилетиями ориентировались только на «производительность» в смысле точности ответов, следуя логике «чем больше ресурсов, тем лучше результат» .

Цифры, которые приводит исследователь:

Запрос в ChatGPT потребляет в 100 раз больше энергии, чем поиск в Google .
Обучение модели Llama привело к выбросу 539 метрических тонн CO2 .
Google рассматривает возможность строительства собственных атомных электростанций для обеспечения нужд дата-центров .

Хиллстон отмечает, что традиционные метрики производительности (время отклика) в случае с ИИ работают плохо. Обучение модели может занимать месяцы, задействуя тысячи процессоров со 100%-й загрузкой, что делает систему крайне дорогой и неэкологичной .

🚀 DeepSeek: вынужденная эффективность 58:54

В начале 2025 года внимание научного сообщества привлекла модель DeepSeek. По словам Джейн Хиллстон, этот кейс интересен именно с точки зрения оптимизации ресурсов. Разработчики DeepSeek не имели доступа к таким же масштабным вычислительным мощностям, как американские технологические гиганты, и были вынуждены искать более эффективные инженерные решения .

Основные выводы лекции:

Ресурсы первичны: невозможно бесконечно улучшать системы, игнорируя стоимость их содержания.
Математика дает зрение: простые формулы позволяют предсказать коллапс сложной системы еще на этапе проектирования .
Необходимость — мать изобретения: ограничение ресурсов часто ведет к более качественному проектированию, чем их избыток .