Как математика помогает справляться с очередями, почему биологические клетки похожи на компьютерные сети и во что обходится планете каждый запрос к ChatGPT? В рамках лекции в The Royal Institution Джейн Хиллстон (Jane Hillston), профессор и специалист в области компьютерных наук, рассказала о механизмах оптимизации систем — от почтовых отделений до нейросетей нового поколения.
🚶 Теория очередей: почему мы всегда ждем 1:05
Очереди часто воспринимаются как нечто специфически британское, однако, по словам Джейн Хиллстон, это универсальный феномен, возникающий везде, где есть ограниченный ресурс . С математической точки зрения очередь — это прямое следствие дефицита.
Существует два радикально разных взгляда на любую систему:
- Пользователь хочет «бесконечного ресурса», когда новое окно обслуживания открывается мгновенно именно для него .
- Оператор системы стремится к эффективности и минимизации простоев, чтобы сотрудники или оборудование не работали «вхолостую» .
В этой дихотомии и рождается дисциплина под названием «моделирование производительности» (performance modeling) . Её цель — найти «золотую середину», где пользователи удовлетворены временем отклика, а система остается устойчивой и экономически выгодной . При этом 100%-я загрузка ресурсов почти всегда делает систему хрупкой и ведет к коллапсу при малейшем сбое .
☎️ От телефонных станций к формуле Эрланга 9:21
Основы современной теории оптимизации были заложены в начале XX века датским математиком Агнером Эрлангом. Работая в телекоммуникационной компании, он решал задачу: сколько соединительных линий нужно телефонной станции, чтобы абоненты не получали отказ при попытке дозвониться .
Эрланг вывел формулу, которая до сих пор используется в современных кол-центрах и банковских системах. Ключевой параметр в ней — E (Эрланг), безразмерная величина, описывающая нагрузку на систему .
Параметры формулы включают:
- Частоту поступления заявок (как часто люди звонят).
- Среднюю продолжительность обслуживания (как долго длится разговор).
- Количество серверов (M) (сколько каналов связи доступно) .
Произведение частоты заявок на среднее время их обработки дает объем работы, который система должна выполнить. Если количество ресурсов (M) подобрано неправильно, вероятность блокировки (отказа в обслуживании) резко возрастает .
📉 Закон Литтла и магия случайности 20:03
В 1961 году Джон Литтл математически доказал формулу, которая была известна ранее, но считалась применимой только для простых случаев. Закон Литтла гласит, что среднее количество клиентов в системе (L) равно произведению интенсивности входящего потока (λ) на среднее время пребывания клиента в системе (W) .
Джейн Хиллстон подчеркивает уникальность этого закона: он работает для любой системы, независимо от того, в каком порядке обслуживаются клиенты (первым пришел — первым ушел или в порядке приоритетности) и распределения времени обслуживания .
Однако на практике «человеческий фактор» и случайность вносят хаос:
- Детерминированная система: если клиенты приходят строго раз в 2 минуты, а обслуживание длится ровно 1 минуту, очереди никогда не будет .
- Случайная система: если при той же средней частоте клиенты приходят «пачками» (bursty arrival), а время обслуживания варьируется, начинают расти огромные очереди, даже если система загружена всего на 50% .
Для описания таких процессов математики используют цепи Маркова — модели, где система переходит из одного состояния в другое (например, количество людей в очереди увеличивается или уменьшается) с определенной вероятностью .
💻 Процессные алгебры: когда системы становятся сложными 34:57
Традиционная теория очередей хорошо работала до 1980-х годов, пока компьютеры были изолированными устройствами. С появлением интернета системы стали распределенными и параллельными . Современный запрос (например, бронирование отеля на Expedia) одновременно запускает десятки подзапросов к разным авиакомпаниям и базам данных .
Для моделирования таких процессов Джейн Хиллстон и её коллеги разработали PEPA (Performance Evaluation Process Algebra) — язык программирования, который компилируется не в машинный код, а в математические модели (цепи Маркова) .
Примеры применения PEPA:
- Логистика в Бельгии: оптимизация движения грузовых судов через шлюзы и мосты, которые являются «узкими местами» каналов .
- Мобильные сети 3G: расчет необходимого количества частот и расположения базовых станций для обслуживания абонентов .
- Автобусные системы в Италии: проверка скорости передачи сигналов от датчиков к водителю для обеспечения безопасности движения .
🧪 Биология как вычислительная система 45:38
Удивительным открытием для ученых стало то, что методы оптимизации компьютерных сетей идеально подходят для описания живых организмов. В клетках ресурсами выступают белки, а в экосистемах — пространство или питательные вещества .
Джейн Хиллстон приводит в пример модель клеточного цикла, основанную на работе Альберта Голдбетера (1991). В ней белок циклин управляет делением клеток через цепочку химических реакций . Применение «компьютерного» моделирования к биологии требует перехода от счета отдельных молекул к анализу их концентрации с помощью обыкновенных дифференциальных уравнений (ODE) . Математика позволяет увидеть, как мутация одного белка ломает ритм деления клеток, что может приводить к развитию заболеваний .
🤖 Цена интеллекта: энергетический кризис ИИ 50:47
Современный этап развития ИИ, по мнению Джейн Хиллстон, характеризуется опасным игнорированием ресурсов. Разработчики больших языковых моделей (LLM) десятилетиями ориентировались только на «производительность» в смысле точности ответов, следуя логике «чем больше ресурсов, тем лучше результат» .
Цифры, которые приводит исследователь:
- Запрос в ChatGPT потребляет в 100 раз больше энергии, чем поиск в Google .
- Обучение модели Llama привело к выбросу 539 метрических тонн CO2 .
- Google рассматривает возможность строительства собственных атомных электростанций для обеспечения нужд дата-центров .
Хиллстон отмечает, что традиционные метрики производительности (время отклика) в случае с ИИ работают плохо. Обучение модели может занимать месяцы, задействуя тысячи процессоров со 100%-й загрузкой, что делает систему крайне дорогой и неэкологичной .
🚀 DeepSeek: вынужденная эффективность 58:54
В начале 2025 года внимание научного сообщества привлекла модель DeepSeek. По словам Джейн Хиллстон, этот кейс интересен именно с точки зрения оптимизации ресурсов. Разработчики DeepSeek не имели доступа к таким же масштабным вычислительным мощностям, как американские технологические гиганты, и были вынуждены искать более эффективные инженерные решения .
Основные выводы лекции:
- Ресурсы первичны: невозможно бесконечно улучшать системы, игнорируя стоимость их содержания.
- Математика дает зрение: простые формулы позволяют предсказать коллапс сложной системы еще на этапе проектирования .
- Необходимость — мать изобретения: ограничение ресурсов часто ведет к более качественному проектированию, чем их избыток .