Математика очередей и ресурсов: от телефонных станций до нейросетей

The Royal Institution 26,3 тыс. 1 ч 1 мин 5 мин 29.04.2025
Главное

Как математика помогает справляться с очередями, почему биологические клетки похожи на компьютерные сети и во что обходится планете каждый запрос к ChatGPT? В рамках лекции в The Royal Institution Джейн Хиллстон (Jane Hillston), профессор и специалист в области компьютерных наук, рассказала о механизмах оптимизации систем — от почтовых отделений до нейросетей нового поколения.

🚶 Теория очередей: почему мы всегда ждем 1:05

Очереди часто воспринимаются как нечто специфически британское, однако, по словам Джейн Хиллстон, это универсальный феномен, возникающий везде, где есть ограниченный ресурс . С математической точки зрения очередь — это прямое следствие дефицита.

Существует два радикально разных взгляда на любую систему:

В этой дихотомии и рождается дисциплина под названием «моделирование производительности» (performance modeling) . Её цель — найти «золотую середину», где пользователи удовлетворены временем отклика, а система остается устойчивой и экономически выгодной . При этом 100%-я загрузка ресурсов почти всегда делает систему хрупкой и ведет к коллапсу при малейшем сбое .

☎️ От телефонных станций к формуле Эрланга 9:21

Основы современной теории оптимизации были заложены в начале XX века датским математиком Агнером Эрлангом. Работая в телекоммуникационной компании, он решал задачу: сколько соединительных линий нужно телефонной станции, чтобы абоненты не получали отказ при попытке дозвониться .

Эрланг вывел формулу, которая до сих пор используется в современных кол-центрах и банковских системах. Ключевой параметр в ней — E (Эрланг), безразмерная величина, описывающая нагрузку на систему .

Параметры формулы включают:

  1. Частоту поступления заявок (как часто люди звонят).
  2. Среднюю продолжительность обслуживания (как долго длится разговор).
  3. Количество серверов (M) (сколько каналов связи доступно) .

Произведение частоты заявок на среднее время их обработки дает объем работы, который система должна выполнить. Если количество ресурсов (M) подобрано неправильно, вероятность блокировки (отказа в обслуживании) резко возрастает .

📉 Закон Литтла и магия случайности 20:03

В 1961 году Джон Литтл математически доказал формулу, которая была известна ранее, но считалась применимой только для простых случаев. Закон Литтла гласит, что среднее количество клиентов в системе (L) равно произведению интенсивности входящего потока (λ) на среднее время пребывания клиента в системе (W) .

Джейн Хиллстон подчеркивает уникальность этого закона: он работает для любой системы, независимо от того, в каком порядке обслуживаются клиенты (первым пришел — первым ушел или в порядке приоритетности) и распределения времени обслуживания .

Однако на практике «человеческий фактор» и случайность вносят хаос:

Для описания таких процессов математики используют цепи Маркова — модели, где система переходит из одного состояния в другое (например, количество людей в очереди увеличивается или уменьшается) с определенной вероятностью .

💻 Процессные алгебры: когда системы становятся сложными 34:57

Традиционная теория очередей хорошо работала до 1980-х годов, пока компьютеры были изолированными устройствами. С появлением интернета системы стали распределенными и параллельными . Современный запрос (например, бронирование отеля на Expedia) одновременно запускает десятки подзапросов к разным авиакомпаниям и базам данных .

Для моделирования таких процессов Джейн Хиллстон и её коллеги разработали PEPA (Performance Evaluation Process Algebra) — язык программирования, который компилируется не в машинный код, а в математические модели (цепи Маркова) .

Примеры применения PEPA:

🧪 Биология как вычислительная система 45:38

Удивительным открытием для ученых стало то, что методы оптимизации компьютерных сетей идеально подходят для описания живых организмов. В клетках ресурсами выступают белки, а в экосистемах — пространство или питательные вещества .

Джейн Хиллстон приводит в пример модель клеточного цикла, основанную на работе Альберта Голдбетера (1991). В ней белок циклин управляет делением клеток через цепочку химических реакций . Применение «компьютерного» моделирования к биологии требует перехода от счета отдельных молекул к анализу их концентрации с помощью обыкновенных дифференциальных уравнений (ODE) . Математика позволяет увидеть, как мутация одного белка ломает ритм деления клеток, что может приводить к развитию заболеваний .

🤖 Цена интеллекта: энергетический кризис ИИ 50:47

Современный этап развития ИИ, по мнению Джейн Хиллстон, характеризуется опасным игнорированием ресурсов. Разработчики больших языковых моделей (LLM) десятилетиями ориентировались только на «производительность» в смысле точности ответов, следуя логике «чем больше ресурсов, тем лучше результат» .

Цифры, которые приводит исследователь:

Хиллстон отмечает, что традиционные метрики производительности (время отклика) в случае с ИИ работают плохо. Обучение модели может занимать месяцы, задействуя тысячи процессоров со 100%-й загрузкой, что делает систему крайне дорогой и неэкологичной .

🚀 DeepSeek: вынужденная эффективность 58:54

В начале 2025 года внимание научного сообщества привлекла модель DeepSeek. По словам Джейн Хиллстон, этот кейс интересен именно с точки зрения оптимизации ресурсов. Разработчики DeepSeek не имели доступа к таким же масштабным вычислительным мощностям, как американские технологические гиганты, и были вынуждены искать более эффективные инженерные решения .

Основные выводы лекции:

  1. Ресурсы первичны: невозможно бесконечно улучшать системы, игнорируя стоимость их содержания.
  2. Математика дает зрение: простые формулы позволяют предсказать коллапс сложной системы еще на этапе проектирования .
  3. Необходимость — мать изобретения: ограничение ресурсов часто ведет к более качественному проектированию, чем их избыток .
💬 Цитаты

«Failure to consider resources can lead to unrealistic expectations from users and unlimited costs for systems providers.»

Джейн Хиллстон 1:00:28

«A ChatGPT query takes a hundred times more energy than a Google search.»

Джейн Хиллстон 52:11
👥 Спикер
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Формула Эрланга
Математическое выражение для расчета вероятности блокировки или потери вызова в системах обслуживания.
Закон Литтла
Теорема, связывающая среднее число заявок в системе, интенсивность их поступления и среднее время обработки.
Цепь Маркова
Математическая модель процесса, в котором будущее состояние зависит только от настоящего, а не от прошлого.
PEPA
Алгебра процессов для оценки производительности систем (Performance Evaluation Process Algebra).
📊 Цифры
🗓 Хронология
  1. начало XX века Агнер Эрланг разрабатывает теорию для датских телефонных станций.
  2. 1954 Первое упоминание формулы Литтла (до доказательства).
  3. 1961 Джон Литтл публикует математическое доказательство закона очередей.
  4. 1980-е Начало активного использования теории очередей в компьютерных науках.
  5. 1991 Альберт Голдбетер публикует модель клеточного цикла на основе белков.
  6. 2025 Взлет популярности DeepSeek как примера эффективного использования ресурсов ИИ.
⚖️ Другая сторона
Математика и физика Джейн Хиллстон Теория очередей DeepSeek Закон Литтла Формула Эрланга