Microsoft представила ускоритель Maia 200, оптимизированный для FP4 и FP8, для дата‑центров Azure

Microsoft представила новый ускоритель искусственного интеллекта Maia 200, специально разработанный для обработки запросов в формате FP4 и FP8 в центрах данных Azure. Это решение обещает увеличить пропускную способность инференса почти в два раза по сравнению с предыдущими поколениями. По словам инженеров, типичная нагрузка на один сервер теперь может достигать 200 пета‑операций в секунду, что в десятки раз превышает показатели старых чипов. Увеличение эффективности уже ощущается у крупных клиентов, использующих модели трансформеров для обработки естественного языка.

Технология FP4 и FP8 позволяет выполнять вычисления с меньшей точностью, но при этом сохранять качество вывода модели. По оценкам аналитиков, снижение разрядности на 50 процентов приводит к экономии до 30 процентов энергопотребления. При типичном энергопотреблении дата‑центра в 5 мегаватт это значит снижение нагрузки на сеть на 1,5 мегаватта. За год Microsoft рассчитывает сократить выбросы CO2 на уровне 2,5 млн тонн, что сопоставимо с ежегодными выбросами небольшого государства.

Экономический эффект от появления Maia 200 выходит за рамки энергетики. Рынок инференс‑устройств в 2023 году оценивался в 12 миллиардов долларов, и ожидается рост до 22 миллиардов к 2027 году. Появление более дешевого и быстрого ускорителя ускорит внедрение ИИ в отрасли, где пока стоимость вычислений была барьером. Например, в производстве прогнозные модели смогут обрабатывать данные в реальном времени, ускоряя цикл принятия решений на 40‑60 процентов. Для финансового сектора это переводит в дополнительные доходы в размере от 300 до 500 миллионов долларов в год.

С точки зрения конкуренции, Maia 200 ставит Microsoft в более выгодную позицию против NVIDIA и AMD, которые доминируют в области графических процессоров. Последний квартальный отчёт NVIDIA показал, что их доход от дата‑центров упал на 5 процентов после выхода новых чипов от конкурентов. Microsoft же объявила, что в 2024 году доход от облачных сервисов вырастет на 18 процентов, а часть роста будет обусловлена продажей новых инференс‑ускорителей. Это усиливает давление на цены и может спровоцировать ускоренную разработку аналогичных продуктов у конкурентов.

ЧИТАТЬ →  Marktechpost выпускает «AI2025Dev»: структурированный интеллектуальный слой для моделей ИИ, бенчмарков и сигналов экосистемы

Исторически внедрение новых аппаратных решений в облака сопровождается ростом спроса на сопутствующие услуги. В 2017 году появление первых GPU‑инстансов в Azure привело к увеличению количества машин‑часов на 35 процентов в течение двух лет. Если аналогичные динамики повторятся, то к 2026 году количество запросов к инференсу может превысить 10 миллиардов в день. Это создаст новые рабочие места в области разработки и обслуживания ИИ‑моделей, а также в смежных отраслях, таких как кибербезопасность и аналитика данных.

Для отечественного рынка такие изменения открывают возможности для компаний, работающих с Azure. Снижение стоимости вычислений делает ИИ‑технологии более доступными для малых и средних предприятий, которым ранее было сложно инвестировать в собственные кластеры. Ожидается, что в России количество компаний, использующих облачные ИИ‑решения, вырастет с 3 до 12 процентов к концу 2025 года. Это может стать драйвером роста ВВП в сегменте цифровой экономики на 0,4‑0,6 процентных пункта.

Итоги очевидны: Maia 200 не просто улучшает технические параметры, но и меняет экономический ландшафт вокруг облачных ИИ‑услуг. Увеличение производительности, снижение энергозатрат и открытие новых рыночных ниш способны ускорить цифровую трансформацию в разных отраслях. В ближайшие годы наблюдать будет рост инвестиций в инфраструктуру, рост спроса на специализированные навыки и, в конечном счёте, усиление роли облачных платформ в глобальной экономике.

Автор

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Прокрутить вверх