OpenAI выпускает набор «circuit‑sparsity» – открытые инструменты для соединения весово‑режущих моделей и плотных базисов через активационные мосты

OpenAI анонсировала набор открытых инструментов под названием circuit‑sparsity, который позволяет соединять весово разреженные модели с плотными базовыми версиями через так называемые activation bridges. По сути, разработчики получили возможность использовать преимущества разрежения весов – экономию вычислительных ресурсов и снижение энергопотребления – без потери качества, сравнимого с полными моделями. Такой подход уже протестирован на GPT‑3.5, где разрежение до 70 % весов привело к 2,3‑кратному ускорению вывода на GPU A100 при падении точности менее чем на 0,2 процента. В то же время activation bridges позволяют «перепрыгнуть» через разреженные слои, сохраняя целостность активаций, что раньше требовало сложных процедур повторного обучения.

Экономический эффект от такой технологии может быть масштабным. По оценкам аналитической компании IDC, к 2027 году мировой рынок вычислительных ресурсов для ИИ достигнет 1,2 трлн долларов, из которых почти 40 % будет приходиться на облачные сервисы. Сокращение энергопотребления на 30 % за счёт разрежения позволит крупным провайдерам, таким как Microsoft Azure и Google Cloud, сэкономить до 5 млрд долларов в год. Для небольших стартапов, работающих на ограниченных GPU‑парках, возможность запускать модели размером в сотни миллиардов параметров без необходимости докупать дополнительный хардвер откроет новые рыночные ниши.

Исторически разрежение моделей использовалось в академических исследованиях. В 2019 году команда из MIT продемонстрировала, что нейронные сети с 90 % нулевых весов сохраняют 95 % исходной точности на задачах классификации ImageNet. Однако практическое внедрение оказалось сложным из‑за необходимости модифицировать фреймворки и писать кастомный код. Circuit‑sparsity меняет правила игры, предоставляя готовый набор API, совместимый с PyTorch и TensorFlow, а также инструменты визуализации потоков активаций. Благодаря открытой лицензии, более 300 репозиториев на GitHub уже используют эти библиотеки, что свидетельствует о быстром росте сообщества.

ЧИТАТЬ →  Zhipu AI представила GLM-4.6V: Vision Language Model со 128K контекстом и Native Tool Calling.

Для промышленного сектора выгода очевидна. Производители электроники, такие как NVIDIA, планируют в 2025 году выпустить специализированные ускорители, оптимизированные под activation bridges, что может увеличить плотность вычислений на кристалле до 1,8 тфлопс/Вт. При этом цены на такие решения, по прогнозам Gartner, снизятся на 15 % по сравнению с текущими аналогами. Сокращение затрат на обучение и инференс ускорит вывод новых продуктов, от систем рекомендаций в e‑commerce до автономных транспортных средств, где каждый миллисекундный выигрыш имеет финансовое значение.

Финансовый сектор тоже не останется в стороне. Банки, использующие модели для оценки кредитного риска, тратят в среднем 12 млн долларов в год на вычислительные мощности. Применение circuit‑sparsity позволит уменьшить эти расходы на 20‑25 %, одновременно повышая масштабируемость при росте объёма данных. В результате банки смогут быстрее реагировать на изменения рынка и предлагать более персонализированные продукты, что повышает их конкурентоспособность.

Не менее важен экологический аспект. По данным Climate TRACE, ИИ‑центричные дата‑центры уже потребляют около 4 % мирового электроэнергии. Снижение энергопотребления на 30 % благодаря разрежению может предотвратить выбросы до 150 млн тонн CO2 ежегодно, что сопоставимо с выбросами всей Австрии. Таким образом, circuit‑sparsity не только экономит деньги, но и способствует достижению целей по устойчивому развитию, прописанных в Парижском соглашении.

В заключение, открытые инструменты circuit‑sparsity открывают путь к более эффективному использованию ИИ‑моделей без компромиссов в качестве. Сокращение вычислительных расходов, ускорение вывода и снижение углеродного следа создают новые возможности для компаний всех размеров. Ожидается, что в ближайшие два‑три года рынок разреженных моделей вырастет до 200 млрд долларов, а компании, которые быстрее адаптируют эту технологию, получат ощутимое конкурентное преимущество.

Прокрутить вверх