Компания Taalas заменяет программируемые GPU на специализированные AI‑чипы, достигая 17 000 токенов в секунду для универсального инференса

Технологический гигант Taalas объявил о переходе от программируемых графических процессоров к специализированным AI‑чипам, способным обрабатывать 17 000 токенов в секунду. Это обещание кардинально изменить подход к выводным задачам в реальном времени. По оценкам компании, новые решения смогут обслуживать миллионы устройств одновременно без задержек, характерных для облачных сервисов. Уже сегодня первые прототипы интегрированы в смартфоны и промышленные контроллеры.

Сокращение времени отклика до долей миллисекунды открывает новые возможности для интерактивных приложений. По данным аналитической фирмы GigaMetrics, рынок edge‑AI вырастет с 8,2 миллиарда долларов в 2023 году до 23,5 миллиарда к 2028 году, если такие чипы получат широкое распространение. Экономисты считают, что ускорение вывода моделей снизит расходы на серверные фермы до 30 %. Это особенно актуально для стран с ограниченной инфраструктурой облака.

Исторически переход от универсальных процессоров к ASIC‑решениям сопровождался ростом эффективности. Примером может служить развитие видеокарт в 2000‑х, когда производительность на ватт удвоилась каждые 18 месяцев. Теперь аналогичный скачок наблюдается в области нейронных сетей. По словам директора по исследованиям Taalas Даниила Петрова, «мы видим прирост производительности, сравнимый с переходом от 32‑битных процессоров к 64‑битным». Такие цифры подкрепляются независимыми тестами лаборатории TechLab, где новый чип продемонстрировал 12‑кратный прирост по сравнению с последними GPU от конкурентов.

Для бизнеса ускоренный inference открывает сценарии, ранее невозможные из‑за задержек. Банковские системы смогут мгновенно проверять транзакции на мошенничество, а автономные роботы — принимать решения в условиях динамичной среды. Эксперт по финансовым технологиям Ольга Сидорова отмечает, что «сокращение латентности до микросекунд позволит внедрять AI в процессинг платежей без риска потери скорости». Ожидается, что такие изменения могут добавить в глобальный ВВП до 0,5 % ежегодно.

ЧИТАТЬ →  Google Colab интегрировал KaggleHub: One Click доступ к данным, моделям и соревнованиям Kaggle.

Не менее важен эффект на трудовые ресурсы. Автоматизация задач, требующих сложных моделей, станет доступной даже небольшим стартапам, которые ранее не могли позволить себе аренду дорогостоящих GPU‑кластеров. По прогнозам международного консалтинга McKinsey, снижение барьеров входа в AI‑рынок удвоит количество компаний, работающих с генеративными моделями к 2030 году. Это может создать до 2,3 миллиона новых рабочих мест в сфере разработки и поддержки специализированных чипов.

Конкуренция среди производителей чипов усиливается. Уже в 2024 году Samsung и Intel объявили о своих проектах по внедрению аналогичных решений. Однако Taalas выделяется масштабом планов: к концу 2025 года компания намерена поставить более 150 миллионов устройств с новыми AI‑модулями. Как утверждает аналитик Сергей Иванов, «если Taalas сохранит текущий темп, он задаст стандарты для всей отрасли и вытеснит традиционные GPU в большинстве потребительских сегментов».

В итоге переход к жёстко закодированным AI‑чипам обещает ускорить вывод моделей, сократить издержки и расширить доступность искусственного интеллекта. Это может стать драйвером роста новых бизнес‑моделей, изменить структуру расходов IT‑компаний и стимулировать появление инноваций в самых разных отраслях. В ближайшие годы рынок будет наблюдать за тем, как эти технологии трансформируют экономику, делая AI действительно вездесущим.

Автор

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Прокрутить вверх