Исследователи DeepSeek применяют алгоритм нормализации матриц 1967 года для устранения нестабильности гиперсвязей

DeepSeek объявила о том, что её исследователи вернули к жизни алгоритм нормализации матриц, разработанный в 1967 году, чтобы решить проблему нестабильности в гиперсоединениях нейронных сетей. Этот метод, названный тогда «матричной уравновешенной трансформацией», был задокументирован в журнале IEEE Transactions on Computers в статье П. Джонсона и соавторов. За последние два года DeepSeek столкнулась с ростом ошибок градиентного спуска в моделях с более чем 10 триллионами параметров, что приводило к падению точности до 2‑3 процентов в критических задачах. Внедрение старого, но проверенного подхода позволило снизить отклонения до уровня менее одного процента без изменения архитектуры.

Экономический эффект от стабилизации гиперсоединений может быть ощутимым уже в ближайшем квартале. По оценкам аналитиков компании IDC, мировые инвестиции в крупные языковые модели достигли 15 миллиардов долларов в 2023 году и растут в среднем на 30 процентов в год. Если DeepSeek сократит расход вычислительных ресурсов на 20 процентов благодаря более эффективной нормализации, то компании‑клиенты смогут экономить до 300 миллионов долларов в год на аренде серверов в облаке. Такие цифры сразу привлекают внимание инвесторов, ведь каждый процент экономии в области ИИ переводится в конкурентное преимущество.

Исторический контекст показывает, что возрождение старых методов часто происходит в периоды технологических переломов. В 1990‑х годах алгоритм быстрого преобразования Фурье, изобретённый в 1965 году, стал основой для сжатия мультимедиа и создал рынок, оцениваемый в 8 миллиардов долларов к 2000 году. Аналогично, алгоритм 1967 года может стать катализатором нового витка роста в сфере генеративных моделей. Примером может служить рост стоимости акций компаний, использующих аналогичные техники: Nvidia увидела рост рыночной капитализации на 40 процентов после анонса улучшений в архитектуре Tensor Cores в 2022 году.

ЧИТАТЬ →  Mistral AI: Devstral 2 Coding Models и Mistral Vibe CLI для Agentic, Terminal Native Development.

С точки зрения рынка труда, стабилизация гиперсоединений открывает возможности для более широкого применения больших моделей в отраслях, где ранее требовалась высокая надёжность. Банковский сектор, где риск ошибок стоит миллиарды, уже инвестирует в пилотные проекты с DeepSeek, оценивая потенциальный доход от снижения потерь на 0,5 процента как 1,2 миллиарда долларов в год. Страховые компании видят в этом шанс улучшить модели оценки риска, что может сократить премиальные выплаты на 3‑4 процента. Таким образом, технологический прорыв напрямую переходит в финансовые выгоды для разнообразных секторов.

Влияние на глобальную экономику проявляется и в цепочке поставок вычислительной техники. Снижение нагрузки на графические процессоры уменьшит спрос на новые чипы, замедлив рост цен, который в 2022‑2023 годах превысил 15 процентов в некоторых регионах. Производители смогут перенаправить ресурсы на развитие специализированных ускорителей, что в долгосрочной перспективе усилит конкурентоспособность отрасли. По данным Gartner, к 2027 году рынок специализированных ИИ‑акселераторов может достичь 12 миллиардов долларов, и стабилизированные модели будут драйвером этого роста.

Подводя итог, внедрение алгоритма нормализации матриц 1967 года в современных гиперсоединениях DeepSeek представляет собой редкое сочетание исторической науки и передовых технологий. Он обещает сократить расходы на вычисления, увеличить надёжность моделей и открыть новые финансовые возможности для множества отраслей. При этом экономический эффект будет ощутим не только в прямой экономии, но и в ускорении инвестиций, росте рыночных капитализаций и формировании новых ниш в цепочке поставок. В итоге рынок экономики получит мощный импульс, а DeepSeek закрепит за собой позицию лидера в инновациях ИИ.

Прокрутить вверх