Alibaba представила свою самую мощную на сегодня модель ИИ

Alibaba представила свою самую мощную на сегодня модель ИИ
© Naukatv.ru

Эта архитектура отражает тренд на создание более компактных и эффективных моделей на фоне озабоченности по поводу стремительного роста стоимости масштабирования крупнейших LLM. По данным исследовательской компании Epoch AI, самое дорогое на сегодня обучение Grok 4 от xAI обошлось в 490 миллионов долларов, а к 2027 году стоимость может превысить миллиард долларов.

Тем временем китайские гиганты стремятся к более широкому внедрению своих моделей, делая их достаточно компактными для запуска на ноутбуках и смартфонах. Qwen3-Next-80B-A3B получился настолько экономным к ресурсам, что его можно запустить на одном графическом процессоре Nvidia H200.

Новая архитектура — это предвестник следующего поколения моделей ИИ, уверены в Alibaba.

Скорее всего, развитие больших языковых моделей действительно пойдет по пути совершенствования метода Alibaba для сокращения издержек и роста эффективности, даже если появятся принципиально новые архитектуры, подтвердил исследователь ИИ Тобиас Шредер из Имперского колледжа Лондона.

«Мозгоподобный» ИИ на китайских чипах в 100 раз превысил мощность аналогов

Microsoft представила модель ИИ, работающую на обычных процессорах

Подписывайтесь и читайте «Науку» в Telegram