ИИ-чип Maia 200 называют «мощным инструментом логического вывода». Это означает, что он может помочь моделям ИИ гораздо быстрее и эффективнее применять свои знания в реальных ситуациях.
Чип Maia 200 от Microsoft интегрируется в облачную инфраструктуру Azure (Изображение предоставлено Microsoft)
Microsoft представила новый чип-ускоритель Maia 200 для искусственного интеллекта (ИИ), который, по словам представителей компании, в три раза мощнее оборудования конкурентов, таких как Google и Amazon.
Этот новейший чип будет использоваться для логического вывода в ИИ, а не для обучения. Он будет обеспечивать работу систем и агентов, которые делают прогнозы, отвечают на запросы и генерируют результаты на основе новых данных.
Maia 200 уже развёрнута в центральном регионе обработки данных Microsoft в США. Компания планирует использовать эти чипы для генерации синтетических данных и обучения с подкреплением для улучшения больших языковых моделей (БЯМ) следующего поколения. Ускоритель искусственного интеллекта также будет использоваться для работы Microsoft Foundry и 365 Copilot AI и станет частью инфраструктуры, которую компания может предоставить через свою облачную платформу Azure.
Новый чип обеспечивает производительность более 10 петафлопс (1015 операций с плавающей запятой в секунду), сообщил Скотт Гатри, исполнительный вице-президент Microsoft по облачным технологиям и искусственному интеллекту, в своём блоге. Это показатель производительности в сфере суперкомпьютеров, где самые мощные суперкомпьютеры в мире могут достигать производительности более 1000 петафлопс.
Новый чип достиг такого уровня производительности в категории представления данных, известной как «4-битная точность (FP4)» — сильно сжатая модель, разработанная для повышения производительности ИИ. Maia 200 также обеспечивает производительность в 5 петафлопс при 8-битной точности (FP8). Разница между ними заключается в том, что FP4 гораздо более энергоэффективна, но менее точна.
«С практической точки зрения, на одном узле Maia 200 можно без труда запускать самые большие на сегодняшний день модели, а в будущем — ещё более крупные модели, — написал Гатри в своём блоге. — Это означает, что Maia 200 в три раза превосходит Amazon Trainium третьего поколения по производительности FP4 и в восемь раз — по производительности FP8 TPU седьмого поколения от Google».
Maia 200 потенциально может использоваться для специализированных задач в области искусственного интеллекта, например для запуска более крупных языковых моделей в будущем. До сих пор чипы Maia от Microsoft использовались только в облачной инфраструктуре Azure для выполнения крупномасштабных задач для собственных сервисов искусственного интеллекта Microsoft, в частности Copilot. Однако Гатри отметил, что в будущем «доступность для клиентов расширится», что может означать, что другие организации смогут использовать Maia 200 через облако Azure или что однажды эти чипы можно будет развернуть в автономных центрах обработки данных или серверных стойках.
Гатри сказал, что Microsoft может похвастаться на 30 % более высокой производительностью на доллар по сравнению с существующими системами благодаря использованию 3-нанометрового техпроцесса, разработанного Тайваньской компанией по производству полупроводников (TSMC), самым важным производителем в мире, позволяющим использовать 100 миллиардов транзисторов на чипе. По сути, это означает, что Maia 200 может быть более экономичной и эффективной для самых ресурсоёмких задач ИИ, чем существующие чипы.
Помимо более высокой производительности и эффективности, у Maia 200 есть и другие особенности. Например, она включает в себя систему памяти, которая позволяет хранить веса и данные модели ИИ локально, то есть для запуска модели потребуется меньше оборудования. Кроме того, она разработана для быстрой интеграции в существующие центры обработки данных.
Maia 200 должна повысить скорость и эффективность работы моделей ИИ. Это означает, что пользователи Azure OpenAI, такие как учёные, разработчики и корпорации, смогут добиться более высокой пропускной способности и скорости при разработке ИИ-приложений и использовании таких моделей, как GPT-4, в своей работе.
Это аппаратное обеспечение нового поколения для ИИ вряд ли в краткосрочной перспективе изменит повседневное использование ИИ и чат-ботов большинством людей, поскольку Maia 200 предназначено для центров обработки данных, а не для потребительского оборудования. Однако конечные пользователи могут заметить влияние Maia 200 в виде более быстрого отклика и потенциально более продвинутых функций Copilot и других инструментов ИИ, встроенных в Windows и продукты Microsoft.
Maia 200 также может повысить производительность для разработчиков и учёных, использующих ИИ-выводы на платформах Microsoft. Это, в свою очередь, может привести к улучшению внедрения ИИ в крупномасштабные исследовательские проекты и такие элементы, как усовершенствованное моделирование погоды, биологических или химических систем и составов.
