Muse Spark от Meta: ещё один шаг к персональному сверхразуму

Meta Superintelligence Labs представила Muse Spark — изначально мультимодальную модель рассуждений с поддержкой использования инструментов, визуальной цепочки мыслей и оркестрации нескольких агентов. В релиз включён режим «Размышление», который внедряется постепенно и координирует множество агентов, рассуждающих параллельно.

Запрос: Можешь превратить это в игру судоку, в которую я смогу играть в браузере? (Источник: Meta)

Возможности

Meta позиционирует Muse Spark как часть своего движения к персональному сверхразуму, способному понимать мир пользователя. Модель может анализировать непосредственное окружение пользователя и поддерживать сценарии, связанные с благополучием, благодаря своим способностям к рассуждению.

Модель интегрирует визуальную информацию из разных областей и инструментов. Она демонстрирует высокие результаты в решении визуальных STEM-задач, распознавании сущностей и локализации, что позволяет создавать интерактивные впечатления, такие как разработка мини-игр или поиск неисправностей бытовой техники с динамическими аннотациями.

Компания сообщила, что сотрудничала с более чем 1000 врачей для курирования обучающих данных, направленных на улучшение ответов, связанных со здоровьем. Модель может генерировать интерактивные дисплеи, объясняющие такую информацию, как пищевая ценность или активность мышц во время упражнений.

Масштабирование модели

Meta изучает масштабирование Muse Spark по трём направлениям: предварительное обучение, обучение с подкреплением и рассуждения во время тестирования.

На этапе предварительного обучения система развивает мультимодальное понимание, способности к рассуждению и программированию, которые служат основой для последующих стадий.

Обучение с подкреплением используется для усиления возможностей и повышения надёжности, причём достижения обобщаются на ранее не встречавшиеся задачи, как утверждает компания.

Рассуждения во время тестирования позволяют системе «подумать» перед формированием ответов. Meta заявила, что использует штрафы за время размышления для оптимизации использования токенов и оркестрацию нескольких агентов для повышения производительности при сохранении сопоставимой задержки.

«Чтобы обеспечить максимальную интеллектуальность на токен, наше обучение с подкреплением максимизирует правильность при условии штрафа за время размышлений», — отметила компания.

Компания добавила, что увеличение количества параллельных агентов позволяет проводить больше рассуждений во время вывода без значительного увеличения задержки.

Оценка безопасности

Muse Spark была оценена перед развёртыванием с использованием Расширенной системы масштабирования ИИ от Meta, которая определяет модели угроз, протоколы оценки и пороги внедрения.

По заявлению компании, модель демонстрирует поведение отказа в высокорисковых сферах, таких как биологические и химические угрозы. Meta также сообщила, что Muse Spark не проявляет автономных возможностей или опасных склонностей, необходимых для реализации подобных сценариев, и остаётся в безопасных пределах по всем оценённым категориям риска.