Техрепорт Alice AI: новое поколение моделей для ИИ-ассистента

Техрепорт Alice AI: новое поколение моделей для ИИ-ассистента
Техрепорт Alice AI: новое поколение моделей для ИИ-ассистента (источник изображения)

Введение в Alice AI

Сегодня мы хотим поделиться техническим отчетом о создании нового семейства моделей Alice AI, предназначенных для самого популярного ИИ-ассистента в России.

Основные компоненты Alice AI

  • Alice AI LLM — базовая текстовая модель;
  • Alice AI LLM Search — специализированная модель для поиска;
  • Alice AI VLM — мультимодальная модель;
  • Alice AI ART — модель для генерации изображений.

Создание Alice AI LLM

При создании Alice AI LLM мы сделали упор на Alignment, используя RL и Reward Modeling.

Мы минимизировали число разрозненных RL-стадий, собирая «общий RL».

Архитектура модели и инициализация обучения

Alice AI LLM — наша модель, прошедшая полный цикл обучения на данных и инфраструктуре Яндекса.

Этап Pretrain: подход и результаты

Обучение модели после инициализации состоит из нескольких этапов: обучение подходящего для русского языка токенизатора, обучение эмбеддингов, Pretrain на большом объёме текстовых данных и двухэтапный Midtrain.

Инфраструктура обучения и инференса

Для обучения и инференса Alice AI LLM мы использовали YaFSDP и собственную библиотеку коллективных коммуникаций YCCL.

Результаты и перспективы

Согласно исследованию Mediascope, Алиса AI вышла на первое место по используемости среди россиян (14,3%), обойдя ранее доминировавший DeepSeek (9,4%).

News Express Team
News Express Team

Команда News Express, состоящая из опытных редакторов и журналистов, предоставляет своевременные и надежные репортажи о российской политике, экономике, технологиях и мировых событиях с уникальной региональной точки зрения. Будьте в курсе событий с нашими преданными журналистами.

ru_RURU