
Введение в Alice AI
Сегодня мы хотим поделиться техническим отчетом о создании нового семейства моделей Alice AI, предназначенных для самого популярного ИИ-ассистента в России.
Основные компоненты Alice AI
- Alice AI LLM — базовая текстовая модель;
- Alice AI LLM Search — специализированная модель для поиска;
- Alice AI VLM — мультимодальная модель;
- Alice AI ART — модель для генерации изображений.
Создание Alice AI LLM
При создании Alice AI LLM мы сделали упор на Alignment, используя RL и Reward Modeling.
Мы минимизировали число разрозненных RL-стадий, собирая «общий RL».
Архитектура модели и инициализация обучения
Alice AI LLM — наша модель, прошедшая полный цикл обучения на данных и инфраструктуре Яндекса.
Этап Pretrain: подход и результаты
Обучение модели после инициализации состоит из нескольких этапов: обучение подходящего для русского языка токенизатора, обучение эмбеддингов, Pretrain на большом объёме текстовых данных и двухэтапный Midtrain.
Инфраструктура обучения и инференса
Для обучения и инференса Alice AI LLM мы использовали YaFSDP и собственную библиотеку коллективных коммуникаций YCCL.
Результаты и перспективы
Согласно исследованию Mediascope, Алиса AI вышла на первое место по используемости среди россиян (14,3%), обойдя ранее доминировавший DeepSeek (9,4%).






