Evolution

Создать и запустить дообучение модели


Вы можете дообучить модель с нуля или переобучить ранее дообученную в сервисе модель с новыми параметрами.

Дообучить модель впервые

  1. На верхней панели слева нажмите Кнопка с изображением девяти точек и выберите AI Factory → ML Finetuning.

  2. Выберите тип базовой модели — Генерация текста.

  3. Выберите источник базовой модели — Добавить из Hugging Face.

  4. Добавьте репозиторий с базовой моделью из Hugging Face:

    1. В качестве источника оставьте Добавить из Hugging Face.

    2. В поле Репозиторий с моделью укажите адрес репозитория, в котором расположена модель для дообучения.

    3. (Опционально) Укажите токен доступа из Secret Management, если модель расположена в приватном репозитории. Чтобы добавить новый токен доступа, нажмите Добавить токен в Secret Management.

    4. Нажмите Добавить.

  5. Добавьте датасет Alpaca в формате JSON для дообучения модели:

    1. В поле Репозиторий датасета Hugging Face укажите адрес репозитория, в котором расположен датасет. Датасет должен быть в формате Alpaca и содержать следующие поля: instruction, input, output.

    2. (Опционально) Укажите токен доступа из Secret Management, если датасет расположен в приватном репозитории. Чтобы добавить новый токен доступа, нажмите Добавить токен в Secret Management.

  6. Добавьте репозиторий для сохранения дообученной модели:

    1. Оставьте для Назначение значение Hugging Face Datasets.

    2. В поле Репозиторий с моделью укажите адрес репозитория, в котором будет сохранена модель после дообучения.

    3. (Опционально) Укажите токен доступа из Secret Management, если указанный репозиторий приватный. Чтобы добавить новый токен доступа, нажмите Добавить токен в Secret Management.

  7. Настройте конфигурацию параметров:

    1. Выберите метод обучения — LoRa. Сейчас доступен только этот вид обучения.

    2. Укажите значения для гиперпараметров дообучения:

      • Learning rate — начальная скорость обучения для алгоритма AdamW.

      • Epoch — общее количество эпох обучения.

      • Gradient accumulation — количество шагов для накопления градиентов перед обновлением параметров.

      • Batch size per device — количество образцов, обрабатываемых в каждом GPU.

      • Training precision — использование смешанной точности при обучении модели.

      • Logging steps — количество шагов между записями логирования.

      • Save steps — количество шагов между сохранением модели.

      • Max samples — максимальное количество образцов для дообучения модели.

  8. Ресурсы, выделенные на дообучение модели, доступны в одной конфигурации — 1 GPU H100 80GB – 182 GB RAM.

  9. Нажмите Запустить дообучение.

Добучить модель заново с новыми параметрами

Заново дообучить уже существующую в сервисе модель с другими параметрами можно двумя способами:

  • в списке дообучений в нужной строке нажмите Кнопка с тремя горизонтальными точкамиДообучить модель заново;

  • перейдите в нужное дообучение и нажмите Дообучить модель заново.

Заполните форму, аналогичную форме создания дообучения впервые.