Облачная платформаEvolution

Скачать датасет с помощью среды разработки


Перед скачиванием датасета с помощью среды разработки:

  • Сохраните ID проекта.

    Чтобы скопировать ID проекта:

    1. В верхней панели меню раскройте список всех проектов.

    2. В строке с проектом нажмите Кнопка с изображением трех вертикальных точек и выберите Скопировать ID проекта.

      ID будет скопирован в буфер обмена.

    Просмотреть и скопировать ID любого проекта можно также в разделе Администрирование, на вкладке Каталоги и проекты.

Чтобы скачать датасет с помощью IDE:

  1. Укажите ваши данные в коде:

    from datasets import load_dataset, DownloadMode
    from huggingface_hub import login
    login(token="API key")
    dataset = load_dataset(
    "project_id/Dataset Registry name",
    "название папки",
    download_mode=DownloadMode.FORCE_REDOWNLOAD,
    )
    dataset.save_to_disk("local dataset folder")
  2. Задайте переменную окружения HF_ENDPOINT=https://repo.cloud.ru

  3. Выполните код, используя переменную окружения.

    Датасет будет загружен из Dataset Registry из репозитория <Dataset Registry name> в локальную папку.