Перед созданием датасета с помощью среды разработки:
Сохраните ID проекта.
Чтобы скопировать ID проекта:
В верхней панели меню раскройте список всех проектов.
В строке с проектом нажмите
и выберите Скопировать ID проекта.
ID будет скопирован в буфер обмена.
Просмотреть и скопировать ID любого проекта можно также в разделе Администрирование, на вкладке Каталоги и проекты.
Чтобы создать датасет с помощью IDE:
Сохраните датасет, который необходимо загрузить в Repo, в локальную папку с проектом.
В IDE скопируйте фрагмент кода, указав ваши данные.
from huggingface_hub import HfApirepo_id = "project_id/Dataset Registry name"repo_type = "dataset"token = "API-key"api = HfApi(token=Hugging_Face_access_token)api.create_repo(repo_id=repo_id,repo_type=repo_type,exist_ok=True)api.upload_folder(folder_path="local dataset folder",repo_id=repo_id,repo_type=repo_type)
Задайте переменную окружения HF_ENDPOINT=https://mr-repo.cloud.ru
Выполните код, используя переменную окружения.
Датасет будет загружен из локальной папки в Dataset Registry в репозиторий с именем <название репозитория Dataset Registry>.
ПримечаниеОграничение на размер одного файла датасета при использовании IDE составляет 20 ГБ.
Этот объем не учитывается при ограничении размера репозитория Dataset Registry.
Если такого датасета не существует, он будет создан.