Перенести датасет из библиотеки Hugging Face
Примечание
Инструкция ниже подходит для Mac OS.
На устройствах под управлением ОС Windows вы можете загрузить локальный репозиторий с помощью Git.
-
Создайте датасет в Repo.
-
Создайте скрипт для переноса датасета:
#!/bin/bash# Проверка количества аргументовif [[ "$#" -ne 2 ]]; thenecho "Использование: $0 url1 url2"exit 1fiURL1=$1URL2=$2# Клонирование репозиторияgit clone "$URL1" || { echo "Ошибка клонирования репозитория"; exit 1; }cd $(basename "$URL1" .git)# Загрузка всех файлов через Git LFSgit lfs fetch --all || { echo "Ошибка загрузки файлов через Git LFS"; exit 1; }# Изменение удаленного репозитория на указанный вторым параметромgit remote set-url origin "$URL2" || { echo "Ошибка изменения адреса удалённого репозитория"; exit 1; }# Принудительный пуш изменений в ветку maingit push --force -u origin main || { echo "Ошибка принудительного пуша в ветку main"; exit 1; }# Пуш всех файлов через Git LFSgit lfs push --all origin main || { echo "Ошибка пуша файлов через Git LFS"; exit 1; }echo "Операции выполнены успешно." -
Дайте права на выполнение скрипта всем пользователям:
chmod +x move.sh -
Запустите скрипт:
./move.sh <https://huggingface.co/datasets/some/repo> <ssh://git@rm-repo.cloud.ru:2222/7a4881ed-6e8e-4d00-add4-2383f8fa8d76/some-repo.git>Где:
-
<https://huggingface.co/datasets/some/repo> — адрес репозитория в библиотеке Hugging Face;
-
<ssh://git@rm-repo.cloud.ru:2222/7a4881ed-6e8e-4d00-add4-2383f8fa8d76/some-repo.git> — ссылка на репозиторий в интерфейсе Repo.
-
После выполнения скрипта датасет из Hugging Face будет перенесен в созданный датасет в Repo.
См.также