Evolution
Тема интерфейса

Перенести датасет из библиотеки Hugging Face

Примечание

Инструкция ниже подходит для Mac OS.

На устройствах под управлением ОС Windows вы можете загрузить локальный репозиторий с помощью Git.

  1. Создайте скрипт для переноса датасета:

    #!/bin/bash
    # Проверка количества аргументов
    if [[ "$#" -ne 2 ]]; then
    echo "Использование: $0 url1 url2"
    exit 1
    fi
    URL1=$1
    URL2=$2
    # Клонирование репозитория
    git clone "$URL1" || { echo "Ошибка клонирования репозитория"; exit 1; }
    cd $(basename "$URL1" .git)
    # Загрузка всех файлов через Git LFS
    git lfs fetch --all || { echo "Ошибка загрузки файлов через Git LFS"; exit 1; }
    # Изменение удаленного репозитория на указанный вторым параметром
    git remote set-url origin "$URL2" || { echo "Ошибка изменения адреса удалённого репозитория"; exit 1; }
    # Принудительный пуш изменений в ветку main
    git push --force -u origin main || { echo "Ошибка принудительного пуша в ветку main"; exit 1; }
    # Пуш всех файлов через Git LFS
    git lfs push --all origin main || { echo "Ошибка пуша файлов через Git LFS"; exit 1; }
    echo "Операции выполнены успешно."
  2. Дайте права на выполнение скрипта всем пользователям:

    chmod +x move.sh
  3. Запустите скрипт:

    ./move.sh <https://huggingface.co/datasets/some/repo> <ssh://git@rm-repo.cloud.ru:2222/7a4881ed-6e8e-4d00-add4-2383f8fa8d76/some-repo.git>

    Где:

    • <https://huggingface.co/datasets/some/repo> — адрес репозитория в библиотеке Hugging Face;

    • <ssh://git@rm-repo.cloud.ru:2222/7a4881ed-6e8e-4d00-add4-2383f8fa8d76/some-repo.git> — ссылка на репозиторий в интерфейсе Repo.

После выполнения скрипта датасет из Hugging Face будет перенесен в созданный датасет в Repo.