下载数据集
在 Ubuntu 上下载 Hugging Face 数据集我推荐使用 huggingface-cli 这个官方工具它稳定且支持断点续传。国内用户配置 hf-mirror.com 镜像站后下载速度会快很多。下面是完整的命令步骤你可以逐条复制执行。### Ubuntu 完整下载命令打开你的终端 (Terminal)依次运行以下命令**1. 安装依赖**首先确保系统安装了 git-lfs这是下载大文件所必需的。bashsudo apt updatesudo apt install git-lfs -ygit lfs install**2. 安装 huggingface-cli**这是 Hugging Face 官方的下载工具。bashpip install -U huggingface_hub**3. 配置国内镜像加速关键步骤**这一步会将下载源切换到国内镜像站能大幅提升下载速度和稳定性。bashexport HF_ENDPOINThttps://hf-mirror.com为了让这个配置在下次打开终端时依然生效可以把它写入配置文件bashecho export HF_ENDPOINThttps://hf-mirror.com ~/.bashrc**4. 执行下载命令**根据你截图中的信息数据集ID是 Dobot-Official/Dobot-xtrainer-demo-data。运行以下命令即可将它下载到当前目录下的 Dobot-xtrainer-demo-data 文件夹中。bashhuggingface-cli download Dobot-Official/Dobot-xtrainer-demo-data \--repo-type dataset \--local-dir ./Dobot-xtrainer-demo-data \--resume-download**参数说明*** Dobot-Official/Dobot-xtrainer-demo-data你要下载的数据集ID。* --repo-type dataset指定下载的是一个**数据集**而不是模型。* --local-dir ./Dobot-xtrainer-demo-data指定文件保存的本地路径。* --resume-download启用**断点续传**功能如果下载中断再次运行相同命令即可继续不用担心数据丢失。---### 备选方案使用 hfd 脚本追求极致速度如果你熟悉命令行并且希望下载速度更快可以使用 hfd 脚本它调用 aria2 进行多线程下载能跑满带宽。bash# 1. 安装 aria2 下载工具sudo apt install aria2 -y# 2. 下载 hfd 脚本并赋予执行权限wget https://hf-mirror.com/hfd/hfd.shchmod ax hfd.sh# 3. 设置镜像站export HF_ENDPOINThttps://hf-mirror.com# 4. 执行下载使用 4 个线程可根据网络情况调整./hfd.sh Dobot-Official/Dobot-xtrainer-demo-data \--dataset \--tool aria2c \-x 4 **请注意**这个 6.12GB 的数据集下载需要一些时间请确保网络稳定并且有足够的磁盘空间。如果在下载中遇到任何错误可以把提示信息发给我看看。