HuggingFace-下载模型
Hugging Face保存模型
Cache setup
如果本地和缓存中均没有模型的话,那么运行model.fromPretrained
会从huggingface官网中下载模型,保存到本地的默认路径~/.cache/huggingface/hub
.下
因此可以从~/.cache/huggingface/hub
下进入删除你不再需要的模型参数
Offline mode
如果在有防火墙或者离线的情况下使用Huggingface在cache file中保存的文件,通过设置环境变量
TRANSFORMERS_OFFLINE=1
.如果要使用本地的数据集,设置HF_DATASETS_OFFLINE=1
.
1 | HF_DATASETS_OFFLINE=1 TRANSFORMERS_OFFLINE=1 \ |
上述指令就不会尝试从huggingface在线的加载模型
同时也可以选**from_pretrained()**在模型加载的时候传递一个参数local_files_only
1 | from transformers import T5Model |
离线保存模型参数
- 从**Model Hub下载**
- 使**PreTrainedModel.from_pretrained()** 和**PreTrainedModel.save_pretrained():**
1.提前下载模型
1 |
|
2.将模型保存到指定的文件夹
1 | tokenizer.save_pretrained("./your/path/bigscience_t0") |
3.之后就可以从本地文件夹中提取模型
1 | tokenizer = AutoTokenizer.from_pretrained("./your/path/bigscience_t0") |
- 使用**huggingface_hub**
1 | python -m pip install huggingface_hub |
1 | from huggingface_hub import hf_hub_download |
以上代码就是从T0模型中下载了config.json文件到了指定文件夹
使用镜像网站
本站域名 hf-mirror.com,用于镜像 huggingface.co 域名。
更多用法(多线程加速等)详见这篇文章。简介:
方法一:使用huggingface 官方提供的 huggingface-cli 命令行工具。
(1) 安装依赖
1 | python pip install -U huggingface_hub |
(2) 基本命令示例:
1 | export HF_ENDPOINT=https://hf-mirror.com |
(3) 下载需要登录的模型(Gated Model)
1 | 请添加--token hf_***参数,其中hf_***是 access token,请在huggingface官网这里获取。示例: |
方法二:使用url直接下载时,将 huggingface.co 直接替换为本站域名hf-mirror.com。使用浏览器或者 wget -c、curl -L、aria2c 等命令行方式即可。
下载需登录的模型需命令行添加 --header hf_*** 参数,token 获取具体参见上文。
方法三:(非侵入式,能解决大部分情况)huggingface 提供的包会获取系统变量,所以可以使用通过设置变量来解决。
1 | HF_ENDPOINT=https://hf-mirror.com python your_script.py |
不过有些数据集有内置的下载脚本,那就需要手动改一下脚本内的地址来实现了