
关于 Hugging Face 模型中心和社区,你需要了解的一切
图片来自:Editor | Ideogram
Hugging Face 在机器学习应用技术的突破方面做出了重要贡献,尤其是在自然语言处理领域。他们能够做出巨大贡献,是因为 Hugging Face 专注于构建一个平台,让社区能够轻松地公开访问模型、工具和数据集。这就是为什么 Hugging Face 已经成为贡献和展示许多机器学习作品的地方。
鉴于 Hugging Face 平台对于世界技术突破至关重要,我们应该更深入地了解 Hugging Face Hub 平台。本文将重点关注模型中心和社区,因为这是大部分工作发生的地方。
我们开始吧。
Hugging Face Hub 平台概述
如前所述,Hugging Face 是一家专注于机器学习开发的公司,通过构建一个平台,让社区能够轻松地共享和贡献。该平台称为 Hugging Face Hub。
Hugging Face Hub 是一个托管公开可用和开源模型、数据集和应用程序的平台。社区可以单独或协作轻松访问 Hub 中的所有内容。Hub 的结构如下所示。

Hugging Face Hub 结构
让我们来探索一下 Hugging Face 模型中心是如何工作的。
Hugging Face 模型中心
Hugging Face Hub 模型是托管各种机器学习任务模型的场所,例如图像分类、问答、文本到语音等。社区可以使用模型中心来共享和发现对下游任务有价值的任何模型。
让我们来分解一下模型中心的关键要素。
模型仓库
我们首先探索的是模型仓库。模型仓库类似于 GitHub 仓库,用户可以在其中上传模型并与公众共享。您可以在下面的图片中看到模型仓库的示例。

模型仓库示例
每个仓库都可以存储我们为特定任务训练的模型。用户可以以 PyTorch、TensorFlow 或 JAX 等格式上传模型。让我们选择一个仓库,看看里面有什么。

Mistral-Nemo-Instruct-2407 仓库
上图是 Mistral-Nemo-Instruct-2407 预训练模型的仓库。它包含许多信息,包括模型卡、文件和版本以及社区。让我们逐一了解。
模型卡包含有关模型的全面信息。您可以填写模型架构、训练数据、使用说明和模型性能等信息。
该仓库还支持文件存储,包括配置文件和模型权重。它带有模型的版本控制,允许用户在每次更新模型时跟踪任何更改,并在必要时回滚到旧版本。
在每个仓库中,您可以创建讨论线程和拉取请求,与社区进行协作。如果您熟悉 GitHub 仓库,此功能与之类似。
最后,模型仓库具有下载的统计信息、训练代码模板、部署代码模板和用于测试模型的推理 API。此外,还有关于哪些 Hugging Face 空间使用该模型的信息。
模型中心搜索
由于 Hugging Face 模型中心内有如此多的仓库,如果我们随机单独选择它们,很难找到我们需要的模型。这就是搜索栏的作用。

Hugging Face 模型中心搜索
您可以使用与您的需求相关的关键字搜索模型,例如机器学习任务或模型框架。理想情况下,每个仓库都已标记相关的描述,例如任务、框架、使用的数据集等。如果仓库已正确标记,您也可以通过选择选项卡(任务、库、数据集、语言、许可证、其他)来过滤。
为了进行更广泛的搜索,您可以使用全文搜索。

Hugging Face 全文搜索
您可以使用全文搜索查找包含您输入的文本的模型仓库。
模型中心集成
一旦您在 Hugging Face 模型中心选择了要使用的模型,您可以手动下载所有文件,或者我们可以使用 huggingface_hub
库与仓库进行交互。让我们来试试。
首先,我们需要安装该库。
1 |
pip install huggingface_hub |
接下来,您必须从您的设置页面获取用户访问令牌。
1 2 |
from huggingface_hub import login login('USER_ACCESS_TOKEN') |
设置完成后,我们就可以与模型中心仓库进行交互了。例如,我将尝试从模型仓库下载一个文件。
1 2 |
from huggingface_hub import hf_hub_download hf_hub_download(repo_id="Groq/Llama-3-Groq-70B-Tool-Use", filename="config.json") |
也可以下载特定版本的特定文件。
1 2 |
from huggingface_hub import hf_hub_download hf_hub_download(repo_id="Groq/Llama-3-Groq-70B-Tool-Use", filename="config.json", version = "80ef0bf2502c651f45a93fceea7376899f284872") |
您还可以创建自己的模型仓库并上传文件,例如配置文件或模型。
1 2 3 |
from huggingface_hub import HfApi api = HfApi() api.create_repo(repo_id="my_model") |
然后,我们可以使用以下代码将文件上传到您的仓库
1 2 3 4 |
api.upload_file( path_or_fileobj="path/to/your/file/README.md", path_in_repo="README.md", repo_id="cornelliusyudhawijaya/my_model") |
有关模型中心模型进一步的用法,您可以查看 Hugging Face 的 Transformers 文档。
以上就是模型中心的基础知识。让我们继续了解 Hugging Face 社区。
Hugging Face 社区
我在模型仓库中提到了一个社区,您可以在其中讨论模型和创建拉取请求。然而,Hugging Face 社区不仅仅是这样。如果您查看 Hugging Face 网站上的下拉菜单,它包含许多社区页面,类似于下图。

Hugging Face 社区页面
让我们试着分解一下,以便更好地理解。
Hugging Face 社区博客文章
这个名字不言而喻,因为社区博客文章部分包含从社区发布到社区的博客文章和文章。您可以创建自己的文章,但必须订阅 Hugging Face Pro。

Hugging Face 社区博客文章
您可以在这里阅读许多博客和文章,并通过标签进行过滤。试着探索它们,因为您可以从社区博客和文章中学到很多东西。
Hugging Face 社区学习
说到学习,Hugging Face 还为社区提供了各种主题,例如 NLP、计算机视觉等等。

Hugging Face 社区学习
每门课程都是自学的,没有时间限制,您可以随时以任何您想要的方式重新访问它。课程示例在下面的图片中。
试着将此平台用作学习材料,它将对您的未来职业生涯有所帮助。
Hugging Face 社区论坛
如果您喜欢老式讨论,可以加入 Hugging Face 论坛。在此论坛中,您可以创建主题并回答社区的问题。论坛类似于下图。

Hugging Face 社区论坛
您还可以过滤类别以满足您的需求。如果您需要更详细的答案,论坛是与社区讨论的好地方。
Hugging Face 社区 Discord
如果您更喜欢直接的实时聊天,可以通过 Hugging Face 社区 Discord 进行。在接受 邀请后,您将被引导至社区 Discord。

Hugging Face 社区 Discord
您需要访问四个不同的入门频道,并使用您之前创建的 Hugging Face 用户访问令牌验证您的用户名。然后,转到 LevelBot 私信,并使用以下命令与机器人聊天。
1 |
!auth |
验证成功后,您将收到消息,然后就可以自由探索社区了。
Hugging Face 社区 GitHub
Hugging Face 通常被称为机器学习领域的 GitHub,但它仍然在其 GitHub 仓库中托管许多其库、工具、学习材料和其他资源。

Hugging Face 社区 GitHub
截至本文撰写之时,有大约 235 个仓库可供您探索和与社区讨论。您还可以为 Hugging Face GitHub 上托管的开源项目做出贡献。
结论
Hugging Face 是机器学习开发的重要平台。它允许社区以开源方式轻松访问模型、数据集、应用程序等。
本文重点介绍了 Hugging Face 模型中心和社区。这两个功能使 Hugging Face 闻名遐迩,您也应该了解它们。
暂无评论。