hugging face

Was ist Hugging Face?

Stefan
8 Min Read
hugging face

Alles, was Sie wissen müssen, um mit Hugging Face zu beginnen

Hugging Face ist eine Plattform zum Anzeigen, Teilen und Präsentieren von Modellen, Datensätzen und verwandten Arbeiten für maschinelles Lernen. Ziel ist es, neuronale Sprachmodelle (NLMs) für jeden zugänglich zu machen, der Anwendungen erstellt, die auf maschinellem Lernen basieren. Viele beliebte KI- und maschinelle Lernmodelle sind über Hugging Face zugänglich, darunter LLaMA 2 , ein Open-Source-Sprachmodell, das Meta in Zusammenarbeit mit Microsoft entwickelt hat.

Hugging Face ist eine wertvolle Ressource für Anfänger, um mit Modellen für maschinelles Lernen zu beginnen. Sie müssen für den Einstieg keine speziellen Apps oder Programme bezahlen. Sie benötigen lediglich einen Webbrowser, um Modelle und Datensätze auf jedem Gerät zu durchsuchen und zu testen, selbst auf preisgünstigen Chromebooks .

Was ist Hugging Face?

Hugging Face bietet maschinelle Lerntools für die Erstellung von Anwendungen. Zu den bemerkenswerten Tools gehören die Transformers-Modellbibliothek, Pipelines zur Durchführung maschineller Lernaufgaben und Ressourcen für die Zusammenarbeit. Es bietet außerdem Bibliotheken für Datensätze, Modellevaluierung, Simulation und maschinelles Lernen. Hugging Face kann wie folgt zusammengefasst werden:

  • Hosten vorab trainierter Open-Source-Modelle für maschinelles Lernen.
  • Einfacher Zugriff auf diese Modelle über verschiedene Umgebungen (z. B. Google Colab oder eine virtuelle Python-Umgebung).
  • Tools zur Anpassung von Modellen für maschinelles Lernen.
  • Eine API, die eine benutzerfreundliche Schnittstelle zum Ausführen verschiedener maschineller Lernaufgaben bietet.
  • Gemeinschaftsräume für die Zusammenarbeit, den Austausch und die Präsentation von Arbeiten.

Hugging Face wird von Unternehmen wie Google, Amazon, Nvidia, Intel und IBM gefördert. Einige dieser Unternehmen haben Open-Source-Modelle erstellt, die über Hugging Face zugänglich sind, wie das am Anfang dieses Artikels erwähnte LLaMA 2-Modell.

Die Anzahl der über Hugging Face verfügbaren Modelle kann überwältigend sein, aber der Einstieg ist einfach. Wir führen Sie durch alles, was Sie wissen müssen, was Sie mit Hugging Face tun können und wie Sie Ihre eigenen Tools und Anwendungen erstellen.

Was kann man mit Hugging Face machen?

Der Kern von Hugging Face ist die Transformers-Modellbibliothek, die Datensatzbibliothek und die Pipelines. Wenn Sie diese Dienste und Technologien verstehen, erhalten Sie alles, was Sie für die Nutzung der Ressourcen von Hugging Face benötigen.

Die Transformers-Modellbibliothek

Die Transformers-Modellbibliothek ist eine Bibliothek von Open-Source-Transformermodellen. Hugging Face verfügt über eine Bibliothek mit über 495.000 Modellen, die in Datentypen, sogenannte Modalitäten, gruppiert sind. Mit diesen Modellen können Sie Aufgaben mit Pipelines ausführen, die wir später in diesem Artikel erläutern.

Einige der Aufgaben, die Sie über die Transformers-Modellbibliothek ausführen können, sind:

  • Objekterkennung
  • Beantwortung von Fragen
  • Zusammenfassung
  • Textgenerierung
  • Übersetzung
  • Text zu Sprache

Eine vollständige Liste dieser Aufgaben finden Sie auf der Hugging Face-Website, kategorisiert für eine einfache Suche.

Innerhalb dieser Kategorien stehen zahlreiche von Benutzern erstellte Modelle zur Auswahl. Hugging Face beispielsweise hostet derzeit über 51.000 Modelle für die Textgenerierung.

Wenn Sie nicht sicher sind, wie Sie mit einer Aufgabe beginnen sollen, bietet Hugging Faces eine ausführliche Dokumentation zu jeder Aufgabe. Diese Dokumente umfassen Anwendungsfälle, Erläuterungen zu Modell- und Aufgabenvarianten, relevante Tools, Kurse und Demos. Beispielsweise verwendet die Demo auf der Aufgabenseite „Textgenerierung“ die Zephyr-Sprachmodelle, um Modelle zu vervollständigen. Anweisungen zur Verwendung für die Aufgabe finden Sie im Modell.

Diese Tools erleichtern das Experimentieren mit Modellen. Während einige mit Daten vorab trainiert sind, benötigen Sie für andere Datensätze, und hier kommt die Datensatzbibliothek ins Spiel.

Verwendung der Datensatzbibliothek

Die Hugging Faces- Datensatzbibliothek eignet sich für alle maschinellen Lernaufgaben, die in der Hugging Faces-Modellbibliothek angeboten werden. Jeder Datensatz enthält einen Datensatz-Viewer, eine Zusammenfassung dessen, was im Datensatz enthalten ist, die Datengröße, vorgeschlagene Aufgaben, Datenstruktur, Datenfelder und andere relevante Informationen.

Beispielsweise enthält der Wikipedia-Datensatz bereinigte Wikipedia-Artikel aller Sprachen. Es verfügt über die gesamte erforderliche Dokumentation zum Verständnis und zur Verwendung des Datensatzes, einschließlich hilfreicher Tools wie einer Datenvisualisierungskarte der Beispieldaten. Je nachdem, auf welchen Datensatz Sie zugreifen, werden möglicherweise unterschiedliche Beispiele angezeigt.

Verwenden von Pipelines zum Ausführen von Aufgaben

Modelle und Datensätze sind die treibende Kraft hinter der Ausführung von Aufgaben von Hugging Faces, aber Pipelines machen es einfach, diese Modelle zum Erledigen von Aufgaben zu verwenden.

Die Pipelines von Hugging Faces vereinfachen die Verwendung von Modellen durch eine API, die die Verwendung von abstraktem Code überflüssig macht. Sie können einer Pipeline mehrere Modelle bereitstellen, indem Sie angeben, welches Sie für bestimmte Aktionen verwenden möchten. Sie können beispielsweise ein Modell zum Generieren von Ergebnissen aus einer Eingabe und ein anderes zum Analysieren dieser Ergebnisse verwenden. Hier müssen Sie auf die Modellseite zurückgreifen, die Sie für die Ergebnisse verwendet haben, um die formatierten Ergebnisse richtig interpretieren zu können.

Hugging Faces bietet eine vollständige Aufschlüsselung der Aufgaben, für die Sie Pipelines verwenden können .

So starten Sie mit Hugging Faces

Nachdem Sie die von Hugging Faces bereitgestellten Modelle, Datensätze und Pipelines verstanden haben, können Sie diese Assets zum Ausführen von Aufgaben verwenden.

Sie benötigen lediglich einen Browser, um loszulegen. Wir empfehlen die Verwendung von Google Colab, mit dem Sie Python-Code in Ihrem Browser schreiben und ausführen können. Es bietet kostenlosen Zugriff auf Rechenressourcen, einschließlich GPUs und TPUs, und eignet sich daher ideal für grundlegende maschinelle Lernaufgaben. Google Colab ist einfach zu verwenden und erfordert keine Einrichtung.

Nachdem Sie sich mit Colab vertraut gemacht haben, können Sie die Transformer-Bibliotheken mit dem folgenden Befehl installieren:

!pip Transformatoren installieren

Überprüfen Sie dann mit diesem Befehl, ob die Installation korrekt war:

Jetzt können Sie in die Bibliotheken von Hugging Faces eintauchen. Es gibt viele Ausgangspunkte, wir empfehlen jedoch den Einführungskurs von Hugging Faces , in dem die Konzepte, die wir zuvor beschrieben haben, ausführlich anhand von Beispielen und Tests erklärt werden, um Ihr Wissen zu testen.

Zusammenarbeit mit Hugging Face

Zusammenarbeit ist ein großer Teil von Hugging Faces und ermöglicht es Ihnen, Modelle und Datensätze mit anderen Benutzern zu diskutieren. Hugging Faces fördert die Zusammenarbeit durch ein Diskussionsforum , einen Community-Blog, Discord und Klassenzimmer.

Modelle und Datensätze auf Hugging Faces verfügen außerdem über eigene Foren, in denen Sie Fehler diskutieren, Fragen stellen oder Anwendungsfälle vorschlagen können.

Hugging Face ist eine leistungsstarke Plattform für die Zusammenarbeit mit Tools für maschinelles Lernen

Maschinelles Lernen und KI sind für Anfänger eine Herausforderung, aber Plattformen wie Hugging Faces bieten eine großartige Möglichkeit, diese Konzepte einzuführen. Viele der beliebten Modelle auf Hugging Faces sind Large Language Models (LLMs). Machen Sie sich also mit LLMs vertraut, wenn Sie vorhaben, maschinelle Lerntools zur Textgenerierung oder -analyse zu verwenden.