cvat

Was ist CVAT (Computer Vision Annotation Tool)?

Stefan
11 Min Read
cvat

CVAT ist ein webbasiertes, Open-Source-Tool zur Bildannotation, das ursprünglich von Intel entwickelt wurde und jetzt von OpenCV gepflegt wird . CVAT bietet Annotationsfunktionen für Aufgaben zur Objekterkennung, Klassifizierung, Verfolgung und Segmentierung.

In diesem Beitrag konzentrieren wir uns auf die Fähigkeit von CVAT, Objekterkennungsanmerkungen auf Bildern vorzunehmen, obwohl es noch viele weitere Funktionen bietet, darunter ein CVAT-Anmerkungstool für Videos, ein CVAT-Anmerkungstool für die semantische Segmentierung, CVAT für Polygonanmerkungen und so weiter.

Eine äußerst detaillierte Anleitung zu jedem Element der Benutzeroberfläche finden Sie in der CVAT-Dokumentation .

CVAT ist ein Anmerkungstool aus einer Gruppe ähnlicher DIY-Beschriftungstools, darunter auch das Computer Vision-Beschriftungstool LabelImg .

Wir empfehlen, einen Stapel Bilder (50+) selbst zu beschriften und ein hochmodernes Modell wie YOLOv4 zu trainieren , um zu sehen, ob Ihre Computer Vision-Aufgabe mit aktuellen Technologien bereits gelöst werden kann.

Wir zeigen die Schritte zum Kommentieren des öffentlichen Datensatzes zur maritimen Objekterkennung aus der Luft, der von einer Drohne aufgenommen wurde . Obwohl ein spezifischer Datensatz verwendet wird, soll dieser Beitrag eine allgemeine Anleitung zum Beschriften eines Datensatzes zur Objekterkennung und zur Verwendung von Beschriftungstools für die Objekterkennung sein. Sie können gerne einen anderen ähnlichen Datensatz mit Luftbildern verwenden .

So kommentieren Sie Bilder mit CVAT

Wenn Sie CVAT zum ersten Mal verwenden, starten Sie am besten mit dem Aufrufen der CVAT-Website. Das ist der schnellste Weg, mit der Kennzeichnung Ihrer Daten zu beginnen.

Sobald Sie auf der CVAT-Website sind, wird Ihnen eine Seite wie diese angezeigt:

Neue CVAT-Aufgabe starten

Von dort aus können Sie eine neue Aufgabe in CVAT starten und Ihre Bilder zum Beschriften hineinziehen. Sie werden aufgefordert, die Klassenbezeichnungen der Objekte anzugeben, die Sie erkennen möchten. Geben Sie diese sorgfältig an, da Sie sicherstellen möchten, dass Sie über alle erforderlichen Klassen verfügen, bevor Sie mit der Beschriftung beginnen.

Sobald Ihre Daten hochgeladen sind, navigieren Sie zurück zu den Aufgaben. Von dort aus wird eine Aufgabenseite angezeigt.

CVAT-Etikettierauftrag eingeben

Sie können Jobs erstellen, um diesen Datensatz zu kommentieren. Der CVAT-Beschriftungsjob wird automatisch eingerichtet, wenn Sie die Aufgabe erstellen. Beachten Sie die semantische Hierarchie zwischen Aufgabe und Job.

Jetzt können Sie in Ihre Beschriftungsaufgabe klicken und mit der Arbeit beginnen. Wenn Sie sich im Beschriftungsbildschirm befinden, sehen Sie Folgendes.

Zeichnungsanmerkungen in CVAT

CVAT bietet mehrere Formentypen für Anmerkungen: Rechteck (Begrenzungsrahmen), Polygon, Polylinie, Punkte, Ellipse, Quader und Tag. Nachfolgend finden Sie Beispiele für die Verwendung dieser Tools.

Sie können auf „Form erstellen“ klicken und ein Kästchen um das Objekt zeichnen, das Ihr Detektor erkennen soll.

Begrenzungsrahmen können für Ihr Projekt geeignet sein, aber wenn Sie für eine bessere Leistung einen engeren Umriss Ihrer Objekte benötigen , können Sie das Polygon-Werkzeug verwenden. Ähnlich wie beim Polygon-Werkzeug haben Sie auch die Möglichkeit, das Polylinien-Anmerkungswerkzeug zu verwenden. Unten sehen Sie ein Video zur Polygon-Option.

Zusätzlich zu den manuellen Kennzeichnungstools bietet CVAT eine modellgestützte Kennzeichnung an , mit der Sie die Kennzeichnungsarbeit mithilfe künstlicher Intelligenz automatisieren können.

Sie können Ihre Roboflow-Modelle in CVAT verwenden, sodass Sie Bilder schneller als je zuvor in CVAT kommentieren können. Mit dieser Konfiguration kommentiert Ihr Roboflow-Modell (oder jedes andere Modell in Roboflow Universe ) automatisch neue Bilder, die Sie kommentieren müssen. Sie können Anmerkungen nach Bedarf anpassen und entfernen. In unserem Roboflow CVAT-Integrationshandbuch erfahren Sie ausführlich, wie Sie Roboflow-Modelle mit CVAT verwenden.

Im Abschnitt „KI-Tools“ finden Sie Interaktoren und Detektoren, die beim Erstellen von Polygonen helfen.

Zu den Interakteuren gehören Deep Extreme Cut (DEXTR), Feature Backpropagating Refinement Scheme (f-BRS), High Resolution Net (HRNet) und Inside-Outside-Guidance.

Zu den Detektoren gehören Mask RCNN und Faster RCNN, Deep-Learning-Modelle, die für bestimmte Bezeichnungen geeignet sind. Wenn Ihr Datensatz Objekte enthält, die von diesen Modellen unterstützt werden, können Sie diese Objekte dank der automatischen Zuordnung der Bezeichnungen sehr schnell beschriften.

Die vielfältigen Beschriftungsoptionen von CVAT bieten Ihnen verschiedene Möglichkeiten, Ihre Daten für den Zweck eines bestimmten Projekts zu kommentieren. Wenn Sie CVAT verwenden, ist es wichtig, Ihre Klassen und Beschriftungsmethoden vor dem Start des Projekts zu definieren, um sicherzustellen, dass Sie keine Zeit mit der Aktualisierung von Kommentaren verbringen müssen.

Anmerkungen aus CVAT exportieren

Klicken Sie zunächst auf „Speichern“. CVAT speichert die Arbeit nicht automatisch .

Klicken Sie dann auf „Menü“. In CVAT werden Ihnen die folgenden Optionen angezeigt:

Klicken Sie dann auf „Aufgabendatensatz exportieren“ und wählen Sie zwischen verschiedenen Formaten: Bezeichnung VOC XML, Bezeichnung COCO JSON, Bezeichnung YOLO-Anmerkungen usw. Stellen Sie vor dem Exportieren sicher, dass Sie das Format kennen, das zum Trainieren des von Ihnen gewählten Modells erforderlich ist. Falls Sie Ihre Anmerkungen in ein Format konvertieren müssen, das CVAT nicht unterstützt, bietet Roboflow kostenlose Datensatzkonvertierungen in über 26 Formate an .

Glückwunsch! Jetzt haben Sie einen beschrifteten Datensatz.

Installieren Sie CVAT auf Ihrem lokalen Computer

Wenn Sie CVAT ernst nehmen, können Sie es lokal konfigurieren. Die CVAT-Website hat folgende Einschränkungen:

  • Nicht mehr als 10 Aufgaben pro Benutzer
  • Die hochgeladenen Daten sind auf 500 MB begrenzt

Beim lokalen Betrieb unterliegen Sie diesen Einschränkungen nicht, da Ihr Computer die Schwerstarbeit übernimmt.

Um CVAT lokal zu starten, klonen Sie zuerst das CVAT-Repository in Ihrem Terminalfenster.

Wenn Sie Docker nicht haben, installieren Sie Docker . Stellen Sie sicher, dass Docker erfolgreich installiert wurde:

Jetzt erstellen wir CVAT lokal und starten es mit den folgenden Befehlen:

Dies dauert eine Weile. Es erstellt CVATS-Abhängigkeiten auf Ihrem lokalen Computer. Anschließend erstellen Sie Ihren Benutzernamen in Ihrem lokalen CVATS-Dienst, indem Sie Folgendes ausführen:

Navigieren Sie nun zu Ihrem Browser und geben Sie ein

Dadurch gelangen Sie zu Ihrem örtlichen CVATS!

Sie können später zurückkommen und den Dienst neu starten. Wenn Sie Probleme beim Anmelden bei CVATS haben, können Sie ihn ohne Cache neu erstellen:

Tipps, Tricks und bewährte Vorgehensweisen zur CVATS-Beschriftung

Wenn Sie in CVAT arbeiten, kommentieren Sie Objekte sorgfältig und berücksichtigen Sie dabei Ihr Downstream-Modell. Beachten Sie beim Durcharbeiten Ihres Datensatzes diese bewährten Methoden zur Beschriftung :

1) Beschriftung rund um das Objekt

2) Bei verdeckten Objekten – beschriften Sie diese vollständig

3) Beschriften Sie grundsätzlich Objekte, die teilweise außerhalb des Rahmens liegen

4) Achten Sie darauf, nicht zu viele Felder zu beschriften, die sich überlappen oder vollständig ineinander liegen. Dies kann Ihr Modell wirklich verwirren.

CVATS-Tipps

  • Beginnen Sie Ihre Beschriftungsliste mit der am häufigsten vertretenen Klasse. Dies ist die Standardeinstellung, wenn Sie ein Kästchen zeichnen
  • Beschriften Sie zuerst alle Objekte in jeder Klasse – Sie können sich auf sie konzentrieren und alle Beschriftungen auf einmal ändern
  • Geben Sie „N“ ein, um ein neues Kästchen zu zeichnen

CVAT-Alternativen

CVATS ist nur eines von vielen Beschriftungstools für Computer Vision. Wenn Sie sich fragen, ob es das Richtige für Sie ist, lesen Sie unseren ultimativen Leitfaden zur Objekterkennung oder probieren Sie Roboflow Annotate aus , das viele der Ecken und Kanten von Open-Source-Tools wie CVATS vereinfacht.

Zu den gängigen CVATS-Alternativen gehören:

  • LabelImg : LabelImg ist ein kostenloses Tool zur Bildanmerkung, das in der Programmiersprache Python geschrieben ist.
  • LabelMe : LabelMe wurde vom MIT als kostenlos nutzbares Annotation-Tool für Computer-Vision-Aufgaben entwickelt.

Nächste Schritte nach der Beschriftung Ihres Computer Vision-Datensatzes in CVAT

Sobald Ihr Datensatz in CVATS beschriftet ist, ist es Zeit, mit der Erstellung Ihres Computer-Vision-Modells fortzufahren!

Roboflow erleichtert das Laden Ihrer Daten (ziehen Sie Ihre Bilder und Ihre Annotationsdatei einfach per Drag & Drop aus CVATS). Sie können mit Erweiterungen wie dem Spiegeln von Bildern für CV , zufälligem Zuschneiden und dem Erstellen synthetischer Computer Vision-Daten noch mehr Daten generieren . Wenn Sie Datenerweiterungen verwenden möchten, um die Anzahl Ihrer Trainingsbilder zu erhöhen (um weniger Zeit in CVATS zu verbringen), ist dies eine gute Anleitung zur Verwendung von Datenerweiterungen in der Computer Vision .

Wenn Sie bereit sind, trainieren Sie mit Roboflow Train ein Modell mit nur einem Klick und testen Sie Ihr Modell schnell mit unserer Web-App oder Ihrer Webcam. Alternativ können Sie Ihre Daten aus Roboflow in ein beliebiges Format exportieren und mit dem Training Ihres Computer-Vision-Modells beginnen.

Unsere Beiträge zum Trainieren von YOLOv4 und zum Trainieren von EfficientDet sind gute Ausgangspunkte für das Trainieren Ihres Modells. Anhand der Modellbewertung können Sie dann abschätzen, wie viele weitere Daten Sie möglicherweise erfassen und kommentieren müssen.

Häufig gestellte Fragen

Wofür wird CVAT verwendet?

CVATS wird zum Annotieren von Bildern für Aufgaben zur Objekterkennung, Klassifizierung und Segmentierung verwendet. Sie können Bilder manuell annotieren oder modellgestützte Beschriftung verwenden, bei der ein Modell Anmerkungen empfiehlt, die einem Bild hinzugefügt werden sollen.

Was sind die Vorteile von CVATS?

CVATS bietet eine robuste Weboberfläche, über die Sie Bilder mit Anmerkungen versehen können. Durch die Bereitstellung einer Weboberfläche können Sie CVATS verwenden, ohne Software installieren zu müssen. CVATS bietet eine Reihe verschiedener Anmerkungswerkzeuge wie Ellipse, Begrenzungsrahmen, Polygon und modellgestützte Beschriftung.

Zitieren Sie diesen Beitrag

Verwenden Sie den folgenden Eintrag, um diesen Beitrag bei Ihrer Recherche zu zitieren:

Jacob Solawetz . (21. März 2022). Was ist CVATS (Computer Vision Annotation Tool)? Roboflow-Blog: https://blog.roboflow.com/cvat/

Besprechen Sie diesen Beitrag

Wenn Sie Fragen zu diesem Blogbeitrag haben, starten Sie eine Diskussion im Roboflow-Forum .