Zum Inhalt springen.

Video-Annotation-Zusammenfassung für Aktionserkennung

Um einen Trainings- oder Evaluationsdatensatz für Aktionserkennung zu erstellen, müssen die Ground-Truth-Start-/Endpositionen von Aktionen in Videos annotiert werden. Wir haben verschiedene Tools dafür untersucht, und das Tool, das uns (bei weitem) am besten gefallen hat, heißt VGG Image Annotator (VIA), geschrieben von der VGG-Gruppe in Oxford.

Anleitung zur Verwendung des VIA-Tools

Wir geben nun einige Tipps/Schritte zur Verwendung des VIA-Tools. Eine voll funktionsfähige Live-Demo des Tools finden Sie hier.

Screenshot des VIA-Tools

Verwendung des Tools für die Aktionserkennung

Skripte zur Verwendung mit dem VIA-Tool

Das VIA-Tool gibt Annotationen als CSV-Datei aus. Oft müssen wir jedoch jede annotierte Aktion als eigenen Clip und in separate Dateien schreiben. Diese Clips können dann als Trainingsbeispiele für Aktionserkennungsmodelle dienen. Wir stellen einige Skripte zur Verfügung, die beim Erstellen solcher Datensätze helfen.

Vergleich von Annotationstools

Unten finden Sie eine Liste alternativer Benutzeroberflächen für die Annotation von Aktionen, aber unserer Meinung nach ist das VIA-Tool der mit Abstand beste Performer. Wir unterscheiden zwischen

Siehe auch die HACS Dataset Webpage für einige Beispiele, die diese beiden Arten von Annotationen zeigen.

Toolname Annotationstyp Vorteile Nachteile Ob Open Source
MuViLab Annotation von Clips mit fester Länge <ul><li> Beschleunigt die Clip-Annotation durch gleichzeitige Anzeige vieler Clips</li>
<li> Besonders hilfreich, wenn die Aktionen spärlich sind</li></ul>
<ul><li> Nicht nützlich, wenn die Aktionen sehr kurz sind (z. B. eine Sekunde)</li></ul> Open Source auf Github
VIA (VGG Image Annotator) Segmentationsannotation <ul><li> Leichtgewichtig, keine Voraussetzung außer dem Herunterladen einer Zip-Datei</li>
<li> Aktives Entwicklungsprojekt auf Gitlab</li>
<li> Unterstützung für: Annotation von Videos in hoher Präzision (auf Millisekunden und Frames), Vorschau der annotierten Clips, Export von Start- und Endzeiten der Aktionen nach CSV, Annotation mehrerer Aktionen in verschiedenen Spuren auf demselben Video</li>
<li> Einfach zu erlernen und zu verwenden</li></ul>
<ul><li> Code kann zu Instabilitäten führen, z. B. wird das Tool manchmal nicht reagieren.</li></ul> Open Source auf Gitlab
ANVIL Segmentationsannotation <ul><li> Unterstützung für hochpräzise Annotationen, Export von Start- und Endzeiten.</li></ul> <ul><li> Schwerwiegendere Voraussetzung mit erforderlichem Java</li>
<li> Schwerer zu erlernen im Vergleich zu VIA mit vielen Spezifikationen usw.</li>
<li> Java-bezogene Probleme können die Ausführung des Tools erschweren.</li></ul>
Nicht Open Source, aber kostenlos zum Download
Action Annotation Tool Segmentationsannotation <ul><li> Fügen Sie Schlüsselbilder in Videos Beschriftungen hinzu</li>
<li> Unterstützt hohe Präzision bis zu Millisekunden</li></ul>
<ul><li> Viel weniger praktisch im Vergleich zu VIA oder ANVIL</li>
<li> Nicht mehr aktiv entwickelt</li></ul>
Open Source auf Github

Referenzen