Übersicht
| Szenario | Beschreibung |
|---|---|
| Klassifizierung | Bildklassifizierung ist eine überwachte maschinelle Lerntechnik, um die Kategorie eines gegebenen Bildes zu lernen und vorherzusagen. |
| Ähnlichkeit | Bildähnlichkeit ist eine Methode, um einen Ähnlichkeitswert für ein Bildpaar zu berechnen. Gegeben ein Bild, ermöglicht sie es Ihnen, das ähnlichste Bild in einem gegebenen Datensatz zu identifizieren. |
| Erkennung | Objekterkennung ist eine Technik, mit der Sie die Bounding Box eines Objekts in einem Bild erkennen können. |
| Schlüsselpunkte | Schlüsselpunkterkennung kann verwendet werden, um bestimmte Punkte auf einem Objekt zu erkennen. Ein vortrainiertes Modell wird zur Erkennung von Körpergelenken für die menschliche Posenschätzung bereitgestellt. |
| Segmentierung | Bildsegmentierung weist jedem Pixel in einem Bild eine Kategorie zu. |
| Aktionserkennung | Aktionserkennung (auch bekannt als Aktivitätserkennung) besteht darin, verschiedene Aktionen aus einer Sequenz von Frames zu klassifizieren, wie z. B. „Lesen“ oder „Trinken“. |
| Verfolgung | Verfolgung ermöglicht die Erkennung und Verfolgung mehrerer Objekte in einer Videosequenz über die Zeit. |
Szenarien
Während sich das Feld der Computer Vision rasant entwickelt, fallen die meisten Vision-Anwendungen in eine dieser 4 Kategorien
- Bildklassifizierung: Vorhersage, welches Objekt in einem Eingabebild vorhanden ist. Dies ist typischerweise das einfachste CV-Problem, das gelöst werden muss. Die Klassifizierung erfordert jedoch, dass die Objekte im Bild einigermaßen groß sind.

- Bildähnlichkeit: Finden aller ähnlichen Objekte in Bildern aus einem Referenzdatensatz für ein gegebenes Eingabebild. Hier ist die Aufgabe nicht, ein Label und/oder ein Rechteck vorherzusagen, sondern einen Referenzdatensatz zu durchsuchen, um Objekte zu finden, die dem im Abfragebild gefundenen ähnlich sind.

- Objekterkennung: Identifizierung und Lokalisierung vorhandener Objekte in einem Eingabebild (mithilfe rechteckiger Koordinaten). Objekterkennung kann kleine Objekte in einem Bild finden. Im Vergleich zur Bildklassifizierung ist sowohl das Modelltraining als auch die manuelle Annotation von Bildern bei der Objekterkennung zeitaufwendiger, da sowohl das Label als auch die Position erforderlich sind.

- Schlüsselpunkterkennung: Identifizierung und Lokalisierung von Schlüsselpunkten in einem Eingabebild. Konzeptionell läuft dies so ab, dass zuerst ein Objektdetektor ausgeführt und dann Schlüsselpunkte auf den Objekten erkannt werden. In der Praxis führen sowohl Schritt 1 als auch Schritt 2 mit einem einzigen Modell (fast) gleichzeitig aus.

- Bildsegmentierung: Zuweisung eines Labels für jedes Pixel in einem Eingabebild (z. B. Hintergrund, Flasche, Hand, Himmel usw.). In der Praxis ist dieses Problem in der Industrie weniger verbreitet, hauptsächlich aufgrund der Zeit, die für die Annotation der Ground-Truth-Segmentierung benötigt wird, um eine Lösung zu trainieren.

Daten/Telemetrie
Die folgenden Notebooks sammeln Browsernutzungsdaten und senden sie an Microsoft, um unsere Produkte und Dienstleistungen zu verbessern
- classification/20_azure_workspace_setup
- classification/21_deployment_on_azure_container_instances
- classification/22_deployment_on_azure_kubernetes_service
- classification/23_aci_aks_web_service_testing
- classification/24_exploring_hyperparameters_on_azureml
- detection/11_exploring_hyperparameters_on_azureml
Lesen Sie die Datenschutzerklärung von Microsoft, um mehr zu erfahren.
Um das Tracking zu deaktivieren, gehen Sie bitte zu den rohen .ipynb-Dateien und entfernen Sie die folgende Codezeile (die URL wird je nach Datei leicht unterschiedlich sein)
""