Ausführung

Die instanziierten Pläne werden von einer execute-Aufgabe ausgeführt. In dieser Phase gleicht der Ausführungsprozess, basierend auf den Aufgaben-Aktionsdaten, den realen Controller anhand der Wortumgebung ab und führt den Plan Schritt für Schritt aus. Nach der Ausführung bewertet der evalution-Agent die Qualität des gesamten Ausführungsprozesses.

ExecuteFlow

Die Klasse ExecuteFlow wurde entwickelt, um die Ausführung und Bewertung von Aufgaben in einer Windows-Anwendungsumgebung zu erleichtern. Sie bietet Funktionalität zur Interaktion mit der Benutzeroberfläche der Anwendung, zur Ausführung vordefinierter Aufgaben, zum Erfassen von Screenshots und zur Bewertung der Ausführungsergebnisse. Die Klasse verwaltet auch die Protokollierung und Fehlerbehandlung für die Aufgaben.

Aufgabenausführung

Die Aufgabenausführung in der Klasse ExecuteFlow folgt einer strukturierten Sequenz, um eine genaue und nachvollziehbare Aufgabenausführung zu gewährleisten.

Initialisierung:
Konfigurationseinstellungen und Protokollpfade laden.
Das Anwendungsfenster finden, das der Aufgabe entspricht.
Einen ExecuteAgent zur Ausführung der Aufgabe abrufen oder erstellen.
Planausführung:
Durch jeden Schritt im instantiated_plan iterieren.
Den Schritt parsen, um Informationen wie Unteraufgaben, Steuerelementtext und die erforderliche Operation zu extrahieren.
Aktionsausführung:
Das Steuerelement im Anwendungsfenster finden, das dem angegebenen Steuerelementtext entspricht.
Wenn kein übereinstimmendes Steuerelement gefunden wird, einen Fehler auslösen.
Die angegebene Aktion (z. B. Klicken, Text eingeben) mit dem Puppeteer-Framework des Agenten ausführen.
Screenshots des Anwendungsfensters und der ausgewählten Steuerelemente für die Protokollierung und Fehlerbehebung erfassen.
Ergebnisprotokollierung:
Details zur Schrittausführung protokollieren, einschließlich Steuerelementinformationen, ausgeführter Aktion und Ergebnissen.
Abschluss:
Den Endzustand des Anwendungsfensters speichern.
Den Anwendungsclient ordnungsgemäß beenden.

Evaluierung

Der Bewertungsprozess in der Klasse ExecuteFlow dient dazu, die Leistung der ausgeführten Aufgabe anhand vordefinierter Prompts zu beurteilen.

Bewertung starten:
Die Bewertung beginnt unmittelbar nach der Aufgabenausführung.
Dabei wird ein ExecuteEvalAgent verwendet, der während der Klassenerstellung initialisiert wird.
Bewertung durchführen:
Der ExecuteEvalAgent bewertet die Aufgabe anhand einer Kombination aus Eingabeaufforderungen (z. B. Hauptaufforderung und API-Aufforderung) und den während der Aufgabenausführung generierten Protokollen.
Der Bewertungsprozess gibt eine Ergebnisübersicht aus (z. B. Qualitätskennzeichnung, Kommentare und Aufgabentyp).
Ergebnisse protokollieren und ausgeben:
Die Bewertungsergebnisse auf der Konsole anzeigen.
Die Bewertungssummary zusammen mit dem ausgeführten Plan zur weiteren Analyse oder Berichterstattung zurückgeben.

Referenz

ExecuteFlow

Basisklassen: AppAgentProcessor

ExecuteFlow-Klasse zur Ausführung der Aufgabe und zum Speichern des Ergebnisses.

Die Execute-Flow-Routine für eine Aufgabe initialisieren.

Parameter	`task_file_name` (`str`) – Name der verarbeiteten Aufgabendatei. `context` (`Context`) – Kontextobjekt für die aktuelle Sitzung. `environment` (`WindowsAppEnv`) – Umgebungsobjekt für die verarbeitete Anwendung.