Schrittprotokolle

Das Schrittprotokoll enthält die Antwort des Agenten auf die Anfrage des Benutzers und zusätzliche Informationen in jedem Schritt. Das Schrittprotokoll wird in der Datei response.log gespeichert. Die Protokollfelder sind unterschiedlich für HostAgent und AppAgent. Das Schrittprotokoll befindet sich auf dem info Level.

HostAgent Protokolle

Die HostAgent Protokolle enthalten die folgenden Felder

LLM-Ausgabe

Feld Beschreibung Typ
Beobachtung Die Beobachtung der aktuellen Desktop-Bildschirme. String
Gedanke Der logische Denkprozess des HostAgent. String
Aktuelle Teilaufgabe Die aktuelle Teilaufgabe, die vom AppAgent ausgeführt werden soll. String
Nachricht Die Nachricht, die an den AppAgent zur Erledigung der Teilaufgabe gesendet werden soll. String
ControlLabel Der Index der ausgewählten Anwendung zur Ausführung der Teilaufgabe. String
ControlText Der Name der ausgewählten Anwendung zur Ausführung der Teilaufgabe. String
Plan Der Plan für die folgenden Teilaufgaben nach der aktuellen Teilaufgabe. Liste von Zeichenketten
Status Der Status des Agenten, zugeordnet dem AgentState. String
Kommentar Zusätzliche Kommentare oder Informationen für den Benutzer. String
Fragen Die Fragen, die dem Benutzer zur Einholung zusätzlicher Informationen gestellt werden sollen. Liste von Zeichenketten
Bash Der Bash-Befehl, der vom HostAgent ausgeführt werden soll. Er kann verwendet werden, um Anwendungen zu öffnen oder Systembefehle auszuführen. String

Zusätzliche Informationen

Feld Beschreibung Typ
Schritt Die Schrittnummer der Sitzung. Integer
RoundStep Die Schrittnummer der aktuellen Runde. Integer
AgentStep Die Schrittnummer des HostAgent. Integer
Runde Die Rundennummer der Sitzung. Integer
ControlLabel Der Index der ausgewählten Anwendung zur Ausführung der Teilaufgabe. Integer
ControlText Der Name der ausgewählten Anwendung zur Ausführung der Teilaufgabe. String
Anfrage Die Anfrage des Benutzers. String
Agent Der Agent, der den Schritt ausgeführt hat, gesetzt auf HostAgent. String
AgentName Der Name des Agenten. String
Anwendung Der Prozessname der Anwendung. String
Kosten Die Kosten des Schritts. Float
Ergebnisse Die Ergebnisse des Schritts, auf eine leere Zeichenkette gesetzt. String
CleanScreenshot Der Bildpfad des Desktop-Screenshots. String
AnnotatedScreenshot Der Bildpfad des annotierten Anwendungs-Screenshots. String
ConcatScreenshot Der Bildpfad des verketteten Anwendungs-Screenshots. String
SelectedControlScreenshot Der Bildpfad des Screenshots des ausgewählten Steuerelements. String
time_cost Die Zeitkosten für jeden Schritt im Prozess. Dictionary

AppAgent Protokolle

Die AppAgent Protokolle enthalten die folgenden Felder

LLM-Ausgabe

Feld Beschreibung Typ
Beobachtung Die Beobachtung der aktuellen Anwendungs-Screenshots. String
Gedanke Der logische Denkprozess des AppAgent. String
ControlLabel Der Index des ausgewählten Steuerelements zur Interaktion. String
ControlText Der Name des ausgewählten Steuerelements zur Interaktion. String
Funktion Die Funktion, die auf dem ausgewählten Steuerelement ausgeführt werden soll. String
Args Die Argumente, die für die Ausführung der Funktion erforderlich sind. Liste von Zeichenketten
Status Der Status des Agenten, zugeordnet dem AgentState. String
Plan Der Plan für die folgenden Schritte nach der aktuellen Aktion. Liste von Zeichenketten
Kommentar Zusätzliche Kommentare oder Informationen für den Benutzer. String
SaveScreenshot Das Flag zum Speichern des Screenshots der Anwendung im blackboard zur zukünftigen Referenz. Boolean

Zusätzliche Informationen

Feld Beschreibung Typ
Schritt Die Schrittnummer der Sitzung. Integer
RoundStep Die Schrittnummer der aktuellen Runde. Integer
AgentStep Die Schrittnummer des AppAgent. Integer
Runde Die Rundennummer der Sitzung. Integer
Subtask Die Teilaufgabe, die vom AppAgent ausgeführt werden soll. String
SubtaskIndex Der Index der Teilaufgabe in der aktuellen Runde. Integer
Aktion Die Aktion, die vom AppAgent ausgeführt werden soll. String
ActionType Der Typ der auszuführenden Aktion. String
Anfrage Die Anfrage des Benutzers. String
Agent Der Agent, der den Schritt ausgeführt hat, gesetzt auf AppAgent. String
AgentName Der Name des Agenten. String
Anwendung Der Prozessname der Anwendung. String
Kosten Die Kosten des Schritts. Float
Ergebnisse Die Ergebnisse des Schritts. String
CleanScreenshot Der Bildpfad des Desktop-Screenshots. String
AnnotatedScreenshot Der Bildpfad des annotierten Anwendungs-Screenshots. String
ConcatScreenshot Der Bildpfad des verketteten Anwendungs-Screenshots. String
time_cost Die Zeitkosten für jeden Schritt im Prozess. Dictionary

Tipp

Sie können den folgenden Python-Code verwenden, um das Anfrageprotokoll zu lesen

import json

with open('logs/{task_name}/request.log', 'r') as f:
    for line in f:
        log = json.loads(line)

Info

Die FollowerAgent Protokolle teilen die gleichen Felder wie die AppAgent Protokolle.