Schrittprotokolle
Das Schrittprotokoll enthält die Antwort des Agenten auf die Anfrage des Benutzers und zusätzliche Informationen in jedem Schritt. Das Schrittprotokoll wird in der Datei response.log gespeichert. Die Protokollfelder sind unterschiedlich für HostAgent und AppAgent. Das Schrittprotokoll befindet sich auf dem info Level.
HostAgent Protokolle
Die HostAgent Protokolle enthalten die folgenden Felder
LLM-Ausgabe
| Feld | Beschreibung | Typ |
|---|---|---|
| Beobachtung | Die Beobachtung der aktuellen Desktop-Bildschirme. | String |
| Gedanke | Der logische Denkprozess des HostAgent. |
String |
| Aktuelle Teilaufgabe | Die aktuelle Teilaufgabe, die vom AppAgent ausgeführt werden soll. |
String |
| Nachricht | Die Nachricht, die an den AppAgent zur Erledigung der Teilaufgabe gesendet werden soll. |
String |
| ControlLabel | Der Index der ausgewählten Anwendung zur Ausführung der Teilaufgabe. | String |
| ControlText | Der Name der ausgewählten Anwendung zur Ausführung der Teilaufgabe. | String |
| Plan | Der Plan für die folgenden Teilaufgaben nach der aktuellen Teilaufgabe. | Liste von Zeichenketten |
| Status | Der Status des Agenten, zugeordnet dem AgentState. |
String |
| Kommentar | Zusätzliche Kommentare oder Informationen für den Benutzer. | String |
| Fragen | Die Fragen, die dem Benutzer zur Einholung zusätzlicher Informationen gestellt werden sollen. | Liste von Zeichenketten |
| Bash | Der Bash-Befehl, der vom HostAgent ausgeführt werden soll. Er kann verwendet werden, um Anwendungen zu öffnen oder Systembefehle auszuführen. |
String |
Zusätzliche Informationen
| Feld | Beschreibung | Typ |
|---|---|---|
| Schritt | Die Schrittnummer der Sitzung. | Integer |
| RoundStep | Die Schrittnummer der aktuellen Runde. | Integer |
| AgentStep | Die Schrittnummer des HostAgent. |
Integer |
| Runde | Die Rundennummer der Sitzung. | Integer |
| ControlLabel | Der Index der ausgewählten Anwendung zur Ausführung der Teilaufgabe. | Integer |
| ControlText | Der Name der ausgewählten Anwendung zur Ausführung der Teilaufgabe. | String |
| Anfrage | Die Anfrage des Benutzers. | String |
| Agent | Der Agent, der den Schritt ausgeführt hat, gesetzt auf HostAgent. |
String |
| AgentName | Der Name des Agenten. | String |
| Anwendung | Der Prozessname der Anwendung. | String |
| Kosten | Die Kosten des Schritts. | Float |
| Ergebnisse | Die Ergebnisse des Schritts, auf eine leere Zeichenkette gesetzt. | String |
| CleanScreenshot | Der Bildpfad des Desktop-Screenshots. | String |
| AnnotatedScreenshot | Der Bildpfad des annotierten Anwendungs-Screenshots. | String |
| ConcatScreenshot | Der Bildpfad des verketteten Anwendungs-Screenshots. | String |
| SelectedControlScreenshot | Der Bildpfad des Screenshots des ausgewählten Steuerelements. | String |
| time_cost | Die Zeitkosten für jeden Schritt im Prozess. | Dictionary |
AppAgent Protokolle
Die AppAgent Protokolle enthalten die folgenden Felder
LLM-Ausgabe
| Feld | Beschreibung | Typ |
|---|---|---|
| Beobachtung | Die Beobachtung der aktuellen Anwendungs-Screenshots. | String |
| Gedanke | Der logische Denkprozess des AppAgent. |
String |
| ControlLabel | Der Index des ausgewählten Steuerelements zur Interaktion. | String |
| ControlText | Der Name des ausgewählten Steuerelements zur Interaktion. | String |
| Funktion | Die Funktion, die auf dem ausgewählten Steuerelement ausgeführt werden soll. | String |
| Args | Die Argumente, die für die Ausführung der Funktion erforderlich sind. | Liste von Zeichenketten |
| Status | Der Status des Agenten, zugeordnet dem AgentState. |
String |
| Plan | Der Plan für die folgenden Schritte nach der aktuellen Aktion. | Liste von Zeichenketten |
| Kommentar | Zusätzliche Kommentare oder Informationen für den Benutzer. | String |
| SaveScreenshot | Das Flag zum Speichern des Screenshots der Anwendung im blackboard zur zukünftigen Referenz. |
Boolean |
Zusätzliche Informationen
| Feld | Beschreibung | Typ |
|---|---|---|
| Schritt | Die Schrittnummer der Sitzung. | Integer |
| RoundStep | Die Schrittnummer der aktuellen Runde. | Integer |
| AgentStep | Die Schrittnummer des AppAgent. |
Integer |
| Runde | Die Rundennummer der Sitzung. | Integer |
| Subtask | Die Teilaufgabe, die vom AppAgent ausgeführt werden soll. |
String |
| SubtaskIndex | Der Index der Teilaufgabe in der aktuellen Runde. | Integer |
| Aktion | Die Aktion, die vom AppAgent ausgeführt werden soll. |
String |
| ActionType | Der Typ der auszuführenden Aktion. | String |
| Anfrage | Die Anfrage des Benutzers. | String |
| Agent | Der Agent, der den Schritt ausgeführt hat, gesetzt auf AppAgent. |
String |
| AgentName | Der Name des Agenten. | String |
| Anwendung | Der Prozessname der Anwendung. | String |
| Kosten | Die Kosten des Schritts. | Float |
| Ergebnisse | Die Ergebnisse des Schritts. | String |
| CleanScreenshot | Der Bildpfad des Desktop-Screenshots. | String |
| AnnotatedScreenshot | Der Bildpfad des annotierten Anwendungs-Screenshots. | String |
| ConcatScreenshot | Der Bildpfad des verketteten Anwendungs-Screenshots. | String |
| time_cost | Die Zeitkosten für jeden Schritt im Prozess. | Dictionary |
Tipp
Sie können den folgenden Python-Code verwenden, um das Anfrageprotokoll zu lesen
import json
with open('logs/{task_name}/request.log', 'r') as f:
for line in f:
log = json.loads(line)
Info
Die FollowerAgent Protokolle teilen die gleichen Felder wie die AppAgent Protokolle.