OpenAI

Schritt 1

Um die OpenAI API zu nutzen, müssen Sie ein Konto auf der OpenAI-Website erstellen. Nach der Erstellung eines Kontos können Sie auf den API-Schlüssel auf der API-Schlüssel-Seite zugreifen.

Schritt 2

Nachdem Sie den API-Schlüssel erhalten haben, können Sie HOST_AGENT und APP_AGENT in der Datei config.yaml konfigurieren (umbenennen Sie die Datei config_template.yaml in config.yaml), um die OpenAI API zu nutzen. Das Folgende ist eine Beispielkonfiguration für die OpenAI API

VISUAL_MODE: True, # Whether to use visual mode to understand screenshots and take actions
API_TYPE: "openai" , # The API type, "openai" for the OpenAI API, "aoai" for the AOAI API, 'azure_ad' for the ad authority of the AOAI API.  
API_BASE: "https://api.openai.com/v1/chat/completions", # The the OpenAI API endpoint, "https://api.openai.com/v1/chat/completions" for the OpenAI API.
API_KEY: "sk-",  # The OpenAI API key, begin with sk-
API_VERSION: "2024-02-15-preview", # The version of the API, "2024-02-15-preview" by default
API_MODEL: "gpt-4-vision-preview",  # The OpenAI model name, "gpt-4-vision-preview" by default. You may also use "gpt-4o" for using the GPT-4O model.

Tipp

Wenn Sie VISUAL_MODE auf True setzen, stellen Sie sicher, dass das API_MODEL visuelle Eingaben unterstützt. Die Liste der Modelle finden Sie hier.

Schritt 3

Nachdem Sie HOST_AGENT und APP_AGENT mit der OpenAI API konfiguriert haben, können Sie UFO verwenden, um mit der OpenAI API für verschiedene Aufgaben unter Windows OS zu interagieren. Weitere Details zur Verwendung von UFO finden Sie im Schnellstart-Leitfaden.