Google Gemini
Schritt 1
Um die Google Gemini API zu nutzen, müssen Sie ein Konto auf der Google Gemini Website erstellen und den API-Schlüssel abrufen.
Schritt 2
Möglicherweise müssen Sie zusätzliche Abhängigkeiten installieren, um die Google Gemini API zu nutzen. Sie können die Abhängigkeiten mit dem folgenden Befehl installieren
pip install -U google-genai==1.12.1
Schritt 3
Konfigurieren Sie HOST_AGENT und APP_AGENT in der Datei config.yaml (benennen Sie die Datei config_template.yaml in config.yaml um), um die Google Gemini API zu nutzen. Die folgende Konfiguration ist ein Beispiel für die Google Gemini API
VISUAL_MODE: True, # Whether to use visual mode to understand screenshots and take actions
API_TYPE: "Gemini" ,
API_KEY: "YOUR_KEY",
API_MODEL: "YOUR_MODEL"
Tipp
Wenn Sie VISUAL_MODE auf True setzen, stellen Sie sicher, dass API_MODEL visuelle Eingaben unterstützt.
Tipp
API_MODEL ist der Modellname der Gemini LLM API. Den Modellnamen finden Sie in der Liste der Gemini LLM Modelle. Wenn Sie auf den Fehler 429 Resource has been exhausted (z. B. Kontingent prüfen) stoßen, liegt dies möglicherweise an der Ratenbegrenzung Ihrer Gemini API.
Schritt 4
Nachdem Sie HOST_AGENT und APP_AGENT mit der Gemini API konfiguriert haben, können Sie UFO verwenden, um mit der Gemini API für verschiedene Aufgaben unter Windows OS zu interagieren. Weitere Details zur Erstanwendung mit UFO finden Sie im Schnellstart-Handbuch.