OpenAI GPT-4V#

Einleitung#

Das OpenAI GPT-4V-Tool ermöglicht Ihnen die Nutzung von OpenAIs GPT-4 mit Vision, auch als GPT-4V oder gpt-4-vision-preview in der API bezeichnet, um Bilder als Eingabe zu nehmen und Fragen dazu zu beantworten.

Voraussetzungen#

OpenAI-Ressourcen erstellen

Melden Sie sich für ein Konto auf der OpenAI-Website an. Melden Sie sich an und finden Sie Ihren persönlichen API-Schlüssel.
Zugriff auf die GPT-4 API erhalten

Um GPT-4 mit Vision zu nutzen, benötigen Sie Zugriff auf die GPT-4 API. Erfahren Sie mehr darüber, wie Sie Zugriff auf die GPT-4 API erhalten.

Verbindung#

Verbindungen zu bereitgestellten Ressourcen in Promptflow einrichten.

Typ	Name	API-SCHLÜSSEL
OpenAI	Erforderlich	Erforderlich

Eingaben#

Name	Typ	Beschreibung	Erforderlich
Verbindung	OpenAI	die OpenAI-Verbindung, die im Tool verwendet werden soll	Ja
Modell	string	das zu verwendende Sprachmodell, derzeit wird nur gpt-4-vision-preview unterstützt	Ja
prompt	string	Der Text-Prompt, den das Sprachmodell zur Generierung seiner Antwort verwendet.	Ja
max_tokens	integer	die maximale Anzahl von Tokens, die in der Antwort generiert werden sollen. Standard ist 512.	Nein
temperature	float	die Zufälligkeit des generierten Textes. Standard ist 1.	Nein
stop	Liste	die Stoppsequenz für den generierten Text. Standard ist null.	Nein
top_p	float	die Wahrscheinlichkeit, die oberste Wahl aus den generierten Tokens zu verwenden. Standard ist 1.	Nein
presence_penalty	float	Wert, der das Verhalten des Modells in Bezug auf die Wiederholung von Phrasen steuert. Standard ist 0.	Nein
frequency_penalty	float	Wert, der das Verhalten des Modells in Bezug auf die Generierung seltener Phrasen steuert. Standard ist 0.	Nein
Detail	string	Kontrolle darüber, wie das Modell das Bild verarbeitet und sein textliches Verständnis generiert. Der Standardwert ist "auto". Mehr lesen	Nein

Ausgaben#

Rückgabetyp	Beschreibung
string	Der Text einer Antwort aus einer Konversation