OpenAI GPT-4V#
Einleitung#
Das OpenAI GPT-4V-Tool ermöglicht Ihnen die Nutzung von OpenAIs GPT-4 mit Vision, auch als GPT-4V oder gpt-4-vision-preview in der API bezeichnet, um Bilder als Eingabe zu nehmen und Fragen dazu zu beantworten.
Voraussetzungen#
OpenAI-Ressourcen erstellen
Melden Sie sich für ein Konto auf der OpenAI-Website an. Melden Sie sich an und finden Sie Ihren persönlichen API-Schlüssel.
Zugriff auf die GPT-4 API erhalten
Um GPT-4 mit Vision zu nutzen, benötigen Sie Zugriff auf die GPT-4 API. Erfahren Sie mehr darüber, wie Sie Zugriff auf die GPT-4 API erhalten.
Verbindung#
Verbindungen zu bereitgestellten Ressourcen in Promptflow einrichten.
Typ |
Name |
API-SCHLÜSSEL |
|---|---|---|
OpenAI |
Erforderlich |
Erforderlich |
Eingaben#
Name |
Typ |
Beschreibung |
Erforderlich |
|---|---|---|---|
Verbindung |
OpenAI |
die OpenAI-Verbindung, die im Tool verwendet werden soll |
Ja |
Modell |
string |
das zu verwendende Sprachmodell, derzeit wird nur gpt-4-vision-preview unterstützt |
Ja |
prompt |
string |
Der Text-Prompt, den das Sprachmodell zur Generierung seiner Antwort verwendet. |
Ja |
max_tokens |
integer |
die maximale Anzahl von Tokens, die in der Antwort generiert werden sollen. Standard ist 512. |
Nein |
temperature |
float |
die Zufälligkeit des generierten Textes. Standard ist 1. |
Nein |
stop |
Liste |
die Stoppsequenz für den generierten Text. Standard ist null. |
Nein |
top_p |
float |
die Wahrscheinlichkeit, die oberste Wahl aus den generierten Tokens zu verwenden. Standard ist 1. |
Nein |
presence_penalty |
float |
Wert, der das Verhalten des Modells in Bezug auf die Wiederholung von Phrasen steuert. Standard ist 0. |
Nein |
frequency_penalty |
float |
Wert, der das Verhalten des Modells in Bezug auf die Generierung seltener Phrasen steuert. Standard ist 0. |
Nein |
Detail |
string |
Kontrolle darüber, wie das Modell das Bild verarbeitet und sein textliches Verständnis generiert. Der Standardwert ist "auto". Mehr lesen |
Nein |
Ausgaben#
Rückgabetyp |
Beschreibung |
|---|---|
string |
Der Text einer Antwort aus einer Konversation |