OpenAI GPT-4V#

Einleitung#

Das OpenAI GPT-4V-Tool ermöglicht Ihnen die Nutzung von OpenAIs GPT-4 mit Vision, auch als GPT-4V oder gpt-4-vision-preview in der API bezeichnet, um Bilder als Eingabe zu nehmen und Fragen dazu zu beantworten.

Voraussetzungen#

Verbindung#

Verbindungen zu bereitgestellten Ressourcen in Promptflow einrichten.

Typ

Name

API-SCHLÜSSEL

OpenAI

Erforderlich

Erforderlich

Eingaben#

Name

Typ

Beschreibung

Erforderlich

Verbindung

OpenAI

die OpenAI-Verbindung, die im Tool verwendet werden soll

Ja

Modell

string

das zu verwendende Sprachmodell, derzeit wird nur gpt-4-vision-preview unterstützt

Ja

prompt

string

Der Text-Prompt, den das Sprachmodell zur Generierung seiner Antwort verwendet.

Ja

max_tokens

integer

die maximale Anzahl von Tokens, die in der Antwort generiert werden sollen. Standard ist 512.

Nein

temperature

float

die Zufälligkeit des generierten Textes. Standard ist 1.

Nein

stop

Liste

die Stoppsequenz für den generierten Text. Standard ist null.

Nein

top_p

float

die Wahrscheinlichkeit, die oberste Wahl aus den generierten Tokens zu verwenden. Standard ist 1.

Nein

presence_penalty

float

Wert, der das Verhalten des Modells in Bezug auf die Wiederholung von Phrasen steuert. Standard ist 0.

Nein

frequency_penalty

float

Wert, der das Verhalten des Modells in Bezug auf die Generierung seltener Phrasen steuert. Standard ist 0.

Nein

Detail

string

Kontrolle darüber, wie das Modell das Bild verarbeitet und sein textliches Verständnis generiert. Der Standardwert ist "auto". Mehr lesen

Nein

Ausgaben#

Rückgabetyp

Beschreibung

string

Der Text einer Antwort aus einer Konversation