promptflow.rag Modul#

promptflow.rag.build_index(*, name: str, vector_store: str = 'azure_ai_search', input_source: Union[AzureAISearchSource, LocalSource], index_config: Optional[AzureAISearchConfig] = None, embeddings_model_config: EmbeddingsModelConfig, data_source_url: Optional[str] = None, tokens_per_chunk: int = 1024, token_overlap_across_chunks: int = 0, input_glob: str = '**/*', max_sample_files: Optional[int] = None, chunk_prepend_summary: Optional[bool] = None, document_path_replacement_regex: Optional[Dict[str, str]] = None, embeddings_cache_path: Optional[str] = None) → str#

Generiert lokal Embeddings und speichert Index-Referenz im Speicher

Parameter:

name (str) – Der Name des Ausgabe-Index.
vector_store (str) – Der zu indexierende Vektorspeicher.
input_source (Union[AzureAISearchSource, LocalSource]) – Die Konfiguration für die Eingabedatenquelle.
index_config (AzureAISearchConfig) – Die Konfiguration für die Ausgabe von Azure Cognitive Search.
embeddings_model_config (EmbeddingsModelConfig) – Die Konfiguration für das Embedding-Modell.
data_source_url (Optional[str]) – Die URL der Datenquelle.
tokens_per_chunk (int) – Die Größe jedes Chunks.
token_overlap_across_chunks (int) – Die Überlappung zwischen Chunks.
input_glob (str) – Das Eingabe-Glob-Muster.
max_sample_files (Optional[int]) – Die maximale Anzahl von Beispieldateien.
chunk_prepend_summary (Optional[bool]) – Ob eine Zusammenfassung jedem Chunk vorangestellt werden soll.
document_path_replacement_regex (Optional[Dict[str, str]]) – Das Regex für den Ersatz des Dokumentenpfads.
embeddings_cache_path (Optional[str]) – Der Pfad zum Embeddings-Cache.

Gibt zurück:

Lokaler Pfad zum erstellten Index.

Rückgabetyp:

str

promptflow.rag.get_langchain_retriever_from_index(path: str)#

promptflow.rag Modul#

Unterpakete#