Michael Rifkin

Tokens und Chunks: Was sind sie und wozu werden sie in LLMs verwendet?

Januar 6, 2025 /

Große Sprachmodelle (LLMs) wie GPT arbeiten mit Textdaten, um Aufgaben wie das Verfassen von Texten, das Beantworten von Fragen oder die Übersetzung von Sprachen zu bewältigen. Dabei spielen die Begriffe „Tokens“ und „Chunks“ eine zentrale Rolle. In diesem Blogeintrag erklären wir, was es damit auf sich hat und warum sie für die Funktionsweise von LLMs so wichtig sind. Was sind Tokens? Ein Token ist eine kleinere Einheit eines Textes, die ein Sprachmodell verarbeitet. Tokens können aus Wörtern, Wortteilen oder sogar einzelnen Zeichen bestehen. Die genaue Definition eines Tokens hängt von der Tokenizer-Strategie ab, die das Modell verwendet. Zum Beispiel: Die Anzahl der Tokens in einem Text hängt also davon ab,…

Weiterlesen
CAG: Effizienzsteigerung für KI-gestützte Systeme

Januar 2, 2025 /

Wie funktioniert CAG (RAG using Cache) überhaupt? CAG kombiniert die Grundidee von RAG mit einem Zwischenspeicher (Cache), der häufig abgefragte oder berechnete Informationen speichert. Dadurch können wiederholte Datenbankabfragen oder Berechnungen vermieden werden. Die Haumptmerkmale eines CAG Bevor wir über die Funktionsweise eines CAG sprechen, möchte ich dir drei Begriffe in diesem Zusammenhang erklären: Wie funktioniert es nun? Vorteile von CAG Cache-Hit-Rate Wann sollte CAG (RAG using Cache) eingesetzt werden?Die Effektivität des Systems hängt davon ab, wie viele Anfragen den Cache nutzen können. CAG ist eine leistungsstarke Technik, die das Beste aus Retrieval-Augmented Generation herausholt und dabei die Effizienz durch einen Cache-Mechanismus erheblich steigert. Besonders in Anwendungen mit hohem Anfragevolumen (hoher…

Weiterlesen
Ollama: KI-Assistent auf dem eigenen Rechner

Oktober 2, 2024 /

In der heutigen digitalen Welt gewinnen große Sprachmodelle (LLMs) immer mehr an Bedeutung. Sie sind in der Lage, menschenähnliche Texte zu generieren, komplexe Fragen zu beantworten und sogar kreative Aufgaben zu übernehmen. Eine der spannendsten Entwicklungen in diesem Bereich ist sicherlich Ollama, eine Open-Source-Plattform, die es ermöglicht, diese leistungsstarken Modelle lokal auf deinem Computer auszuführen. Was ist Ollama? Ollama ist eine Plattform, die entwickelt wurde, um die Nutzung von großen Sprachmodellen zu vereinfachen. Im Gegensatz zu vielen anderen Lösungen, die eine ständige Internetverbindung erfordern, können Sie mit Ollama Modelle wie Llama 2, Mistral und viele andere direkt auf Ihrem Gerät ausführen. Dies bietet mehrere Vorteile: Wie funktioniert Ollama? Ollama nutzt…

Weiterlesen
Vektoren und Einbettungen

September 24, 2024 /

Vektoren und Einbettungen sind wie eine Art Übersetzung. Sie helfen dem Computer, die Bedeutung von Wörtern und Texten zu verstehen, indem sie sie in Zahlen umwandeln. Stell dir vor, du möchtest alle Wörter einer Sprache in einem Raum anordnen. Jedes Wort bekommt einen bestimmten Platz in diesem Raum zugewiesen. Wörter, die sich ähnlich bedeuten oder oft zusammen vorkommen (z.B. „Katze“ und „Hund“), werden nahe beieinander platziert. Wörter mit völlig unterschiedlichen Bedeutungen liegen weiter auseinander. Dieser Raum ist ein Vektorraum, und die Position jedes Wortes in diesem Raum wird durch einen Vektor beschrieben. Dieser Vektor ist eine Zahlenfolge, die die Koordinaten des Wortes im Raum angibt. Was sind nun Vektoren? Was…

Weiterlesen
Was bedeutet RAG?

September 9, 2024 /

Was bedeutet RAG? RAG steht für Retrieval Augmented Generation und beschreibt eine Technik, die die Stärken von großen Sprachmodellen (LLMs) mit der Fähigkeit zur Suche nach relevanten Informationen kombiniert. Stell dir RAG als einen super schlauen Assistenten vor! Du stellst ihm eine Frage, und anstatt nur aus dem Gedächtnis zu antworten, sucht er schnell in einer riesigen Bibliothek nach der besten Antwort. Diese Bibliothek kann alles Mögliche enthalten: Bücher, Artikel, Webseiten und sogar deine eigenen Notizen. Durch die Einbindung von spezifischen Informationen aus realen Datenquellen (z.B. Datenbanken oder Dateien) können RAG-Systeme präzisere und faktenbasierte Antworten liefern. Ein Beispiel: Du fragst: „Was ist die Hauptstadt von Frankreich?“ RAG würde: Warum ist…

Weiterlesen