KI-Glossar

FAQ
FAQ
Informationen
Betriebssystem	Alle
Service	KI
Interessant für	Gäste, Angestellte und Studierende
HilfeWiki des ZIM der Uni Paderborn

KI

Allgemeine Informationen

no displaytitle found: KI-Glossar

KI-Glossar bezeichnet eine Sammlung zentraler Begriffe, Abkürzungen und Schlagwörter aus dem Bereich der Künstlichen Intelligenz (KI). Es dient dazu, technische Konzepte, verbreitete Buzzwords und häufig verwendete Fachausdrücke verständlich einzuordnen. Besonders im Umfeld generativer KI werden viele Begriffe unscharf oder werblich verwendet, weshalb eine klare Begriffsabgrenzung für die öffentliche Debatte, Forschung und Anwendung relevant ist.

Zweck und Einordnung[Bearbeiten | Quelltext bearbeiten]

Ein KI-Glossar soll Orientierung in einem dynamischen Fachgebiet geben, dessen Begriffe aus Informatik, Statistik, Linguistik, Kognitionswissenschaft und Ethik stammen. Viele Ausdrücke werden sowohl in wissenschaftlichen Publikationen als auch in Medien, Unternehmen und sozialen Netzwerken verwendet. Dabei können Bedeutungen je nach Kontext variieren. Typisch sind dort Schlagwörter wie Prompt Engineering, Agent, Reasoning, Kontextfenster oder Halluzination, die nicht immer einheitlich definiert sind.

Grundbegriffe der generativen KI und Sprachmodelle[Bearbeiten | Quelltext bearbeiten]

Generative KI bezeichnet KI-Systeme, die neue Inhalte wie Texte, Bilder, Programmcode, Musik, Videos oder synthetische Daten erzeugen können. Sie beruht häufig auf großen neuronalen Netzen und umfangreichen Trainingsdatensätzen. Besonders verbreitet sind große Sprachmodelle, die natürliche Sprache analysieren und erzeugen können.

Begriff	Erklärung
Large Language Model (LLM)	Großes Sprachmodell, das mit umfangreichen Textdaten trainiert wurde und Sprache statistisch verarbeitet. LLMs erzeugen Texte, indem sie wahrscheinliche nächste Token berechnen.
Foundation Model	Großes, breit trainiertes Basismodell, das für viele Aufgaben angepasst werden kann. Der Begriff wird häufig für Sprach-, Bild- und multimodale Modelle verwendet.
Transformer	Modellarchitektur, die auf einem Mechanismus namens Attention beruht. Transformer bilden die technische Grundlage vieler moderner Sprachmodelle.
Token	Verarbeitungseinheit eines Sprachmodells. Ein Token kann ein Wort, ein Wortteil, ein Zeichen oder ein Satzzeichen sein.
Input-Token	Verarbeitungseinheiten, die ein KI-Modell als Eingabe erhält. Dazu zählen beispielsweise der Prompt, hochgeladene Texte, Systemanweisungen oder vorherige Gesprächsverläufe. Die Anzahl der Input-Tokens beeinflusst den Rechenaufwand und kann durch das Kontextfenster begrenzt sein.
Kontextfenster	Maximale Menge an Tokens, die ein Modell gleichzeitig berücksichtigen kann. Ein größeres Kontextfenster ermöglicht längere Eingaben, ersetzt jedoch nicht automatisch langfristiges Gedächtnis.
Output-Token	Verarbeitungseinheiten, die ein KI-Modell als Ausgabe erzeugt. Bei Sprachmodellen entsprechen sie den Bestandteilen der generierten Antwort. Die Anzahl der Output-Tokens wirkt sich auf Länge, Kosten und Antwortzeit einer KI-Anwendung aus.
Prompt	Eingabe, mit der ein generatives KI-System gesteuert wird. Ein Prompt kann eine Frage, Anweisung, Rolle, Beispielsammlung oder Formatvorgabe enthalten.
Prompt Engineering	Gestaltung von Prompts, um gewünschte Ergebnisse eines KI-Systems zu erzielen. Der Begriff umfasst Techniken wie Beispiele, Rollenbeschreibungen, Schritt-für-Schritt-Anweisungen und klare Ausgabeformate.
Halluzination	Bezeichnung für plausibel klingende, aber sachlich falsche oder unbelegte Ausgaben eines generativen KI-Systems. Halluzinationen entstehen, weil Sprachmodelle Wahrscheinlichkeiten berechnen und keine verlässliche Wissensprüfung garantieren.
Multimodale KI	KI-Systeme, die mehrere Datentypen verarbeiten oder erzeugen können, etwa Text, Bild, Audio, Video oder Sensordaten.
KI-Agent	System, das Aufgaben teilweise selbstständig plant, Werkzeuge nutzt und mehrere Schritte ausführt. Der Begriff wird häufig breit verwendet und ist nicht immer präzise von klassischer Automatisierung abgegrenzt.
Reasoning / Thinking	Bezeichnung für die Fähigkeit oder den Prozess eines KI-Systems, Zwischenschritte zur Lösung einer Aufgabe zu nutzen. Der Begriff wird häufig für logisches Schlussfolgern, mehrstufige Problemlösung oder das Bearbeiten komplexer Aufgaben verwendet, ist jedoch nicht gleichbedeutend mit menschlichem Verstehen.

Daten, Repräsentationen und Suche[Bearbeiten | Quelltext bearbeiten]

Begriff	Erklärung
Datensatz	Strukturierte Sammlung von Daten, die zum Training, zur Validierung oder zum Testen eines Modells verwendet wird.
Trainingsdaten	Daten, auf deren Grundlage ein Modell seine Parameter lernt. Qualität, Umfang und Herkunft der Trainingsdaten beeinflussen maßgeblich die Leistung und mögliche Verzerrungen eines Modells.
Embedding	Mathematische Darstellung von Daten als Vektor. Embeddings ermöglichen es, semantische Ähnlichkeiten zwischen Wörtern, Sätzen, Bildern oder Dokumenten rechnerisch zu vergleichen.
Vektordatenbank	Datenbanksystem zur Speicherung und Suche von Embeddings. Es wird häufig genutzt, um semantisch ähnliche Dokumente oder Textabschnitte zu finden.
Retrieval-Augmented Generation (RAG)	Verfahren, bei dem ein Sprachmodell vor der Antworterzeugung relevante Informationen aus externen Quellen abruft. RAG kann Aktualität und Nachvollziehbarkeit verbessern, verhindert aber nicht grundsätzlich Fehler.
Synthetische Daten	Künstlich erzeugte Daten, die reale Daten ergänzen oder ersetzen sollen. Sie können nützlich sein, bergen aber Risiken wie Verzerrungen oder mangelnde Realitätsnähe.
Ground Truth	Als korrekt angenommener Referenzwert, mit dem Modellvorhersagen verglichen werden. In der Praxis kann auch die Ground Truth fehlerhaft oder umstritten sein.

Modellsteuerung und Parameter[Bearbeiten | Quelltext bearbeiten]

Begriff	Erklärung
Parameter	Interne Zahlenwerte eines Modells, die während des Trainings angepasst werden. Bei großen Sprachmodellen können es Milliarden oder Billionen Parameter sein.
Hyperparameter	Einstellungen, die den Trainingsprozess oder die Inferenz beeinflussen, aber nicht direkt aus den Daten gelernt werden. Beispiele sind Lernrate, Batch-Größe oder Temperatur.
Temperature	Steuerwert bei generativen Modellen, der die Zufälligkeit der Ausgabe beeinflusst. Niedrige Werte führen tendenziell zu deterministischeren, hohe Werte zu variableren Antworten.
Top-p	Sampling-Verfahren, bei dem nur die wahrscheinlichsten Tokens berücksichtigt werden, bis eine bestimmte kumulierte Wahrscheinlichkeit erreicht ist.
System Prompt	Übergeordnete Anweisung, die Verhalten, Rolle oder Einschränkungen eines Sprachmodells festlegt. Sie ist oft für Endnutzer nicht vollständig sichtbar.
Guardrails	Technische und organisatorische Schutzmechanismen, die unerwünschte, gefährliche oder regelwidrige Ausgaben begrenzen sollen.

Bewertung und Betrieb[Bearbeiten | Quelltext bearbeiten]

Begriff	Erklärung
Benchmark	Standardisierter Test zur Bewertung von Modellleistung. Benchmarks erleichtern Vergleiche, können aber reale Anwendungssituationen nur begrenzt abbilden.
Evaluation	Systematische Bewertung eines Modells anhand von Metriken, Testdaten, Nutzerstudien oder Sicherheitsprüfungen.
Latenz	Zeitspanne zwischen Eingabe und Ausgabe eines Systems. Geringe Latenz ist besonders bei Echtzeitanwendungen wichtig.
MLOps	Praktiken und Werkzeuge für Entwicklung, Bereitstellung, Überwachung und Wartung von KI- und Machine-Learning-Systemen.
Monitoring	Laufende Überwachung eines KI-Systems im Betrieb. Ziel ist es, Leistungsabfall, Fehlverhalten, Datenverschiebungen oder Sicherheitsprobleme zu erkennen.

Risiken, Ethik und Regulierung[Bearbeiten | Quelltext bearbeiten]

Die Nutzung von KI-Systemen kann gesellschaftliche, rechtliche und technische Risiken mit sich bringen. Dazu gehören Diskriminierung, Datenschutzprobleme, Urheberrechtsfragen, mangelnde Transparenz, Sicherheitslücken und übermäßiges Vertrauen in automatisierte Entscheidungen. In der Europäischen Union regelt der Artificial Intelligence Act risikobasiert bestimmte Anwendungen von KI.

Begriff	Erklärung
Bias	Systematische Verzerrung in Daten, Modellen oder Ergebnissen. Bias kann bestehende gesellschaftliche Ungleichheiten verstärken.
Fairness	Ziel, KI-Systeme so zu gestalten, dass sie Personen oder Gruppen nicht unangemessen benachteiligen. Fairness ist kontextabhängig und lässt sich nicht durch eine einzige Kennzahl vollständig erfassen.
Transparenz	Nachvollziehbarkeit darüber, wie ein KI-System entwickelt, trainiert, eingesetzt und bewertet wurde.
Explainable AI (XAI)	Forschungs- und Praxisfeld, das Methoden zur Erklärbarkeit von KI-Systemen entwickelt. XAI soll Entscheidungen oder Vorhersagen verständlicher machen.
Black Box	Bezeichnung für Systeme, deren interne Entscheidungsprozesse schwer nachvollziehbar sind. Viele tiefe neuronale Netze gelten als schwer interpretierbar.
Datenschutz	Schutz personenbezogener Daten bei Erhebung, Verarbeitung und Nutzung. KI-Systeme können Datenschutzrisiken verursachen, wenn Trainings- oder Eingabedaten sensible Informationen enthalten.
Model Card	Dokumentation eines Modells, die Informationen zu Zweck, Daten, Leistungswerten, Einschränkungen und Risiken enthalten kann.
Red Teaming	Gezieltes Testen eines Systems durch simulierte Angriffe oder problematische Eingaben. Ziel ist es, Schwachstellen vor dem Einsatz zu identifizieren.
Jailbreak	Versuch, Sicherheitsmechanismen eines KI-Systems durch spezielle Eingaben zu umgehen.
Deepfake	KI-generierte oder KI-manipulierte Medieninhalte, die reale Personen täuschend echt darstellen können. Deepfakes werden in Unterhaltung, aber auch für Desinformation und Betrug eingesetzt.

Häufige Buzzwords und ihre Einordnung[Bearbeiten | Quelltext bearbeiten]

Viele Begriffe der KI-Debatte werden als Buzzwords genutzt, weil sie technische Entwicklungen verkürzt oder überhöht darstellen. Eine sachliche Einordnung hilft, übertriebene Erwartungen zu vermeiden.

Autonom: Bedeutet nicht zwingend vollständig unabhängig. Viele sogenannte autonome KI-Systeme arbeiten innerhalb enger Vorgaben und benötigen menschliche Kontrolle.
Intelligent: Wird im KI-Kontext meist funktional verstanden. Ein System kann Aufgaben lösen, ohne Bewusstsein oder allgemeines Verständnis zu besitzen.
Generativ: Bezeichnet die Fähigkeit, neue Inhalte zu erzeugen. Die erzeugten Inhalte sind jedoch nicht automatisch korrekt, originell oder rechtlich unproblematisch.
Agentisch: Verweist auf Systeme, die Handlungen planen oder Werkzeuge nutzen. Der Begriff ist uneinheitlich und wird oft für einfache Automatisierungen verwendet.
Skalierung: Beschreibt die Vergrößerung von Modellen, Datenmengen oder Rechenleistung. Größere Systeme können leistungsfähiger sein, lösen aber nicht alle Probleme automatisch.
AGI: Abkürzung für Artificial General Intelligence, also künstliche allgemeine Intelligenz. Der Begriff ist wissenschaftlich und gesellschaftlich umstritten, da es keine allgemein akzeptierte Definition gibt.
Copilot: Bezeichnet Assistenzsysteme, die Menschen bei Aufgaben unterstützen. Der Begriff impliziert Unterstützung, nicht notwendigerweise eigenständige Verantwortung.

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Bei Fragen oder Problemen können Sie uns zu unseren Servicezeiten telefonisch oder per E-Mail erreichen:

☎ Helpdesk: +49 5251 60-5544 • ☎ Medien: +49 5251 60-2821 • E-Mail: zim@uni-paderborn.de

Oder Sie besuchen uns vor Ort: Sie finden das Notebook-Café gemeinsam mit dem Servicecenter Medien in H1.201.

Servicezeiten

	Mo. – Do.	Fr.
Vor-Ort-Support	08:30 – 16:00 Uhr	08:30 – 14:00 Uhr
Telefonsupport	08:30 – 16:00 Uhr	08:30 – 14:00 Uhr
Servicecenter Medien	08:30 – 16:00 Uhr	08:30 – 14:00 Uhr