KI-Glossar

ZIM HilfeWiki - das Wiki

Allgemeine Informationen
FAQ
Informationen
BetriebssystemAlle
ServiceKI
Interessant fürGäste, Angestellte und Studierende
HilfeWiki des ZIM der Uni Paderborn

no displaytitle found: KI-Glossar

KI-Glossar bezeichnet eine Sammlung zentraler Begriffe, Abkürzungen und Schlagwörter aus dem Bereich der Künstlichen Intelligenz (KI). Es dient dazu, technische Konzepte, verbreitete Buzzwords und häufig verwendete Fachausdrücke verständlich einzuordnen. Besonders im Umfeld generativer KI werden viele Begriffe unscharf oder werblich verwendet, weshalb eine klare Begriffsabgrenzung für die öffentliche Debatte, Forschung und Anwendung relevant ist.

Zweck und Einordnung[Bearbeiten | Quelltext bearbeiten]

Ein KI-Glossar soll Orientierung in einem dynamischen Fachgebiet geben, dessen Begriffe aus Informatik, Statistik, Linguistik, Kognitionswissenschaft und Ethik stammen. Viele Ausdrücke werden sowohl in wissenschaftlichen Publikationen als auch in Medien, Unternehmen und sozialen Netzwerken verwendet. Dabei können Bedeutungen je nach Kontext variieren. Typisch sind dort Schlagwörter wie Prompt Engineering, Agent, Reasoning, Kontextfenster oder Halluzination, die nicht immer einheitlich definiert sind.

Grundbegriffe der generativen KI und Sprachmodelle[Bearbeiten | Quelltext bearbeiten]

Generative KI bezeichnet KI-Systeme, die neue Inhalte wie Texte, Bilder, Programmcode, Musik, Videos oder synthetische Daten erzeugen können. Sie beruht häufig auf großen neuronalen Netzen und umfangreichen Trainingsdatensätzen. Besonders verbreitet sind große Sprachmodelle, die natürliche Sprache analysieren und erzeugen können.

Begriff Erklärung
Large Language Model (LLM) Großes Sprachmodell, das mit umfangreichen Textdaten trainiert wurde und Sprache statistisch verarbeitet. LLMs erzeugen Texte, indem sie wahrscheinliche nächste Token berechnen.
Foundation Model Großes, breit trainiertes Basismodell, das für viele Aufgaben angepasst werden kann. Der Begriff wird häufig für Sprach-, Bild- und multimodale Modelle verwendet.
Transformer Modellarchitektur, die auf einem Mechanismus namens Attention beruht. Transformer bilden die technische Grundlage vieler moderner Sprachmodelle.
Token Verarbeitungseinheit eines Sprachmodells. Ein Token kann ein Wort, ein Wortteil, ein Zeichen oder ein Satzzeichen sein.
Input-Token Verarbeitungseinheiten, die ein KI-Modell als Eingabe erhält. Dazu zählen beispielsweise der Prompt, hochgeladene Texte, Systemanweisungen oder vorherige Gesprächsverläufe. Die Anzahl der Input-Tokens beeinflusst den Rechenaufwand und kann durch das Kontextfenster begrenzt sein.
Kontextfenster Maximale Menge an Tokens, die ein Modell gleichzeitig berücksichtigen kann. Ein größeres Kontextfenster ermöglicht längere Eingaben, ersetzt jedoch nicht automatisch langfristiges Gedächtnis.
Output-Token Verarbeitungseinheiten, die ein KI-Modell als Ausgabe erzeugt. Bei Sprachmodellen entsprechen sie den Bestandteilen der generierten Antwort. Die Anzahl der Output-Tokens wirkt sich auf Länge, Kosten und Antwortzeit einer KI-Anwendung aus.
Prompt Eingabe, mit der ein generatives KI-System gesteuert wird. Ein Prompt kann eine Frage, Anweisung, Rolle, Beispielsammlung oder Formatvorgabe enthalten.
Prompt Engineering Gestaltung von Prompts, um gewünschte Ergebnisse eines KI-Systems zu erzielen. Der Begriff umfasst Techniken wie Beispiele, Rollenbeschreibungen, Schritt-für-Schritt-Anweisungen und klare Ausgabeformate.
Halluzination Bezeichnung für plausibel klingende, aber sachlich falsche oder unbelegte Ausgaben eines generativen KI-Systems. Halluzinationen entstehen, weil Sprachmodelle Wahrscheinlichkeiten berechnen und keine verlässliche Wissensprüfung garantieren.
Multimodale KI KI-Systeme, die mehrere Datentypen verarbeiten oder erzeugen können, etwa Text, Bild, Audio, Video oder Sensordaten.
KI-Agent System, das Aufgaben teilweise selbstständig plant, Werkzeuge nutzt und mehrere Schritte ausführt. Der Begriff wird häufig breit verwendet und ist nicht immer präzise von klassischer Automatisierung abgegrenzt.
Reasoning / Thinking Bezeichnung für die Fähigkeit oder den Prozess eines KI-Systems, Zwischenschritte zur Lösung einer Aufgabe zu nutzen. Der Begriff wird häufig für logisches Schlussfolgern, mehrstufige Problemlösung oder das Bearbeiten komplexer Aufgaben verwendet, ist jedoch nicht gleichbedeutend mit menschlichem Verstehen.

Daten, Repräsentationen und Suche[Bearbeiten | Quelltext bearbeiten]

Begriff Erklärung
Datensatz Strukturierte Sammlung von Daten, die zum Training, zur Validierung oder zum Testen eines Modells verwendet wird.
Trainingsdaten Daten, auf deren Grundlage ein Modell seine Parameter lernt. Qualität, Umfang und Herkunft der Trainingsdaten beeinflussen maßgeblich die Leistung und mögliche Verzerrungen eines Modells.
Embedding Mathematische Darstellung von Daten als Vektor. Embeddings ermöglichen es, semantische Ähnlichkeiten zwischen Wörtern, Sätzen, Bildern oder Dokumenten rechnerisch zu vergleichen.
Vektordatenbank Datenbanksystem zur Speicherung und Suche von Embeddings. Es wird häufig genutzt, um semantisch ähnliche Dokumente oder Textabschnitte zu finden.
Retrieval-Augmented Generation (RAG) Verfahren, bei dem ein Sprachmodell vor der Antworterzeugung relevante Informationen aus externen Quellen abruft. RAG kann Aktualität und Nachvollziehbarkeit verbessern, verhindert aber nicht grundsätzlich Fehler.
Synthetische Daten Künstlich erzeugte Daten, die reale Daten ergänzen oder ersetzen sollen. Sie können nützlich sein, bergen aber Risiken wie Verzerrungen oder mangelnde Realitätsnähe.
Ground Truth Als korrekt angenommener Referenzwert, mit dem Modellvorhersagen verglichen werden. In der Praxis kann auch die Ground Truth fehlerhaft oder umstritten sein.

Modellsteuerung und Parameter[Bearbeiten | Quelltext bearbeiten]

Begriff Erklärung
Parameter Interne Zahlenwerte eines Modells, die während des Trainings angepasst werden. Bei großen Sprachmodellen können es Milliarden oder Billionen Parameter sein.
Hyperparameter Einstellungen, die den Trainingsprozess oder die Inferenz beeinflussen, aber nicht direkt aus den Daten gelernt werden. Beispiele sind Lernrate, Batch-Größe oder Temperatur.
Temperature Steuerwert bei generativen Modellen, der die Zufälligkeit der Ausgabe beeinflusst. Niedrige Werte führen tendenziell zu deterministischeren, hohe Werte zu variableren Antworten.
Top-p Sampling-Verfahren, bei dem nur die wahrscheinlichsten Tokens berücksichtigt werden, bis eine bestimmte kumulierte Wahrscheinlichkeit erreicht ist.
System Prompt Übergeordnete Anweisung, die Verhalten, Rolle oder Einschränkungen eines Sprachmodells festlegt. Sie ist oft für Endnutzer nicht vollständig sichtbar.
Guardrails Technische und organisatorische Schutzmechanismen, die unerwünschte, gefährliche oder regelwidrige Ausgaben begrenzen sollen.

Bewertung und Betrieb[Bearbeiten | Quelltext bearbeiten]

Begriff Erklärung
Benchmark Standardisierter Test zur Bewertung von Modellleistung. Benchmarks erleichtern Vergleiche, können aber reale Anwendungssituationen nur begrenzt abbilden.
Evaluation Systematische Bewertung eines Modells anhand von Metriken, Testdaten, Nutzerstudien oder Sicherheitsprüfungen.
Latenz Zeitspanne zwischen Eingabe und Ausgabe eines Systems. Geringe Latenz ist besonders bei Echtzeitanwendungen wichtig.
MLOps Praktiken und Werkzeuge für Entwicklung, Bereitstellung, Überwachung und Wartung von KI- und Machine-Learning-Systemen.
Monitoring Laufende Überwachung eines KI-Systems im Betrieb. Ziel ist es, Leistungsabfall, Fehlverhalten, Datenverschiebungen oder Sicherheitsprobleme zu erkennen.

Risiken, Ethik und Regulierung[Bearbeiten | Quelltext bearbeiten]

Die Nutzung von KI-Systemen kann gesellschaftliche, rechtliche und technische Risiken mit sich bringen. Dazu gehören Diskriminierung, Datenschutzprobleme, Urheberrechtsfragen, mangelnde Transparenz, Sicherheitslücken und übermäßiges Vertrauen in automatisierte Entscheidungen. In der Europäischen Union regelt der Artificial Intelligence Act risikobasiert bestimmte Anwendungen von KI.

Begriff Erklärung
Bias Systematische Verzerrung in Daten, Modellen oder Ergebnissen. Bias kann bestehende gesellschaftliche Ungleichheiten verstärken.
Fairness Ziel, KI-Systeme so zu gestalten, dass sie Personen oder Gruppen nicht unangemessen benachteiligen. Fairness ist kontextabhängig und lässt sich nicht durch eine einzige Kennzahl vollständig erfassen.
Transparenz Nachvollziehbarkeit darüber, wie ein KI-System entwickelt, trainiert, eingesetzt und bewertet wurde.
Explainable AI (XAI) Forschungs- und Praxisfeld, das Methoden zur Erklärbarkeit von KI-Systemen entwickelt. XAI soll Entscheidungen oder Vorhersagen verständlicher machen.
Black Box Bezeichnung für Systeme, deren interne Entscheidungsprozesse schwer nachvollziehbar sind. Viele tiefe neuronale Netze gelten als schwer interpretierbar.
Datenschutz Schutz personenbezogener Daten bei Erhebung, Verarbeitung und Nutzung. KI-Systeme können Datenschutzrisiken verursachen, wenn Trainings- oder Eingabedaten sensible Informationen enthalten.
Model Card Dokumentation eines Modells, die Informationen zu Zweck, Daten, Leistungswerten, Einschränkungen und Risiken enthalten kann.
Red Teaming Gezieltes Testen eines Systems durch simulierte Angriffe oder problematische Eingaben. Ziel ist es, Schwachstellen vor dem Einsatz zu identifizieren.
Jailbreak Versuch, Sicherheitsmechanismen eines KI-Systems durch spezielle Eingaben zu umgehen.
Deepfake KI-generierte oder KI-manipulierte Medieninhalte, die reale Personen täuschend echt darstellen können. Deepfakes werden in Unterhaltung, aber auch für Desinformation und Betrug eingesetzt.

Häufige Buzzwords und ihre Einordnung[Bearbeiten | Quelltext bearbeiten]

Viele Begriffe der KI-Debatte werden als Buzzwords genutzt, weil sie technische Entwicklungen verkürzt oder überhöht darstellen. Eine sachliche Einordnung hilft, übertriebene Erwartungen zu vermeiden.

  • Autonom: Bedeutet nicht zwingend vollständig unabhängig. Viele sogenannte autonome KI-Systeme arbeiten innerhalb enger Vorgaben und benötigen menschliche Kontrolle.
  • Intelligent: Wird im KI-Kontext meist funktional verstanden. Ein System kann Aufgaben lösen, ohne Bewusstsein oder allgemeines Verständnis zu besitzen.
  • Generativ: Bezeichnet die Fähigkeit, neue Inhalte zu erzeugen. Die erzeugten Inhalte sind jedoch nicht automatisch korrekt, originell oder rechtlich unproblematisch.
  • Agentisch: Verweist auf Systeme, die Handlungen planen oder Werkzeuge nutzen. Der Begriff ist uneinheitlich und wird oft für einfache Automatisierungen verwendet.
  • Skalierung: Beschreibt die Vergrößerung von Modellen, Datenmengen oder Rechenleistung. Größere Systeme können leistungsfähiger sein, lösen aber nicht alle Probleme automatisch.
  • AGI: Abkürzung für Artificial General Intelligence, also künstliche allgemeine Intelligenz. Der Begriff ist wissenschaftlich und gesellschaftlich umstritten, da es keine allgemein akzeptierte Definition gibt.
  • Copilot: Bezeichnet Assistenzsysteme, die Menschen bei Aufgaben unterstützen. Der Begriff impliziert Unterstützung, nicht notwendigerweise eigenständige Verantwortung.

Siehe auch[Bearbeiten | Quelltext bearbeiten]


Bei Fragen oder Problemen können Sie uns zu unseren Servicezeiten telefonisch oder per E-Mail erreichen:


☎ Helpdesk: +49 5251 60-5544 ☎ Medien: +49 5251 60-2821 E-Mail: zim@uni-paderborn.de

Oder Sie besuchen uns vor Ort: Sie finden das Notebook-Café gemeinsam mit dem Servicecenter Medien in H1.201.

Servicezeiten

Mo. – Do. Fr.
Vor-Ort-Support 08:30 – 16:00 Uhr 08:30 – 14:00 Uhr
Telefonsupport 08:30 – 16:00 Uhr 08:30 – 14:00 Uhr
Servicecenter Medien 08:30 – 16:00 Uhr 08:30 – 14:00 Uhr
Cookies helfen uns bei der Bereitstellung des ZIM HilfeWikis. Bei der Nutzung vom ZIM HilfeWiki werden die in der Datenschutzerklärung beschriebenen Cookies gespeichert.