Allgemeine Informationen
| FAQ | |
|---|---|
| Informationen | |
| Betriebssystem | Alle |
| Service | KI |
| Interessant für | Gäste, Angestellte und Studierende |
| HilfeWiki des ZIM der Uni Paderborn | |
KI-Glossar bezeichnet eine Sammlung zentraler Begriffe, Abkürzungen und Schlagwörter aus dem Bereich der Künstlichen Intelligenz (KI). Es dient dazu, technische Konzepte, verbreitete Buzzwords und häufig verwendete Fachausdrücke verständlich einzuordnen. Besonders im Umfeld generativer KI werden viele Begriffe unscharf oder werblich verwendet, weshalb eine klare Begriffsabgrenzung für die öffentliche Debatte, Forschung und Anwendung relevant ist.
Zweck und Einordnung[Bearbeiten | Quelltext bearbeiten]
Ein KI-Glossar soll Orientierung in einem dynamischen Fachgebiet geben, dessen Begriffe aus Informatik, Statistik, Linguistik, Kognitionswissenschaft und Ethik stammen. Viele Ausdrücke werden sowohl in wissenschaftlichen Publikationen als auch in Medien, Unternehmen und sozialen Netzwerken verwendet. Dabei können Bedeutungen je nach Kontext variieren. Typisch sind dort Schlagwörter wie Prompt Engineering, Agent, Reasoning, Kontextfenster oder Halluzination, die nicht immer einheitlich definiert sind.
Grundbegriffe der generativen KI und Sprachmodelle[Bearbeiten | Quelltext bearbeiten]
Generative KI bezeichnet KI-Systeme, die neue Inhalte wie Texte, Bilder, Programmcode, Musik, Videos oder synthetische Daten erzeugen können. Sie beruht häufig auf großen neuronalen Netzen und umfangreichen Trainingsdatensätzen. Besonders verbreitet sind große Sprachmodelle, die natürliche Sprache analysieren und erzeugen können.
| Begriff | Erklärung |
|---|---|
| Large Language Model (LLM) | Großes Sprachmodell, das mit umfangreichen Textdaten trainiert wurde und Sprache statistisch verarbeitet. LLMs erzeugen Texte, indem sie wahrscheinliche nächste Token berechnen. |
| Foundation Model | Großes, breit trainiertes Basismodell, das für viele Aufgaben angepasst werden kann. Der Begriff wird häufig für Sprach-, Bild- und multimodale Modelle verwendet. |
| Transformer | Modellarchitektur, die auf einem Mechanismus namens Attention beruht. Transformer bilden die technische Grundlage vieler moderner Sprachmodelle. |
| Token | Verarbeitungseinheit eines Sprachmodells. Ein Token kann ein Wort, ein Wortteil, ein Zeichen oder ein Satzzeichen sein. |
| Input-Token | Verarbeitungseinheiten, die ein KI-Modell als Eingabe erhält. Dazu zählen beispielsweise der Prompt, hochgeladene Texte, Systemanweisungen oder vorherige Gesprächsverläufe. Die Anzahl der Input-Tokens beeinflusst den Rechenaufwand und kann durch das Kontextfenster begrenzt sein. |
| Kontextfenster | Maximale Menge an Tokens, die ein Modell gleichzeitig berücksichtigen kann. Ein größeres Kontextfenster ermöglicht längere Eingaben, ersetzt jedoch nicht automatisch langfristiges Gedächtnis. |
| Output-Token | Verarbeitungseinheiten, die ein KI-Modell als Ausgabe erzeugt. Bei Sprachmodellen entsprechen sie den Bestandteilen der generierten Antwort. Die Anzahl der Output-Tokens wirkt sich auf Länge, Kosten und Antwortzeit einer KI-Anwendung aus. |
| Prompt | Eingabe, mit der ein generatives KI-System gesteuert wird. Ein Prompt kann eine Frage, Anweisung, Rolle, Beispielsammlung oder Formatvorgabe enthalten. |
| Prompt Engineering | Gestaltung von Prompts, um gewünschte Ergebnisse eines KI-Systems zu erzielen. Der Begriff umfasst Techniken wie Beispiele, Rollenbeschreibungen, Schritt-für-Schritt-Anweisungen und klare Ausgabeformate. |
| Halluzination | Bezeichnung für plausibel klingende, aber sachlich falsche oder unbelegte Ausgaben eines generativen KI-Systems. Halluzinationen entstehen, weil Sprachmodelle Wahrscheinlichkeiten berechnen und keine verlässliche Wissensprüfung garantieren. |
| Multimodale KI | KI-Systeme, die mehrere Datentypen verarbeiten oder erzeugen können, etwa Text, Bild, Audio, Video oder Sensordaten. |
| KI-Agent | System, das Aufgaben teilweise selbstständig plant, Werkzeuge nutzt und mehrere Schritte ausführt. Der Begriff wird häufig breit verwendet und ist nicht immer präzise von klassischer Automatisierung abgegrenzt. |
| Reasoning / Thinking | Bezeichnung für die Fähigkeit oder den Prozess eines KI-Systems, Zwischenschritte zur Lösung einer Aufgabe zu nutzen. Der Begriff wird häufig für logisches Schlussfolgern, mehrstufige Problemlösung oder das Bearbeiten komplexer Aufgaben verwendet, ist jedoch nicht gleichbedeutend mit menschlichem Verstehen. |
Daten, Repräsentationen und Suche[Bearbeiten | Quelltext bearbeiten]
| Begriff | Erklärung |
|---|---|
| Datensatz | Strukturierte Sammlung von Daten, die zum Training, zur Validierung oder zum Testen eines Modells verwendet wird. |
| Trainingsdaten | Daten, auf deren Grundlage ein Modell seine Parameter lernt. Qualität, Umfang und Herkunft der Trainingsdaten beeinflussen maßgeblich die Leistung und mögliche Verzerrungen eines Modells. |
| Embedding | Mathematische Darstellung von Daten als Vektor. Embeddings ermöglichen es, semantische Ähnlichkeiten zwischen Wörtern, Sätzen, Bildern oder Dokumenten rechnerisch zu vergleichen. |
| Vektordatenbank | Datenbanksystem zur Speicherung und Suche von Embeddings. Es wird häufig genutzt, um semantisch ähnliche Dokumente oder Textabschnitte zu finden. |
| Retrieval-Augmented Generation (RAG) | Verfahren, bei dem ein Sprachmodell vor der Antworterzeugung relevante Informationen aus externen Quellen abruft. RAG kann Aktualität und Nachvollziehbarkeit verbessern, verhindert aber nicht grundsätzlich Fehler. |
| Synthetische Daten | Künstlich erzeugte Daten, die reale Daten ergänzen oder ersetzen sollen. Sie können nützlich sein, bergen aber Risiken wie Verzerrungen oder mangelnde Realitätsnähe. |
| Ground Truth | Als korrekt angenommener Referenzwert, mit dem Modellvorhersagen verglichen werden. In der Praxis kann auch die Ground Truth fehlerhaft oder umstritten sein. |
Modellsteuerung und Parameter[Bearbeiten | Quelltext bearbeiten]
| Begriff | Erklärung |
|---|---|
| Parameter | Interne Zahlenwerte eines Modells, die während des Trainings angepasst werden. Bei großen Sprachmodellen können es Milliarden oder Billionen Parameter sein. |
| Hyperparameter | Einstellungen, die den Trainingsprozess oder die Inferenz beeinflussen, aber nicht direkt aus den Daten gelernt werden. Beispiele sind Lernrate, Batch-Größe oder Temperatur. |
| Temperature | Steuerwert bei generativen Modellen, der die Zufälligkeit der Ausgabe beeinflusst. Niedrige Werte führen tendenziell zu deterministischeren, hohe Werte zu variableren Antworten. |
| Top-p | Sampling-Verfahren, bei dem nur die wahrscheinlichsten Tokens berücksichtigt werden, bis eine bestimmte kumulierte Wahrscheinlichkeit erreicht ist. |
| System Prompt | Übergeordnete Anweisung, die Verhalten, Rolle oder Einschränkungen eines Sprachmodells festlegt. Sie ist oft für Endnutzer nicht vollständig sichtbar. |
| Guardrails | Technische und organisatorische Schutzmechanismen, die unerwünschte, gefährliche oder regelwidrige Ausgaben begrenzen sollen. |
Bewertung und Betrieb[Bearbeiten | Quelltext bearbeiten]
| Begriff | Erklärung |
|---|---|
| Benchmark | Standardisierter Test zur Bewertung von Modellleistung. Benchmarks erleichtern Vergleiche, können aber reale Anwendungssituationen nur begrenzt abbilden. |
| Evaluation | Systematische Bewertung eines Modells anhand von Metriken, Testdaten, Nutzerstudien oder Sicherheitsprüfungen. |
| Latenz | Zeitspanne zwischen Eingabe und Ausgabe eines Systems. Geringe Latenz ist besonders bei Echtzeitanwendungen wichtig. |
| MLOps | Praktiken und Werkzeuge für Entwicklung, Bereitstellung, Überwachung und Wartung von KI- und Machine-Learning-Systemen. |
| Monitoring | Laufende Überwachung eines KI-Systems im Betrieb. Ziel ist es, Leistungsabfall, Fehlverhalten, Datenverschiebungen oder Sicherheitsprobleme zu erkennen. |
Risiken, Ethik und Regulierung[Bearbeiten | Quelltext bearbeiten]
Die Nutzung von KI-Systemen kann gesellschaftliche, rechtliche und technische Risiken mit sich bringen. Dazu gehören Diskriminierung, Datenschutzprobleme, Urheberrechtsfragen, mangelnde Transparenz, Sicherheitslücken und übermäßiges Vertrauen in automatisierte Entscheidungen. In der Europäischen Union regelt der Artificial Intelligence Act risikobasiert bestimmte Anwendungen von KI.
| Begriff | Erklärung |
|---|---|
| Bias | Systematische Verzerrung in Daten, Modellen oder Ergebnissen. Bias kann bestehende gesellschaftliche Ungleichheiten verstärken. |
| Fairness | Ziel, KI-Systeme so zu gestalten, dass sie Personen oder Gruppen nicht unangemessen benachteiligen. Fairness ist kontextabhängig und lässt sich nicht durch eine einzige Kennzahl vollständig erfassen. |
| Transparenz | Nachvollziehbarkeit darüber, wie ein KI-System entwickelt, trainiert, eingesetzt und bewertet wurde. |
| Explainable AI (XAI) | Forschungs- und Praxisfeld, das Methoden zur Erklärbarkeit von KI-Systemen entwickelt. XAI soll Entscheidungen oder Vorhersagen verständlicher machen. |
| Black Box | Bezeichnung für Systeme, deren interne Entscheidungsprozesse schwer nachvollziehbar sind. Viele tiefe neuronale Netze gelten als schwer interpretierbar. |
| Datenschutz | Schutz personenbezogener Daten bei Erhebung, Verarbeitung und Nutzung. KI-Systeme können Datenschutzrisiken verursachen, wenn Trainings- oder Eingabedaten sensible Informationen enthalten. |
| Model Card | Dokumentation eines Modells, die Informationen zu Zweck, Daten, Leistungswerten, Einschränkungen und Risiken enthalten kann. |
| Red Teaming | Gezieltes Testen eines Systems durch simulierte Angriffe oder problematische Eingaben. Ziel ist es, Schwachstellen vor dem Einsatz zu identifizieren. |
| Jailbreak | Versuch, Sicherheitsmechanismen eines KI-Systems durch spezielle Eingaben zu umgehen. |
| Deepfake | KI-generierte oder KI-manipulierte Medieninhalte, die reale Personen täuschend echt darstellen können. Deepfakes werden in Unterhaltung, aber auch für Desinformation und Betrug eingesetzt. |
Häufige Buzzwords und ihre Einordnung[Bearbeiten | Quelltext bearbeiten]
Viele Begriffe der KI-Debatte werden als Buzzwords genutzt, weil sie technische Entwicklungen verkürzt oder überhöht darstellen. Eine sachliche Einordnung hilft, übertriebene Erwartungen zu vermeiden.
- Autonom: Bedeutet nicht zwingend vollständig unabhängig. Viele sogenannte autonome KI-Systeme arbeiten innerhalb enger Vorgaben und benötigen menschliche Kontrolle.
- Intelligent: Wird im KI-Kontext meist funktional verstanden. Ein System kann Aufgaben lösen, ohne Bewusstsein oder allgemeines Verständnis zu besitzen.
- Generativ: Bezeichnet die Fähigkeit, neue Inhalte zu erzeugen. Die erzeugten Inhalte sind jedoch nicht automatisch korrekt, originell oder rechtlich unproblematisch.
- Agentisch: Verweist auf Systeme, die Handlungen planen oder Werkzeuge nutzen. Der Begriff ist uneinheitlich und wird oft für einfache Automatisierungen verwendet.
- Skalierung: Beschreibt die Vergrößerung von Modellen, Datenmengen oder Rechenleistung. Größere Systeme können leistungsfähiger sein, lösen aber nicht alle Probleme automatisch.
- AGI: Abkürzung für Artificial General Intelligence, also künstliche allgemeine Intelligenz. Der Begriff ist wissenschaftlich und gesellschaftlich umstritten, da es keine allgemein akzeptierte Definition gibt.
- Copilot: Bezeichnet Assistenzsysteme, die Menschen bei Aufgaben unterstützen. Der Begriff impliziert Unterstützung, nicht notwendigerweise eigenständige Verantwortung.