Künstliche Intelligenz

Breiter Einsatz, sinkende Einstiegshürden. KI ist vom Experiment zur Produktivtechnik geworden – quer durch Branchen und Unternehmensgrößen. Long-context-Modelle und bessere Toolchains erlauben komplexe Workflows (Recherche, Codierung, Prozessautomatisierung). Stanford HAI zeigt: Inference-Kosten sind massiv gefallen und Open-Weight-Modelle holen auf. hai.stanford.edu
Modelllandschaft:
- Proprietär: Claude-3.5-Familie (stark bei Coding/Reasoning), Google Gemini 1.5 (Multimodalität, sehr große Kontexte). Google Cloud+4Anthropic+4Anthropic+4
- Open-Weight: Llama 3.1/4 vergrößert die Auswahl für selbstgehostete Lösungen (Compliance/Datenschutz). AI Meta+1
Regulatorik: Die EU-AI-Act-Pflichten greifen schrittweise: Verbote & AI-Literacy seit Feb 2025, GPAI-Pflichtenseit Aug 2025, Vollanwendung i. W. ab 2. Aug. 2026 (High-Risk teils bis 2027). Unternehmen sollten bereits jetzt Governance und Dokumentation aufsetzen. Digitale Strategie Europas+1

Zuverlässigkeit & Halluzinationen
RAG (Retrieval-Augmented Generation) mit gut kuratierten Quellen bleibt der Standard, dazu strikte Prompt-Patterns und automatische Fact-Checks (Evals).
Datenschutz & Souveränität
Wahl zwischen Cloud-Modellen und Open-Weight/Self-Hosting; Datenklassifizierung, Logging-Kontrolle, Löschkonzepte.
Governance & Nachweisführung
Model-Cards, Datenherkunft, Risikoanalysen, „Human-in-the-Loop“ – künftig erforderlich, um AI-Act-Audits zu bestehen. Digitale Strategie Europas
Betrieb & Kosten
Trotz Kostendrop braucht es Observability (Latenz, Fehlerraten, Token-Kosten) und einen vendor-neutralenArchitekturansatz; Microservices-Ansätze helfen beim Skalieren. hai.stanford.edu
Kompetenzen im Team
Rollen verschieben sich: weniger Tipparbeit, mehr Architektur, Datenqualität, Prompt-/Eval-Design – aber Programmier- und Produktkompetenz bleiben zentral. Business Insider

Claude 3.5 (Anthropic): starkes Reasoning/Coding, gute „Computer-Use“-Pfadfinderfunktionen. Anthropic
Gemini 1.5 Pro (Google): Multimodal + sehr großer Kontext (bis ~2 Mio Tokens in Vertex AI). Ideal für Dossiers, Compliance-Analysen, Meetings. Google Cloud

Llama 3.1 / Llama 4 (Meta): gute Basis für On-Prem-Szenarien; breite Größen & Community-Ökosystem. AI Meta+1
NVIDIA NIM Microservices: vorgefertigte Inference-Services (Triton/TensorRT) für schnellen, portablen Rollout auf GPU-Infra (on-prem, cloud). NVIDIA+2NVIDIA Developer+2

LangChain / LlamaIndex: Tool-und Agent-Flows, Retrieval-Pipelines, Evals.
Vektordatenbanken: Pinecone, Weaviate, FAISS – je nach Latenz/Hostinganforderung.
(Allgemein anerkannter Stack; Auswahl nach Datenschutz/Latency.)

OpenAI Evals/Ragas/DeepEval: Antwortqualität, Halluzinationsrate, Grounding.
Moderation/Policies: Azure/OpenAI/Anthropic Safety Tools + eigene Regelwerke (PII-Filter, DLP).

Weights & Biases, Arize Phoenix, Langfuse: Monitoring (Latenz, Token, Kosten), Prompt-Versionierung, AB-Tests.

Ziel klären: 1–2 konkrete Workflows (z. B. Policy-Q&A, Angebotsentwürfe).
Daten vorbereiten: Quellen sichten, deduplizieren, Rechte prüfen, Metadaten vergeben.
RAG-MVP bauen: LangChain/LlamaIndex + VDB; Modell per API (Claude/Gemini) oder NIM-Deployment.
Evals & Guardrails: Halluzinations-Checks, Zitationspflicht, PII-Filter.
Governance light: Prompt-Standards, Logging, Verantwortlichkeiten – AI-Act-kompatibel skaliert ausbaubar. Digitale Strategie Europas

Agentische Workflows (Tools bedienen, Buchungen, Formularprozesse) wandern in Browser/Office – Startpunkte sind Chrome+Gemini & Desktop-Apps. Teams brauchen Safety-Netze & Freigabeprozesse. TechRadar+1
Politik & Compliance ziehen an – frühe Governance ist heute ein Wettbewerbsvorteil.