KI Espresso

KI Espresso ist dein täglicher KI-Podcast für Künstliche Intelligenz, AI News und Tech News aus Deutschland und der Welt. In 5 bis 7 Minuten bekommst du die wichtigsten KI-News, klar eingeordnet und auf den Punkt. Für alle, die verstehen wollen, wie KI Arbeit, Wirtschaft und Alltag verändert. Neue Folgen von Montag bis Freitag.

All Episodes

KI Espresso

600-fach billiger — CEOs fürchten KI-Lock-in

May 29, 2026 • Episode 72

0:00 | 6:41

#Openai #Anthropic #Google #EuAiAct #Llm KI ist 600-fach billiger geworden. Aber der gefährliche Teil ist nicht mehr der Tokenpreis, sondern der Lock-in in Workflows, Daten, Freigaben und Tool-Calling. In dieser Folge geht es darum, warum CEOs und CIOs gerade KI-Schnäppchen jagen, warum billige Modelle trotzdem teuer werden können und wie Teams ihre Arbeit portabel halten. ⏰ Timestamps: 0:00 — 600-fach billiger: Warum Lock-in jetzt gefährlicher wird 0:23 — arXiv, OpenRouter, Epoch AI und Axios: die Datenlage 0:54 — Warum KI für CIOs zum Einkaufsthema wird 1:21 — Der Unterschied zwischen Tokenpreis und Workflow-Kosten 1:52 — Anthropic als Kontrast: 965 Milliarden Dollar Bewertung 2:27 — Warum KI kein standardisiertes Benzin ist 2:54 — Tool Calling, Datenzugriff und Freigaben als Lock-in 3:20 — Der Preis pro Token ist nicht der Preis deiner Abhängigkeit 3:50 — DACH, EU AI Act und die falsche Sicherheit 4:28 — Warum der Prozess nicht beim Anbieter liegen darf 5:04 — Drei Regeln für portable KI-Workflows 6:00 — Die 600-fache Ersparnis neu bewerten 💡 3 Empfehlungen: 1. Dokumentiere wichtige KI-Workflows außerhalb des Chat-Tools: Ziel, Input, Aktion, Check, Output. 2. Teste denselben Workflow mit zwei Modellen: einem starken und einer günstigeren Alternative. 3. Lege Prompts, Checks und Entscheidungskriterien in einem eigenen Repo ab, nicht nur in der Plattform des Anbieters. 📖 Quellen: • arXiv — Tiered Super-Moore's Law: https://arxiv.org/abs/2603.28576 • Axios — CEOs go bargain hunting for AI: https://www.axios.com/2026/05/29/ceos-ai-cheaper-tokens • Anthropic — Series H funding: https://www.anthropic.com/news/series-h 🔗 Verwandte Episoden: • 80 % der Chefs machen KI zum Job-Risiko: https://youtu.be/KMUz-Z5UF6I • Nur 24% bereit: Der AI Act trifft Europas Firmen unvorbereitet: https://youtu.be/tOiSUeFuev0 • 2,5 Milliarden — scheitern sie an einer: https://youtu.be/Yub4XwCDVYY 🎙️ KI Espresso — Jeden Tag eine neue KI-Debatte in sechs Minuten. 🎧 Podcast hören: • Apple Podcasts: https://podcasts.apple.com/podcast/id1885621764 • Alle Plattformen: https://www.buzzsprout.com/2603567 𝕏 @KIEspresso

SPEAKER_01 0:00

KI ist 600-fach billiger geworden. Und genau deshalb wird der Login gefährlicher.

SPEAKER_00 0:05

Ähm, Moment, lass mich da ganz kurz.

SPEAKER_01 0:07

Nee, warte, ich muss für euch alle erstmal die Datenlage einordnen, die wir heute hier zerlegen. Also wir haben hier ein neues Archive-Paper, das die Inferenzdaten, also quasi die reinen Ausführungskosten von KI, von Open Router und Epoch AI aus den Jahren 2020 bis 2026 analysiert. Und parallel dazu liegt uns so ein aktueller Bericht von Exios vor.

SPEAKER_00 0:28

Der zeigt ja, dass alle gerade durchdrehen.

SPEAKER_01 0:30

Genau. CEOs und CIOs gehen jetzt massiv auf KI-Schnäppchenjagd. Und unsere Mission für euch heute ist herauszufinden, wie man diesen Preissturz nutzen kann, ohne die eigene IT-Architektur völlig an die Wand zu fahren. Aber für mich ist die Datenlage eigentlich eindeutig. Mit einem 600-fachen Preisverfall ist KI ab heute ein reines Einkaufsthema.

SPEAKER_00 0:51

Puh, also der.

SPEAKER_01 0:52

Lass mich den Gedanken kurz beenden. Der finanzielle Anreiz für Routineaufgaben, einfach immer das billigste Open-Source-Modell zu nehmen, der ist doch riesig. Warum sollte ein CIO noch teure Verträge rechtfertigen, wenn man das Backend für Cent-Beträge austauschen kann? Damit ist das ROI-Problem doch gelöst.

SPEAKER_00 1:08

Da muss ich echt massiv dagegen halten. Diese Sichtweise ist also, ganz ehrlich, die ist naiv und brandgefährlich. Du übersiehst da völlig, wie moderne Softwarearchitektur auf technischer Ebene eigentlich funktioniert.

SPEAKER_01 1:21

Inwiefern? Billiger ist billiger?

SPEAKER_00 1:23

Ja, auf dem Papier. Du siehst nur die Oberfläche, also den Preis für ein paar generierte Wörter. Aber ein vermeintlich billiger Token wird in derselben Sekunde zu einem extrem teuren Workflow, wenn du anfängst, dich tief in die Infrastruktur einer einzigen Plattform einzuhaken. Du denkst an schmate Kosteneinsparungen beim Einkauf, läufst aber blind in die absolute Abhängigkeit rein.

SPEAKER_01 1:46

Aber wir können diese enorme Marktmacht der Anbieter doch nicht ignorieren. Nehmen wir Anthropic als Kontrastbeispiel. Die haben jetzt eine Postmoney-Bewertung von exakt 965 Milliarden Dollar.

SPEAKER_00 1:58

Wahnsinn, ja.

SPEAKER_01 1:59

Fast eine Billion. Stell dir das vor, wie in den frühen Tagen des Cloud-Computings. Wenn du bei solchen Giganten auf der anderen Seite des Tisches sitzt, musst du doch extrem agil bleiben. Genau deshalb müssen wir diese günstigen Tokens betrachten wie billiges Benzin. Völlig egal, von welcher Tankstelle es kommt, man wechselt einfach durch, Hauptsache der Motor läuft.

SPEAKER_00 2:21

Ähm, dein Tankstellenvergleich, der hinkt gewaltig. Wirklich. Du kaufst bei KI nämlich kein standardisiertes Benzin. Du baust einen Motor, der oft nur mit einer ganz bestimmten proprietären Zündkarze läuft.

SPEAKER_01 2:34

Ach komm, so schwer ist ein API-Wechsel jetzt auch nicht.

SPEAKER_00 2:37

Du glaubst wirklich, du kannst in der Praxis einfach mal so den Anbieter wechseln, das ist eine völlige Illusion. Lass uns mal anschauen, wie der Login beim Programmieren passiert. Du baust deine Datenanschlüsse, deine Agenten-Skills.

SPEAKER_01 2:51

Also die Fähigkeit der KI, auf unsere internen Datenbanken zuzugreifen.

SPEAKER_00 2:55

Genau. Und du baust deine Freigabeprozesse. Die sind heute oft fest auf die spezifische API, also die Datenschnittstelle eines einzigen Anbieters zugeschnitten. Das sogenannte Tool-Calling, also die Art, wie Prompts technisch formatiert werden, das ist eben nicht standardisiert.

SPEAKER_01 3:12

Okay, das heißt, das bricht alles weg.

SPEAKER_00 3:14

Richtig. Da hilft dir der günstigere Token-Preis der Konkurrenz überhaupt nichts, wenn dein ganzes System in die Brüche geht, sobald du den Stecker umsteckst. Schreib dir diesen Satz hinter die Ohren. Der Preis pro Token ist nicht der Preis deiner Abhängigkeit.

SPEAKER_01 3:29

Okay, also gut. Das leuchtet technisch ein, wenn man zu tief in den spezifischen Features der US-Giganten steckt. Aber hier im Dachraum sind wir doch viel sicherer aufgestellt. Weißt du? Ja. Wir pochen vehement auf den EU AI-Act, wir bestehen auf lokale Rechenzentren in Frankfurt oder Zürich und wir schreiben uns digitale Souveränität ganz groß in die Cloud-Verträge. Damit sind wir doch vor diesem schleichenden Login auf API-Ebene geschützt, oder nicht?

SPEAKER_00 4:00

Naja, das ist exakt der Togschluss, den so viele IT-Leiter bei uns gerade machen. Du verwechselst juristische Absicherung mit technischer Freiheit.

SPEAKER_01 4:10

Aber der Server steht doch in Hessen.

SPEAKER_00 4:11

Ja, toll. Aber echte Souveränität entsteht nicht in irgendwelchen Verträgen oder durch den Serverstandort. Sie entsteht ausschließlich in portablen Arbeitsprozessen. Wer seine Prompts und seine Geschäftslogik als so eine Art geheimes Check-Protokoll in der Weboberfläche eines einzigen Anbieters hortet, ist völlig abhängig. Wenn der Anbieter morgen seine Schnittstellen ändert oder bestimmte Features einfach streicht. Exakt. Dann nützt dir deinen toller Vertrag gar nichts. Dein ganzer Prozess bricht zusammen, weil das Gehirn deiner Anwendung beim Anbieter liegt.

SPEAKER_01 4:45

Krass. Okay, das klingt nach einer echten Architekturfalle. Wie entkommt man dem? Also, was können die Tech-Professionals da draußen, die Entwickler oder Architekten, jetzt tun?

SPEAKER_00 4:55

Das geht jetzt direkt an euch, wenn ihr diese KI-Systeme baut. Ich habe drei harte Ratschläge für eine wirklich portable Architektur, die ihr ab morgen umsetzen solltet. Erstens, dokumentiert einen wichtigen Workflow zwingend außerhalb eures Chat-Tools.

SPEAKER_01 5:11

Du meinst sowas wie das Ziel, den Input, den Qualitätscheck und den Output.

SPEAKER_00 5:16

Genau das, ja. Alles extern festhalten. Zweitens, und das ist entscheidend, testet diesen Workflow zwingend mit zwei Modellen. Einem starken Modell und einer extrem billigen Alternative.

SPEAKER_01 5:29

Ah, um zu sehen, wo es bricht.

SPEAKER_00 5:30

Richtig. Weil es euch zwingt, modellagnostische Prompts zu schreiben, anstatt euch auf die Macken einer einzigen API zu verlassen. Ihr seht sofort, was nicht funktioniert. Und drittens, legt eure Prompts und Entscheidungskriterien in einem eigenen internen Repositorium ab.

SPEAKER_01 5:46

Also in der eigenen Code-Datenbank.

SPEAKER_00 5:48

Niemals nur beim Anbieter. Zieht das komplett in eure eigene Kontrolle.

SPEAKER_01 5:52

Wahnsinn, das bringt mich wirklich zurück zu der unfassbaren Zahl, mit der wir gestartet sind. KI ist 600-fach billiger geworden. Aber ihr müsst diese Metrik heute wirklich neu bewerten. Ist eine 600-fache Ersparnis bei der Token-Rechnung heute es wirklich wert, wenn ihr morgen euer gesamtes Prozesswissen neu erfinden müsst, weil der Anbieter die Plattform ändert?

SPEAKER_00 6:15

Das ist die große Frage.

SPEAKER_01 6:16

Eben. Und nehmt mal diesen Gedanken mit, was passiert eigentlich in ein paar Jahren, wenn diese Modelle aufhören, über den Preis zu konkurrieren und stattdessen anfangen, geschlossene Ökosysteme aufzubauen, genau wie bei Apple und Android?

SPEAKER_00 6:30

Dann wird's richtig teuer.

SPEAKER_01 6:31

Definitiv. Wenn euch diese Debatte zum Nachdenken gebracht hat, abonniert KI Espresso. Jeden Tag eine neue KI-Debatte in sechs Minuten.

SPEAKER_00 6:40

Das war KI Espresso.