KI Espresso

600-fach billiger — CEOs fürchten KI-Lock-in

Episode 72

Use Left/Right to seek, Home/End to jump to start or end. Hold shift to jump forward or backward.

0:00 | 6:41
#Openai #Anthropic #Google #EuAiAct #Llm KI ist 600-fach billiger geworden. Aber der gefährliche Teil ist nicht mehr der Tokenpreis, sondern der Lock-in in Workflows, Daten, Freigaben und Tool-Calling. In dieser Folge geht es darum, warum CEOs und CIOs gerade KI-Schnäppchen jagen, warum billige Modelle trotzdem teuer werden können und wie Teams ihre Arbeit portabel halten. ⏰ Timestamps: 0:00 — 600-fach billiger: Warum Lock-in jetzt gefährlicher wird 0:23 — arXiv, OpenRouter, Epoch AI und Axios: die Datenlage 0:54 — Warum KI für CIOs zum Einkaufsthema wird 1:21 — Der Unterschied zwischen Tokenpreis und Workflow-Kosten 1:52 — Anthropic als Kontrast: 965 Milliarden Dollar Bewertung 2:27 — Warum KI kein standardisiertes Benzin ist 2:54 — Tool Calling, Datenzugriff und Freigaben als Lock-in 3:20 — Der Preis pro Token ist nicht der Preis deiner Abhängigkeit 3:50 — DACH, EU AI Act und die falsche Sicherheit 4:28 — Warum der Prozess nicht beim Anbieter liegen darf 5:04 — Drei Regeln für portable KI-Workflows 6:00 — Die 600-fache Ersparnis neu bewerten 💡 3 Empfehlungen: 1. Dokumentiere wichtige KI-Workflows außerhalb des Chat-Tools: Ziel, Input, Aktion, Check, Output. 2. Teste denselben Workflow mit zwei Modellen: einem starken und einer günstigeren Alternative. 3. Lege Prompts, Checks und Entscheidungskriterien in einem eigenen Repo ab, nicht nur in der Plattform des Anbieters. 📖 Quellen: • arXiv — Tiered Super-Moore's Law: https://arxiv.org/abs/2603.28576 • Axios — CEOs go bargain hunting for AI: https://www.axios.com/2026/05/29/ceos-ai-cheaper-tokens • Anthropic — Series H funding: https://www.anthropic.com/news/series-h 🔗 Verwandte Episoden: • 80 % der Chefs machen KI zum Job-Risiko: https://youtu.be/KMUz-Z5UF6I • Nur 24% bereit: Der AI Act trifft Europas Firmen unvorbereitet: https://youtu.be/tOiSUeFuev0 • 2,5 Milliarden — scheitern sie an einer: https://youtu.be/Yub4XwCDVYY 🎙️ KI Espresso — Jeden Tag eine neue KI-Debatte in sechs Minuten. 🎧 Podcast hören: • Apple Podcasts: https://podcasts.apple.com/podcast/id1885621764 • Alle Plattformen: https://www.buzzsprout.com/2603567 𝕏 @KIEspresso
SPEAKER_01

KI ist 600-fach billiger geworden. Und genau deshalb wird der Login gefährlicher.

SPEAKER_00

Ähm, Moment, lass mich da ganz kurz.

SPEAKER_01

Nee, warte, ich muss für euch alle erstmal die Datenlage einordnen, die wir heute hier zerlegen. Also wir haben hier ein neues Archive-Paper, das die Inferenzdaten, also quasi die reinen Ausführungskosten von KI, von Open Router und Epoch AI aus den Jahren 2020 bis 2026 analysiert. Und parallel dazu liegt uns so ein aktueller Bericht von Exios vor.

SPEAKER_00

Der zeigt ja, dass alle gerade durchdrehen.

SPEAKER_01

Genau. CEOs und CIOs gehen jetzt massiv auf KI-Schnäppchenjagd. Und unsere Mission für euch heute ist herauszufinden, wie man diesen Preissturz nutzen kann, ohne die eigene IT-Architektur völlig an die Wand zu fahren. Aber für mich ist die Datenlage eigentlich eindeutig. Mit einem 600-fachen Preisverfall ist KI ab heute ein reines Einkaufsthema.

SPEAKER_00

Puh, also der.

SPEAKER_01

Lass mich den Gedanken kurz beenden. Der finanzielle Anreiz für Routineaufgaben, einfach immer das billigste Open-Source-Modell zu nehmen, der ist doch riesig. Warum sollte ein CIO noch teure Verträge rechtfertigen, wenn man das Backend für Cent-Beträge austauschen kann? Damit ist das ROI-Problem doch gelöst.

SPEAKER_00

Da muss ich echt massiv dagegen halten. Diese Sichtweise ist also, ganz ehrlich, die ist naiv und brandgefährlich. Du übersiehst da völlig, wie moderne Softwarearchitektur auf technischer Ebene eigentlich funktioniert.

SPEAKER_01

Inwiefern? Billiger ist billiger?

SPEAKER_00

Ja, auf dem Papier. Du siehst nur die Oberfläche, also den Preis für ein paar generierte Wörter. Aber ein vermeintlich billiger Token wird in derselben Sekunde zu einem extrem teuren Workflow, wenn du anfängst, dich tief in die Infrastruktur einer einzigen Plattform einzuhaken. Du denkst an schmate Kosteneinsparungen beim Einkauf, läufst aber blind in die absolute Abhängigkeit rein.

SPEAKER_01

Aber wir können diese enorme Marktmacht der Anbieter doch nicht ignorieren. Nehmen wir Anthropic als Kontrastbeispiel. Die haben jetzt eine Postmoney-Bewertung von exakt 965 Milliarden Dollar.

SPEAKER_00

Wahnsinn, ja.

SPEAKER_01

Fast eine Billion. Stell dir das vor, wie in den frühen Tagen des Cloud-Computings. Wenn du bei solchen Giganten auf der anderen Seite des Tisches sitzt, musst du doch extrem agil bleiben. Genau deshalb müssen wir diese günstigen Tokens betrachten wie billiges Benzin. Völlig egal, von welcher Tankstelle es kommt, man wechselt einfach durch, Hauptsache der Motor läuft.

SPEAKER_00

Ähm, dein Tankstellenvergleich, der hinkt gewaltig. Wirklich. Du kaufst bei KI nämlich kein standardisiertes Benzin. Du baust einen Motor, der oft nur mit einer ganz bestimmten proprietären Zündkarze läuft.

SPEAKER_01

Ach komm, so schwer ist ein API-Wechsel jetzt auch nicht.

SPEAKER_00

Du glaubst wirklich, du kannst in der Praxis einfach mal so den Anbieter wechseln, das ist eine völlige Illusion. Lass uns mal anschauen, wie der Login beim Programmieren passiert. Du baust deine Datenanschlüsse, deine Agenten-Skills.

SPEAKER_01

Also die Fähigkeit der KI, auf unsere internen Datenbanken zuzugreifen.

SPEAKER_00

Genau. Und du baust deine Freigabeprozesse. Die sind heute oft fest auf die spezifische API, also die Datenschnittstelle eines einzigen Anbieters zugeschnitten. Das sogenannte Tool-Calling, also die Art, wie Prompts technisch formatiert werden, das ist eben nicht standardisiert.

SPEAKER_01

Okay, das heißt, das bricht alles weg.

SPEAKER_00

Richtig. Da hilft dir der günstigere Token-Preis der Konkurrenz überhaupt nichts, wenn dein ganzes System in die Brüche geht, sobald du den Stecker umsteckst. Schreib dir diesen Satz hinter die Ohren. Der Preis pro Token ist nicht der Preis deiner Abhängigkeit.

SPEAKER_01

Okay, also gut. Das leuchtet technisch ein, wenn man zu tief in den spezifischen Features der US-Giganten steckt. Aber hier im Dachraum sind wir doch viel sicherer aufgestellt. Weißt du? Ja. Wir pochen vehement auf den EU AI-Act, wir bestehen auf lokale Rechenzentren in Frankfurt oder Zürich und wir schreiben uns digitale Souveränität ganz groß in die Cloud-Verträge. Damit sind wir doch vor diesem schleichenden Login auf API-Ebene geschützt, oder nicht?

SPEAKER_00

Naja, das ist exakt der Togschluss, den so viele IT-Leiter bei uns gerade machen. Du verwechselst juristische Absicherung mit technischer Freiheit.

SPEAKER_01

Aber der Server steht doch in Hessen.

SPEAKER_00

Ja, toll. Aber echte Souveränität entsteht nicht in irgendwelchen Verträgen oder durch den Serverstandort. Sie entsteht ausschließlich in portablen Arbeitsprozessen. Wer seine Prompts und seine Geschäftslogik als so eine Art geheimes Check-Protokoll in der Weboberfläche eines einzigen Anbieters hortet, ist völlig abhängig. Wenn der Anbieter morgen seine Schnittstellen ändert oder bestimmte Features einfach streicht. Exakt. Dann nützt dir deinen toller Vertrag gar nichts. Dein ganzer Prozess bricht zusammen, weil das Gehirn deiner Anwendung beim Anbieter liegt.

SPEAKER_01

Krass. Okay, das klingt nach einer echten Architekturfalle. Wie entkommt man dem? Also, was können die Tech-Professionals da draußen, die Entwickler oder Architekten, jetzt tun?

SPEAKER_00

Das geht jetzt direkt an euch, wenn ihr diese KI-Systeme baut. Ich habe drei harte Ratschläge für eine wirklich portable Architektur, die ihr ab morgen umsetzen solltet. Erstens, dokumentiert einen wichtigen Workflow zwingend außerhalb eures Chat-Tools.

SPEAKER_01

Du meinst sowas wie das Ziel, den Input, den Qualitätscheck und den Output.

SPEAKER_00

Genau das, ja. Alles extern festhalten. Zweitens, und das ist entscheidend, testet diesen Workflow zwingend mit zwei Modellen. Einem starken Modell und einer extrem billigen Alternative.

SPEAKER_01

Ah, um zu sehen, wo es bricht.

SPEAKER_00

Richtig. Weil es euch zwingt, modellagnostische Prompts zu schreiben, anstatt euch auf die Macken einer einzigen API zu verlassen. Ihr seht sofort, was nicht funktioniert. Und drittens, legt eure Prompts und Entscheidungskriterien in einem eigenen internen Repositorium ab.

SPEAKER_01

Also in der eigenen Code-Datenbank.

SPEAKER_00

Niemals nur beim Anbieter. Zieht das komplett in eure eigene Kontrolle.

SPEAKER_01

Wahnsinn, das bringt mich wirklich zurück zu der unfassbaren Zahl, mit der wir gestartet sind. KI ist 600-fach billiger geworden. Aber ihr müsst diese Metrik heute wirklich neu bewerten. Ist eine 600-fache Ersparnis bei der Token-Rechnung heute es wirklich wert, wenn ihr morgen euer gesamtes Prozesswissen neu erfinden müsst, weil der Anbieter die Plattform ändert?

SPEAKER_00

Das ist die große Frage.

SPEAKER_01

Eben. Und nehmt mal diesen Gedanken mit, was passiert eigentlich in ein paar Jahren, wenn diese Modelle aufhören, über den Preis zu konkurrieren und stattdessen anfangen, geschlossene Ökosysteme aufzubauen, genau wie bei Apple und Android?

SPEAKER_00

Dann wird's richtig teuer.

SPEAKER_01

Definitiv. Wenn euch diese Debatte zum Nachdenken gebracht hat, abonniert KI Espresso. Jeden Tag eine neue KI-Debatte in sechs Minuten.

SPEAKER_00

Das war KI Espresso.