KI Espresso
KI Espresso ist dein täglicher KI-Podcast für Künstliche Intelligenz, AI News und Tech News aus Deutschland und der Welt. In 5 bis 7 Minuten bekommst du die wichtigsten KI-News, klar eingeordnet und auf den Punkt. Für alle, die verstehen wollen, wie KI Arbeit, Wirtschaft und Alltag verändert. Neue Folgen von Montag bis Freitag.
KI Espresso
600-fach billiger — CEOs fürchten KI-Lock-in
Use Left/Right to seek, Home/End to jump to start or end. Hold shift to jump forward or backward.
KI ist 600-fach billiger geworden. Und genau deshalb wird der Login gefährlicher.
SPEAKER_00Ähm, Moment, lass mich da ganz kurz.
SPEAKER_01Nee, warte, ich muss für euch alle erstmal die Datenlage einordnen, die wir heute hier zerlegen. Also wir haben hier ein neues Archive-Paper, das die Inferenzdaten, also quasi die reinen Ausführungskosten von KI, von Open Router und Epoch AI aus den Jahren 2020 bis 2026 analysiert. Und parallel dazu liegt uns so ein aktueller Bericht von Exios vor.
SPEAKER_00Der zeigt ja, dass alle gerade durchdrehen.
SPEAKER_01Genau. CEOs und CIOs gehen jetzt massiv auf KI-Schnäppchenjagd. Und unsere Mission für euch heute ist herauszufinden, wie man diesen Preissturz nutzen kann, ohne die eigene IT-Architektur völlig an die Wand zu fahren. Aber für mich ist die Datenlage eigentlich eindeutig. Mit einem 600-fachen Preisverfall ist KI ab heute ein reines Einkaufsthema.
SPEAKER_00Puh, also der.
SPEAKER_01Lass mich den Gedanken kurz beenden. Der finanzielle Anreiz für Routineaufgaben, einfach immer das billigste Open-Source-Modell zu nehmen, der ist doch riesig. Warum sollte ein CIO noch teure Verträge rechtfertigen, wenn man das Backend für Cent-Beträge austauschen kann? Damit ist das ROI-Problem doch gelöst.
SPEAKER_00Da muss ich echt massiv dagegen halten. Diese Sichtweise ist also, ganz ehrlich, die ist naiv und brandgefährlich. Du übersiehst da völlig, wie moderne Softwarearchitektur auf technischer Ebene eigentlich funktioniert.
SPEAKER_01Inwiefern? Billiger ist billiger?
SPEAKER_00Ja, auf dem Papier. Du siehst nur die Oberfläche, also den Preis für ein paar generierte Wörter. Aber ein vermeintlich billiger Token wird in derselben Sekunde zu einem extrem teuren Workflow, wenn du anfängst, dich tief in die Infrastruktur einer einzigen Plattform einzuhaken. Du denkst an schmate Kosteneinsparungen beim Einkauf, läufst aber blind in die absolute Abhängigkeit rein.
SPEAKER_01Aber wir können diese enorme Marktmacht der Anbieter doch nicht ignorieren. Nehmen wir Anthropic als Kontrastbeispiel. Die haben jetzt eine Postmoney-Bewertung von exakt 965 Milliarden Dollar.
SPEAKER_00Wahnsinn, ja.
SPEAKER_01Fast eine Billion. Stell dir das vor, wie in den frühen Tagen des Cloud-Computings. Wenn du bei solchen Giganten auf der anderen Seite des Tisches sitzt, musst du doch extrem agil bleiben. Genau deshalb müssen wir diese günstigen Tokens betrachten wie billiges Benzin. Völlig egal, von welcher Tankstelle es kommt, man wechselt einfach durch, Hauptsache der Motor läuft.
SPEAKER_00Ähm, dein Tankstellenvergleich, der hinkt gewaltig. Wirklich. Du kaufst bei KI nämlich kein standardisiertes Benzin. Du baust einen Motor, der oft nur mit einer ganz bestimmten proprietären Zündkarze läuft.
SPEAKER_01Ach komm, so schwer ist ein API-Wechsel jetzt auch nicht.
SPEAKER_00Du glaubst wirklich, du kannst in der Praxis einfach mal so den Anbieter wechseln, das ist eine völlige Illusion. Lass uns mal anschauen, wie der Login beim Programmieren passiert. Du baust deine Datenanschlüsse, deine Agenten-Skills.
SPEAKER_01Also die Fähigkeit der KI, auf unsere internen Datenbanken zuzugreifen.
SPEAKER_00Genau. Und du baust deine Freigabeprozesse. Die sind heute oft fest auf die spezifische API, also die Datenschnittstelle eines einzigen Anbieters zugeschnitten. Das sogenannte Tool-Calling, also die Art, wie Prompts technisch formatiert werden, das ist eben nicht standardisiert.
SPEAKER_01Okay, das heißt, das bricht alles weg.
SPEAKER_00Richtig. Da hilft dir der günstigere Token-Preis der Konkurrenz überhaupt nichts, wenn dein ganzes System in die Brüche geht, sobald du den Stecker umsteckst. Schreib dir diesen Satz hinter die Ohren. Der Preis pro Token ist nicht der Preis deiner Abhängigkeit.
SPEAKER_01Okay, also gut. Das leuchtet technisch ein, wenn man zu tief in den spezifischen Features der US-Giganten steckt. Aber hier im Dachraum sind wir doch viel sicherer aufgestellt. Weißt du? Ja. Wir pochen vehement auf den EU AI-Act, wir bestehen auf lokale Rechenzentren in Frankfurt oder Zürich und wir schreiben uns digitale Souveränität ganz groß in die Cloud-Verträge. Damit sind wir doch vor diesem schleichenden Login auf API-Ebene geschützt, oder nicht?
SPEAKER_00Naja, das ist exakt der Togschluss, den so viele IT-Leiter bei uns gerade machen. Du verwechselst juristische Absicherung mit technischer Freiheit.
SPEAKER_01Aber der Server steht doch in Hessen.
SPEAKER_00Ja, toll. Aber echte Souveränität entsteht nicht in irgendwelchen Verträgen oder durch den Serverstandort. Sie entsteht ausschließlich in portablen Arbeitsprozessen. Wer seine Prompts und seine Geschäftslogik als so eine Art geheimes Check-Protokoll in der Weboberfläche eines einzigen Anbieters hortet, ist völlig abhängig. Wenn der Anbieter morgen seine Schnittstellen ändert oder bestimmte Features einfach streicht. Exakt. Dann nützt dir deinen toller Vertrag gar nichts. Dein ganzer Prozess bricht zusammen, weil das Gehirn deiner Anwendung beim Anbieter liegt.
SPEAKER_01Krass. Okay, das klingt nach einer echten Architekturfalle. Wie entkommt man dem? Also, was können die Tech-Professionals da draußen, die Entwickler oder Architekten, jetzt tun?
SPEAKER_00Das geht jetzt direkt an euch, wenn ihr diese KI-Systeme baut. Ich habe drei harte Ratschläge für eine wirklich portable Architektur, die ihr ab morgen umsetzen solltet. Erstens, dokumentiert einen wichtigen Workflow zwingend außerhalb eures Chat-Tools.
SPEAKER_01Du meinst sowas wie das Ziel, den Input, den Qualitätscheck und den Output.
SPEAKER_00Genau das, ja. Alles extern festhalten. Zweitens, und das ist entscheidend, testet diesen Workflow zwingend mit zwei Modellen. Einem starken Modell und einer extrem billigen Alternative.
SPEAKER_01Ah, um zu sehen, wo es bricht.
SPEAKER_00Richtig. Weil es euch zwingt, modellagnostische Prompts zu schreiben, anstatt euch auf die Macken einer einzigen API zu verlassen. Ihr seht sofort, was nicht funktioniert. Und drittens, legt eure Prompts und Entscheidungskriterien in einem eigenen internen Repositorium ab.
SPEAKER_01Also in der eigenen Code-Datenbank.
SPEAKER_00Niemals nur beim Anbieter. Zieht das komplett in eure eigene Kontrolle.
SPEAKER_01Wahnsinn, das bringt mich wirklich zurück zu der unfassbaren Zahl, mit der wir gestartet sind. KI ist 600-fach billiger geworden. Aber ihr müsst diese Metrik heute wirklich neu bewerten. Ist eine 600-fache Ersparnis bei der Token-Rechnung heute es wirklich wert, wenn ihr morgen euer gesamtes Prozesswissen neu erfinden müsst, weil der Anbieter die Plattform ändert?
SPEAKER_00Das ist die große Frage.
SPEAKER_01Eben. Und nehmt mal diesen Gedanken mit, was passiert eigentlich in ein paar Jahren, wenn diese Modelle aufhören, über den Preis zu konkurrieren und stattdessen anfangen, geschlossene Ökosysteme aufzubauen, genau wie bei Apple und Android?
SPEAKER_00Dann wird's richtig teuer.
SPEAKER_01Definitiv. Wenn euch diese Debatte zum Nachdenken gebracht hat, abonniert KI Espresso. Jeden Tag eine neue KI-Debatte in sechs Minuten.
SPEAKER_00Das war KI Espresso.