programmier.bar – der Podcast für App- und Webentwicklung
Die programmier.bar lädt regelmäßig spannende Gäste aus der Welt der App- und Webentwicklung zum Gespräch ein. Es geht um neue Technologien, unsere liebsten Tools und unsere Erfahrungen aus dem Entwickler-Alltag mit all seinen Problemen und Lösungswegen.
Euer Input ist uns wichtig! Schreibt uns eure Themenwünsche und Feedback per Mail an podcast@programmier.bar oder auf Discord (https://discord.gg/SvkGpjxSMe), LinkedIn (@programmier.bar), Bluesky (@programmier.bar), Instagram (@programmier.bar) oder Mastodon (@podcast@programmier.bar).
Wir sind Full-Stack-Spieleentwickler bekannter Apps wie 4 Bilder 1 Wort, Quiz Planet und Word Blitz. https://www.programmier.bar/impressum
programmier.bar – der Podcast für App- und Webentwicklung
News AI 25/26: Fable 5 // SpaceX übernimmt Cursor // Apple Intelligence und Gemini
Use Left/Right to seek, Home/End to jump to start or end. Hold shift to jump forward or backward.
Wie hat dir die Folge gefallen?
Gut 👍
Schlecht 👎
(Keine Anmeldung erforderlich)
Anthropic veröffentlicht Mythos und Fable 5, nur, um es kurz danach wieder abzuschalten. Außerdem wurde die Agentic IDE Cursor von SpaceX übernommen und wir haben neue technische Insights zu Apple Intelligence und Gemini. Eine Folge über KI-Regulierung, milliardenschwere Deals und die Frage, wie sich die Grenzen zwischen KI-Modellen und den Produkten, in denen sie eingesetzt werden, immer weiter verwischen.
In dieser Folge sprechen Jan und Philipp über das, was inzwischen als „Fable Gate“ diskutiert wird: Warum die US-Regierung den Export des Modells untersagt hat, welche Rolle Sicherheitsbedenken und Jailbreaks dabei spielen und was das Ganze über die Abhängigkeit von einzelnen KI-Anbietern verrät. Außerdem werfen die beiden einen Blick darauf, welche Auswirkungen solche Entscheidungen auf Unternehmen und Entwicklungsteams haben kann, aber nicht sollte.
Danach geht es um das AI-Coding-Startup Cursor. Gemeinsam analysieren Jan und Philipp die Übernahme durch SpaceX, sprechen über die milliardenschwere Bewertung und diskutieren, warum Entwicklungswerkzeuge zunehmend zum strategischen Faktor im Wettlauf um die besten KI-Modelle werden. Außerdem schauen sie auf die neuen Produkte, die Cursor auf seiner Compile-Konferenz vorgestellt hat – von einem agentenfreundlichen GitHub-Konkurrenten namens Origin bis hin zu einer eigenen Mobile-App.
Zum Abschluss folgt ein Nachtrag zur WWDC: Apple hat weitere Details zu seinen neuen Foundation Models veröffentlicht. Jan beleuchtet, welche Modelle künftig direkt auf iPhone und Mac laufen, welche Aufgaben in die Cloud ausgelagert werden und warum Google dabei eine größere Rolle spielt, als es die Keynote zunächst vermuten ließ. Außerdem geht es um die technischen Tricks, mit denen Apple große Modelle auf vergleichsweise kleinen Geräten nutzbar machen möchte.
Schreibt uns!
Schickt uns eure Themenwünsche und euer Feedback: podcast@programmier.bar
Folgt uns!
Bleibt auf dem Laufenden über zukünftige Folgen und virtuelle Meetups und beteiligt euch an Community-Diskussionen.
Hallo und herzlich willkommen bei einer neuen AI-News-Folge. Heute in der Ausgabe 25 des Jahres 2026. Mit mir hier im Studio ist wie immer Philipp Schmid. Hallo Philipp, schön, dass du da bist. Hallo.
SPEAKER_01Das erste Mal glaubt, dass wir was zusammen aufnehmen, oder?
SPEAKER_00Nein, es ist nur schon Jahre her. Ich habe das vorhin auch überlegt, als es gab mal einen Moment, als Dennis, glaube ich, in Elternzeit war und Fabi irgendwie im Urlaub oder so, das muss so, weiß ich, 2023 oder sowas gewesen, also das ist schon ewig, ewig lange her. Da haben wir das auch schon mal gemacht. Ja, weil für alle, die sich wundern, dass hier weder Dennis noch Fabi sitzen, Dennis ist im Urlaub, kitesurfen irgendwo in Afrika oder so. Und was Fabi macht, habe ich ehrlicherweise keine Ahnung. So. Der wird auch im Urlaub sein. Aber er ist auf alle Fälle heute nicht hier. Wir wollen ein bisschen sprechen über Fable bzw. den Release bzw. den Nicht-Release. Wir sprechen ein bisschen über Cursor, das sich zusammen mit SpaceX gerade in astronomische Höhen bewegt. Und wir sprechen ein bisschen über Apples Foundation-Modelle und alles, was wir da vielleicht noch so im Nachgang der WWDC zugehört haben. Ja, dann würde ich sagen, wir steigen mal direkt mit dem Fable Gate. So habe ich das auf LinkedIn irgendwie schon betitelt gelesen. Steigen wir ein, ist ja alles ein Gate heutzutage. So, wir machen einmal den Kurzabriss und dann können wir vielleicht im Detail nochmal reinschauen. Also, am 9. Juni, das war letzte Woche Dienstag, hat Entropic Fable 5 und Mythos released. Benchmark natürlich, wie immer, mega cool, 10%-Punkte im SWE-Banch, mehr als Opus, 10% gesteigert im Terminal-Banch. Alles mega cool, aber diese ganzen Benchmarks sind wahrscheinlich zweitrangig und hinfällig. Da sprechen wir gleich drüber. Weil ganze drei Tage später, am 12. Juni, war es das dann auch schon wieder mit Fable und Fable musste abgeschaltet werden. Warum? Weil die amerikanische Regierung gesagt hat: so, boah, dieses Fable, das ist so sehr schwierige Software und das stellt ein Sicherheitsrisiko dar, wenn wir das exportieren und andere Nationen zugänglich machen und deshalb kann das quasi nur in US-amerikanischen Händen bleiben. Und hat daraufhin Entropic untersagt, im Prinzip aus ausländischen Kunden und auch in den Vereinigten Staaten Ausländern zur Verfügung zu stellen, was auch Entropics eigene Mitarbeiter mit einschließt. Und weil Entropic dann gesagt hat, naja, wir haben jetzt auf die Schnelle keinerlei Möglichkeit zu kontrollieren, mit welcher Staatsbürgerschaft da unsere Kunden irgendwie einhergehen, haben sie das kurzerhand für alle wieder abgeschaltet. Worum ging es da genau? So hundertprozentig genau kann man das gar nicht sagen, weil die amerikanische Regierung für diese Entscheidung im Prinzip niemandem Rechenschaft schuldet. Sie kann das ad hoc selber entscheiden. Da gibt es auch keinen offiziellen Widerspruchsprozess oder sowas. Es sind jetzt wohl zwar Leute von Entropic in Washington, um irgendwie da mit Regierungsvertretern zu sprechen. Aber im Prinzip ist das eine Entscheidung, ich sag mal so, nach Lust und Laune. Und es dreht sich so ein bisschen um diese Frage, wie einfach und schwerwiegend so Fable 5 zu Jailbreaken ist. Also was Entropic ja gemacht hat, ist Fable, ähnlich wie Mythos, was sie ja als so zu powerful für die Allgemeinheit irgendwie abgestempelt haben, zu sagen, naja, wir bauen hier so ein paar Guardrails ein und wenn du schwierige, gefährliche, illegale, wie auch immer, Anfragen an das Model stellst, kriegst du im Prinzip nur in Anführungszeichen die Antwort von Opus 4.8. Das gibt quasi ein Fallback auf ein weniger Capable Model. Und ja, das war so ihr Workaround quasi, um dieses Problem zu umgehen. Turns out, wie bei vielen von diesen Modellen, wenn man kreativ genug ist, kann man da halt Jailbreaks für finden und irgendwie auch diese Guardrails umgehen. Ich fand dieses eine Beispiel, was so auf Twitter so ein bisschen kursiert, das war so, naja, wenn du Fable nutzen willst, um irgendwie Sicherheitslücken zu finden, ähnlich wie das ja mit Mythos schon länger gemacht wird, dann wirfst du ihm einfach die Codebase hin und sagst so, hey, helf mir doch mal, diesen Code zu fixen. So, einfach nur fix das Code. Und dann findet er natürlich so ein paar Runtime-Bugs, aber halt auch Security-Exploits. Und das war im Prinzip schon alles. Das bisschen perfide an dieser Sache ist, dass der Tipp dazu an die US-Regierung wohl aus Amazons Cyber Security Research Lab gekommen ist. Und das ist natürlich schon so ein bisschen komisch, weil Amazon ist ja meines Wissens nach immer noch der größte Einzelinvestor in Entropic. So, und dass sie denen da jetzt quasi so den Riegel vorschieben und da so an die Karre fahren, das ist natürlich ein bisschen schwierig. Entropic beruft sich darauf, dass sie sagen, naja, es gibt keinen hundertprozentigen Security, keinen hundertprozentigen Safeguard gegen Jailbreaks. Die Jailbreaks, die hier demonstriert worden sind und auch die anderen, die so kursieren, funktionieren auch in vielen der anderen Modellen, die da draußen so sind. Also auch in GPT-5.5 gibt es da Demos für, dass sie da funktionieren. Und das wäre jetzt quasi nicht gravierend genug, als dass das so diesen Ban irgendwie rechtfertigen könnte. Ja, das vielleicht mal so die 30-Sekunden-Summary. Hast du es gemacht? 300 Sekunden.
SPEAKER_01Also hattest du die Möglichkeit, Fable 5 zu testen während den drei Tagen, wo es da war?
SPEAKER_00Ja, tatsächlich. Ich habe es auch benutzt. Ich habe auch sehr schnell mein Token-Limit dadurch aufgebraucht im Prinzip. Ich habe es schon so ganz banale Design-Sachen gemacht, muss ich sagen, weil man das ja auch in Cloud Design schon nutzen konnte. Und weil Design so mit einem meiner größten Schwächen ist, habe ich gesagt, okay, je mehr Intelligence ich da drauf werfen kann, umso besser. Es hat auch echt coole Ergebnisse geliefert, muss ich sagen. Aber es war halt schon deutlich langsamer als Opus vorher. Und wie gesagt, also mein Token-Limit war nach anderthalb Features, die ich gebaut habe, war es halt auch einfach weg. Vielleicht noch ein Satz zur Einleitung, weil ich gesagt habe, diese ganzen Benchmarks sind vielleicht jetzt hinfällig. Es kann natürlich sein, dass die Lösung auf diese Situation ist, dass Entropic bei seinen Guardrails irgendwie nachschärfen muss und in mehr oder anderen Fällen quasi diesen Fallback auf Opus 4.5 dann bringen muss. Und das kann natürlich dann auch die Benchmark-Ergebnisse wieder ändern. Also alle Benchmark-Ergebnisse, die wir zu Release gesehen haben, würde ich jetzt nochmal mit Vorsicht genießen. Sollte man vielleicht dann, wenn es wieder verfügbar ist, sich nochmal anschauen. Philipp, dein Take.
SPEAKER_01Ja, also ich war beeindruckt beim Modell und ich habe auch sehr viel positiv gelesen. Und ich weiß nicht, ob du es am Anfang erwähnt hast, aber als es Released war, haben sie ja ein paar Pricing auch mitveröffentlicht. Und es war doppelt so teuer wie Opus 4.8. Also deswegen wahrscheinlich auch mehr Consumption. Und der eigentliche Plan war am Anfang, dass man es bis 22. Juni in Cloud Code ja zur Verfügung hat oder halt eine Cloud-Subscriptions und danach dafür API-Pricing zahlen müsste. Schade, dass es nicht mehr verfügbar ist. Mich hätte sehr gerne interessiert, wie sich das alles ausarbeitet, ob dann, also wie Leute damit umgehen und es nutzen werden, weil wir hatten, glaube ich, in der letzten Folge das Thema mit, hey, AI-Kosten werden immer höher und Unternehmen fahren ja jetzt schon wieder zurück und haben die die Leute zu früh entlassen und hey, jeder bekommt irgendwie, keine Ahnung, 3000 Dollar und darf die dann ausgeben für whatever AI, dass er halt irgendwie braucht. Deswegen schade, dass da, sag ich mal, die US-Regierung uns so ein bisschen Insights weggenommen hat. Und an sich finde ich es ein schwieriges Thema, weil ich meine, Anthropic ist ja dafür bekannt, dass sie immer sehr stark dafür Werbung machen, dass alles ein Risiko ist und wir mehr Safety brauchen. Und jetzt werden sie irgendwie gesafety reguliert und vor zwei Monaten hatten sie ja gesagt, hey, wir können Mythos nicht releasen, ist zu gefährlich. Jetzt haben sie Mythos doch released unter Fable, aber mit diesen extra Guardrails außenrum. Und ich meine, wir haben ja, wir wissen ja alle, dass Guardrails nicht 100% funktionieren. Also selbst wenn sie jetzt irgendwie was zusätzlich machen für irgendwas im Coding-Bereich, dann wirst du schon wieder irgendwelche Leute haben, die das dann irgendwie versuchen zu umgehen. Klar, der Großteil wird dafür irgendwie nicht verwendet, aber dann auf der anderen Seite weiß ich halt auch wieder nicht, ob das das Ziel davon ist. Also wenn ich ein Modell habe, was an sich extrem gut ist, was zweimal so viel kostet, aber ich nie garantieren kann bei meinem Prompt, den ich benutze, ob das wirklich dann das normale Modell ist oder nicht. Und man weiß ja, egal ob ich jetzt Cloud nutze oder GPT oder Gemini, ich muss immer gewiss ein bisschen anders prompten und ich lerne auch ein bisschen, wie ich mit den Modellen umgehe. Und dass wenn ich dann so eine Art Mixed-State habe, wo man nie genau weiß, was wirklich kommt, ist das schon schwieriger. Also ich bin mal gespannt, wie es weitergeht, weil wir wissen alle, die Performance wird nicht schlechter. Und ich bin mir sicher, dass OpenAI oder dass Gemini alle nachholen oder aufholen oder dass selbst, sag ich mal, Open Ways-Modelle zu dem Punkt halt irgendwann kommen werden. Und dann ist halt die Frage, wie man damit umgeht und was man bis dahin halt lernen oder machen kann.
SPEAKER_00Eine der Antworten von Entropic war ja auch, dass sie von Anfang an gesagt haben, wir führen hier diese 30-Tage Data Retention Policy ein, die es ja so vorher nicht gab, um quasi selbst wenn du einen Jailbreak findest oder irgendeinen Abuse auf dieses Modell quasi fährst, dass sie das im worst Case im Nachhinein feststellen können und dann halt irgendwie deinen Account restricten, bannen, isolieren, wie auch immer irgendwie können. Und das war ja auch schon Grund genug für die ein oder andere große Corporate-Kunden, irgendwie zu sagen, so, das nutzen wir immer erstmal nicht, weil wir halt mit dieser Data Retention irgendwie nicht einverstanden sind.
SPEAKER_01Aber ich sag mal, wenn wir bei dem Beispiel bleiben, was irgendwo halt geteilt wird, wo man nicht sicher ist, ob das wirklich stimmt oder nicht, mit hey, fix my code und dann findet ihr Security-Issues. Das ist eine ganz normale Entwickleraufgabe. Also ich weiß nicht, wenn ich irgendwo an einem großen Projekt arbeite oder was ein komplexes Projekt arbeite, sei es selbst sogar im Betriebssystem, aber am Ende wollen wir AI dafür nutzen, sage ich mal, mehr oder weniger. Und wenn die AI gut ist, um diese Bugs zu fixen, dann ist es ja, du hast ja immer die gute Seite und die schlechte Seite. Und es wäre ja schlecht, wenn beide Seiten irgendwie, sag ich mal, dadurch reguliert werden würden, weil die böse Seite ist normalerweise, also in dem Fall böse in Anführungszeichen, aber klar, halt die Leute, die dich hacken wollen oder damit irgendwas abusen wollen, die sind meistens offener gegenüber solchen Jailbreaks als die guten Seiten. Weil die gute Seite möchte natürlich in den Terms of Service bleiben oder halt nichts irgendwas Falsches machen. Das heißt, das ist ja doppelt schlecht in dem Sinne, wenn wir da. Also ich bin spannend, ich finde es auf jeden Fall interessant zu verfolgen. Ich glaube, es wird sich in den nächsten ein, zwei Wochen einiges ergeben, weil ich kann mir nicht vorstellen, dass das einfach unterm Tisch verschwindet und das Modell nie released wird oder was sie da machen. Vielleicht nennen sie es auch einfach Opus 4.9 und keine Ahnung, Pricing oder Höhe oder sowas. Also ja, ich meine, auf der anderen Sicht ist ja auch wieder noch vielleicht als letzte Punkt interessant, hätten sie es nicht released, hätten sie es ja intern weiter nutzen können. Also Anthropic oder andere Unternehmen könnten ja das Modell, wenn sie es trainiert haben und wenn das als Risiko eingestuft werden würde zum Releasen, ja einfach intern nutzen, um sich dann ja selber zu verbessern. Klar kommst du irgendwann in die Gefahr, wir können das nicht finanzieren und wir brauchen Kunden von außen und wir brauchen Feedback von außen und wir brauchen mehr Evaluierungen und alles andere. Aber ich weiß nicht, ob die sich dann ein bisschen auf den Finger gerade beißen, dass sie das schon released haben.
SPEAKER_00Also, was ja auch gerade jetzt hier in Europa so Teil von dem Diskurs war, da ging es wieder um Abhängigkeit von US-Tech-Konzernen, da ging es um, oh mein Gott, mein Business-Modell ist irgendwie gefährdet, weil ich jetzt hier irgendwie Access verloren habe. Und da, also, ich habe das gelesen, so auf verschiedenen Social-Media-Kanälen, und dachte mir auch nur so, wenn das dein Problem ist, dann hast du halt irgendwas grundsätzlich falsch verstanden. Und ich glaube, das muss man vielleicht auch mal sagen. Also A, wenn dein Business gefährdet ist, weil ein Model, was irgendwie 72 Stunden da war, jetzt nicht mehr da ist, dann hast du vielleicht irgendwie aufs falsche Pferd gesetzt und nicht so gut irgendwie hier Risikoabwägungen betrieben. Und auch ansonsten, glaube ich, also so gerne ich einzelne dieser Models irgendwie mag und auch irgendwie super cool finde, am Ende muss es ja für dich aus Business-Sicht ja eigentlich so eine Commodity sein. Also genauso wie wenn jetzt, weiß ich nicht, heute Microsoft SQL sagen würde, so ja, machen wir nicht mehr, gibt es nicht mehr in Europa, ja, dann musst du halt irgendwie auf Postgres oder MySQL wechseln können oder keine Ahnung, ja. Und genauso, wenn jetzt Entropic morgen sagen würde, wir machen gar keine Modelle mehr in Europa, dann muss es dir ja irgendwie möglich sein, dass du halt sagst, naja, wir nutzen halt irgendwas anderes, aber es hängt nicht 100% von unserem Business daran, dass dieses eine Modell von diesem einen speziellen Anbieter irgendwie da ist.
SPEAKER_01Ja, ich glaube alles ein bisschen schwierig, weil wir halt in so einer sehr schnelllebigen technologischen Welt jetzt sind. Ich meine, wenn man da, keine Ahnung, gehst dir 15 Jahre zurück und stell dir vor, Oracle sagt, ja, du darfst Java Enterprise nicht mehr in Europa nutzen. Da werden ja auch ganz viele Unternehmen erstmal und klar ist es kein guter Vergleich, weil das eine ist eine Sprache, das andere ist irgendwie ein Produkt oder irgendwie sowas, aber du hast ja trotzdem Lizenzen für das gekauft und ich glaube, es bleibt einfach abzuwarten und ich gehe davon aus, dass man mehr davon in der Zukunft sieht. Also er als eher weniger. Also ich glaube nicht, dass wir regulatorisch oder gesellschaftlich da jetzt sagen, hey, okay, das war jetzt einmal der Fall, Modelle sind halt so und dann mal schauen, wo es hingeht. Also ich glaube, die Welt wird eher verrückter, als dass sie stabiler wird, umso besser die KI-Modelle werden. Und umso besser die werden, umso andere Risiken kommen ab und umso eher muss man halt auch Prioritäten anpassen oder andere Dinge und dann sind es, glaubt, keine schweren Entscheidungen, die auf Unternehmen zukommen. Weil wenn der Konkurrent das halt irgendwie einführt und dann alle Kunden dahin springen und man halt selber ein bisschen langsamer ist und vorsichtiger, dann wird schwierig.
SPEAKER_00Ja, es ist sicherlich eine Risikoabwägung, aber ich glaube halt, also ganz simpel gesagt, so mein Mitleid hält sich so ein bisschen in Grenzen für die Fälle. Weil ich glaube, wie du sagst, ich glaube, als Unternehmen bist du es dir halt irgendwie schon schuldig, da so ein bisschen Contingency Planning zu machen. Ja. Und halt nicht dann mit runtergelassener Hose dazustehen, wenn das passiert, weil ich bin voll bei dir, das wird irgendwie wieder passieren. Ob das jetzt aus regulatorischer Sicht, aus Marktsicht, aus irgendwo anders herkommt, aber es wird nicht das letzte Mal gewesen sein.
unknownJa.
SPEAKER_00Wenn wir schon bei großen amerikanischen Firmen sind, dann lass uns doch über Gott, will ich über SpaceX reden oder reden wir erstmal nur über Cursor.
SPEAKER_01Ja, das hängt ja zusammen. Also Cursor kennen wir hoffentlich alle mittlerweile, ist ein AI-Startup, was mit einem VS-Code-Fork angefangen hat und dann, sag ich mal, er sich immer weiterentwickelt hat, eigene Modelle trainiert hat, jetzt eine Adventic-IDE hat. Sehr cool eigentlich, was sie gemacht haben, vor allem mit den Composer-Modellen. Und vor ein paar Monaten hatten wir, glaube ich, safe auch in den News. Es ging das Gerücht rum, so, hey, SpaceX möchte Cursor kaufen. Und am Anfang war es nur noch so eine, sag ich mal, eine Training-Kollaboration. Aber gestern war in San Francisco, also letzten Freitag war der SpaceX IPO. Also man kann jetzt SpaceX-Aktien kaufen, der auch scheinbar sehr positiv verlaufen ist für alle Aktor. Und gestern war in San Francisco die Cursor Compile. Und die Cursor Compile ist ein jährliches Event von Cursor in Person, gibt keinen Livestream, wo sie halt ein bisschen darüber erzählen, was sie machen wollen, wo es hingeht und neue Features vorstellen, neue Produkte vorstellen. Am gleichen Tag wurde dann aber auch veröffentlicht, dass SpaceX jetzt Cursor erkauft oder acquired zu dem Deal, was sie am Anfang vereinbart haben, welcher 60 Milliarden in All Stock ist. Also Cursor bekommt dann mehr oder weniger SpaceX Stocks zu Aktien im Wert von 60 Milliarden, was kein schlechter Deal ist. Ja, gar kein schlechter Deal ist. Hoffen wir mal, dass die SpaceX-Aktie so bleibt und nicht irgendwie um 150% fällt und dann, dass die in 60 Milliarden nur 10 Milliarden werden, aber wäre trotzdem noch kein schlechter Deal, sage ich mal. Und sie haben es announced, dass sie zusammen Modelle trainieren wollen, die useful sind. Also nicht nur developer-orientiert, sondern wirklich einfach useful AI-Modelle und wäre natürlich ein Cursor oder auch ein Croc integriert. Und jetzt sage ich mal die spannenden Themen von der Cursor Compile, die vielleicht für alle Cursor-Anwender cool sind oder generell. Sie haben ein neues Modell angekündigt, ein größeres Modell als Composer, was sie komplett selbst trainiert haben auf 100.000 GPUs zusammen mit SpaceX bzw. auf der XER-Infrastruktur. Und das soll in den nächsten Wochen released werden. Sie haben gesagt, so zwischen 1 und 1,5 Trillionen bzw. Billionen Parameter dann, also ein bisschen größer als die aktuellen Modelle, die sich nutzen. Und dann die interessanten Themen sind, sie haben einen GitTab-Konkurrenten vorgestellt mit Origin, was eine Agent-Native Git-Plattform sein soll. Komplett neu aufgebaut auf, sag ich mal, neuen Technologien, die mit den ganzen Anforderungen von Agents halt besser klarkommen. Das heißt, sie haben High Performance mit irgendwie 22 Commits pro Sekunde auf einem Repository haben. Ja, schon krass. Haben trotzdem fully Git-Compatible, also soll, so wie ich es verstanden habe, als 1 zu 1-Replacement relativ einfach funktionieren. Aber sie wollen auch ganz viel um außenrum halt bauen, was Comments angeht, wie ich Agents integrieren kann ins Review, wie ich Merch-Konflikte ganz einfach lösen kann. Alles halt, was, sag ich mal, eher mehr agentenfreundlich wird. Aktuell gibt es nur eine Waitlist. Kann man sich einschreiben auf cursor.com slash originist. Man braucht allerdings seine Work-E-Mail. Also wenn man versucht, mit der normalen G-Mail sichern zu melden, dann geht es leider nicht. Bin auf jeden Fall gespannt. Es wird gebaut von den CrabTile-Menschen. CrabTile war ein Startup, das Cursor Acquired hat vor ein paar Monaten, die so on top of Git gebaut haben und Stacked-Commits dann sozusagen auf GitHub dazugefügt haben. Klingt auf jeden Fall interessant. Ich bin mal gespannt, was dabei rumkommt. Und dann das andere, was sie noch angekündigt haben, es gibt eine Cursor Mobile App. Also Cursor hat ja zu der IDE auch Cloud Agents und jetzt soll es eine Mobile App geben, wo man ganz easy mit ihnen zusammenarbeiten kann, beziehungsweise auch so ähnlich wie bei Cloud Code oder Codex dann auf seinem lokalen PC was starten kann und dann von seiner App aus das mehr oder weniger steuern kann. Genau. Also bleibt auf jeden Fall spannend. Vielleicht haben wir mit Cursor plus SpaceX jetzt einen vierten Akteur, sag ich mal, der sich da vorne mit rumbewegt, was definitiv gut ist. Mehr Konkurrenz ist immer gut. Vielleicht ist dann Claude Fable auch irgendwann nicht mehr zu dangerous und man kann es nutzen.
SPEAKER_00Ja, also SpaceX wirkt irgendwie so wie die einzig profitable, also ist ja nicht mal profitable, aber die einzig gut laufende Firma von Elon Musk, mit der er jetzt einfach alle anderen Sachen aufkauft, die ihm so irgendwie liegen. Nachdem er ja erst irgendwie XAI da reingeschmissen hat und jetzt irgendwie sie da können.
SPEAKER_01Das war ja erst Twitter zu X, dann X inside XAI, XAI inside SpaceX und vielleicht gibt es bald X Tesla. Oder auch nicht.
SPEAKER_00Ja, das ist wie so eine Matroschka-Puppe, wo du quasi immer so zwei mehr rausnehmen musst, um die Firma dann zu finden.
SPEAKER_01Ja, ich meine, es hat ihn letzten Freitag zum ersten Billionär auf der Welt gemacht.
SPEAKER_00Ja, ja, traurig, aber, was soll man sagen? Abgefahren. Aber ich meine, ich finde es, es ist ja trotzdem ein krasser Indikator dafür, dass da dieser Need da ist. Also ich meine, natürlich hat SpaceX jetzt mit dem IPO genug irgendwie Cash in Form von Stock, aber sie machen das ja auch nicht aus Juxe und Tolerei. Also sie scheinen da ja schon irgendwie den Markt zu sehen und sie haben das ja auch, ich glaube, in der Pressemitteilung von SpaceX dann so beschrieben, wie groß sie diesen Markt halt irgendwie eigentlich einschätzen und dass dafür diese 60 Milliarden halt eigentlich so ein Tropfen irgendwie sind. Und dass sie halt schon sagen, naja, wir sind ja eigentlich in einer guten Position. Wir haben ja auch in den letzten paar Wochen immer mal wieder gehört, dass XAI SpaceX super viel Compute-Power irgendwie gerade ausmietet an Entropic und an Google, glaube ich, sogar auch, oder? Nee, nicht Google, an Entropic und wer war der andere? Also Cursor auf jeden Fall und sonst weiß ich es nicht. Ja, und da halt im Prinzip ja brachliegende Kapazitäten hat. Und wenn sie jetzt quasi mit Cursor ein Produkt ins Haus bekommen, wo sie das selber nutzen können, um irgendwie was damit zu bauen, ist ja für Cursor und für Exer ja eigentlich nur cool.
SPEAKER_01Ja, ich glaube, das Einzige, was so ein bisschen schwierig ist, ich habe das gestern gesehen, Das durch die Aktienbewertung ist SpaceX jetzt aktuell Platz vier oder fünf der größten Unternehmen. Und die ersten vier sind halt Nvidia, Alphabet, Apple, Microsoft und dann wird da SpaceX aktuell gelistet, je nachdem, wo die Aktie steht. Und alle von den ersten vier haben halt über 100 Milliarden US-Dollar Net Income, also Billion in US-Dollars. Und SpaceX hat halt fünf Milliarden Negativ Net Income. Oh, das ist halt. Ja. Aber es ist auf jeden Fall eine spannende Zeit und mich freut es ganz sehr für die ganzen Cursor-Menschen.
SPEAKER_00Ja, ich habe es hier gerade wieder gefunden. Also es sind tatsächlich Google und Entropic, die beide bei SpaceX Compute gerade kaufen, für fast zwei Milliarden im Monat kombiniert. Ja, das ist auch ein gutes Geschäftsmodell. So, wenn man einfach sehr früh viel Hardware gekauft hat oder sich Kapazität gesichert hat, die man dann weiter vermieten kann. Nice. Wenn wir schon über Google Hardware und AI sprechen, können wir auch noch ein bisschen über Apple Intelligence sprechen. Da war ja letzte Woche erst, es fühlt sich alles so. Es ist so viel passiert in den letzten paar Tagen. Letzte Woche war WWDC und Apple hat erwartungsgemäß vorgestellt, dass sie ein neues Siri gebaut haben und das mit Hilfe von Google. Und das war im Prinzip auch schon alles, was sie so in der Keynote dazu gesagt haben. So, ja, wir haben das mit Google gemacht und jetzt ist es ja irgendwie schöner, besser, weiter höher. Nach der Keynote hat Apple noch einen dedizierten Tech-Talk dazu gehalten, der nur in Person war, mit eingeladenen Journalisten on the record, aber halt eben nicht recorded. So, von daher müssen wir uns so ein bisschen die einzelnen Details zusammenpicken, was da so verschiedene Plattformen zu veröffentlicht haben. Ich habe so ein paar Einzelpunkte rausgesucht, die ich am interessantesten fand, aber wir können ja die einzelnen Reports auch nochmal verlinken. Also, die Server für Apple Intelligence stehen bei Google in den Rechenzentren, sind Stand heute noch nicht ganz konform mit den Anforderungen, die Apple eigentlich so an Private Cloud Compute hat, aber sie gehen davon aus, dass sie so bis Ende des Sommers, Ende des Jahres, also wahrscheinlich bis das iOS oder macOS-Release dann kommt, dass sie damit dann quasi d'accord sind. Alle Modelle wurden auf Apple Silicon trainiert und mit Gemini-Modellen nachgeschärft. So refined, haben sie im Englischen gesagt. Das war so ein bisschen unklar in der Struktur. So, was genau heißt das jetzt technisch? Da wollten sie dann nicht so ganz genau drauf eingehen. Zwar auf Apple Silicon trainiert, aber läuft auch auf Nvidia GPUs, meinte der Modell. Kommen wir gleich dazu, was sie eigentlich so an einzelnen Modellen vorgestellt haben. Auch das war ja nicht so ganz explizit in der Keynote genannt, aber unter machine Learning.apple.com, was ja so deren Anlaufstelle für auch die ganzen Paper, die sie veröffentlichen und sowas ist, haben sie ihre neuen Foundation-Modelle jetzt alle aufgelistet. Es gibt AFM, also sie heißen alle Apple Foundation Model, AFM Core, das ist das neue On-Device-Modell, das kleinste Modell, was im Prinzip das bestehende On-Device Modell, was es ja schon gab, ablöst. Und dann neu gibt es jetzt AFM Core Advanced, auch ein On-Device-Modell, aber mit so einer Sparse-Architecture, also nicht alle Parameter gleichzeitig aktiviert. Es sind wohl insgesamt 20 Milliarden Parameter. Und was sie damit machen, ist, sie laden nie das ganze Modell in den Arbeitsspeicher. Sie machen im Prinzip, aktivieren sie nur so ein Subset von den Parametern und laden dann auch nur diese Parameter in den RAM. Und das soll ihnen quasi erlauben, dieses 20 Milliarden Parameter-Modell auch on Device auf kleineren Geräten, also kleiner heißt in dem Fall Geräte mit nur in Anführungszeichen 12 Gigabyte RAM, auch ausführen zu können. Ohne dass sie da mobil deinen RAM oder deinen Akku, das ist ja auch so ein Constraint unterwegs, dass sie den dann wegbrennen. Und das gab es, glaube ich, so noch nicht. Philipp, kuriere mich da gerne, aber so dieses, wir laden nicht mal das ganze Model in den RAM, sondern machen das vorher auf Grundlage des Prompts, schauen wir so, welche Teile wir aktivieren und lassen den Rest dann einfach auf der SSD liegen. Haben wir sowas schon mal gehört? Ich wäre vorsichtig.
SPEAKER_01Also ich bin mir sicher, da gibt es irgendwelche Papers dazu. Ich weiß auch, dass Lama CPP sowas ähnliches mal gemacht hat oder hatte, dass du die Layer zwar nach und nach mehr oder weniger von deinem Flash-Storage, sag ich mal, in den Memory dann geladen hast, wenn sie genau gebraucht würden. Klingt auf jeden Fall interessant. Und wäre cool, wenn es, wenn, sag ich mal, du dadurch die Performance von einem besseren, größeren Modell auf deinem Smartphone bekommst und der das dynamisch, sag ich mal, mehr oder weniger hin und her ladet. Zusätzlich aber interessant ist ja trotzdem, dass brauche ich ja dieses 20 Milliarden Parametermodell auf meinem iPhone, was ja an sich auch mal grob gesagt einfach 20 GB sind, ne? Mindestens. Das heißt, es bleibt auch spannend abzuwarten, ob neue iPhones dann auch direkt mit mehr Default-Speicher kommt oder wohin das geht. Und das größte Problem, was ich gehört habe von den Leuten, die Beta getestet haben, war vor allem die, also man kann ja jetzt sein iPhone, Mac, wie auch immer, indizieren lassen mit Embeddings. Und auch generell, dass jedes AI-Usage extrem viel Batterie zieht. Und selbst wenn du dieses, sag ich mal, große Modell irgendwie klein in Memory bekommst, hast du ja trotzdem die extreme Compute, die du brauchst. Und ob das dann so erfolgreich wird, bleibt abzuwarten.
SPEAKER_00Ja, schauen wir mal. Du hast recht, also auch Lama CPP hat sowas gemacht. Ich glaube, der große Unterschied ist einfach, dass sie das halt nur einmalig machen. Also in dem Moment, wo quasi der Prompt kommt, wird einmalig das komplette Subset irgendwie ausgewählt und das in den Ramgeladen und danach halt nicht mehr dieses Hin- und Her.
SPEAKER_01Ja, ich glaube, du ist was definitiv irgendwie. Ja, du hast bestimmte Trade-offs am Ende, also bei der Performance und was ist, wenn du, ich weiß nicht, eine Follow-up-Frage hast und die dann irgendwie eine andere Richtung geht.
SPEAKER_00Eine ganz andere Richtung geht, ja, genau. Das bleibt abzuwarten. Sie haben natürlich auch Cloud-Modelle vorgestellt. Es gibt AFM Cloud, was so ihr Default-Model sozusagen ist, für alles, was auf dem Server läuft. Und dann im Prinzip mit Private Cloud Compute, mit diesem World Knowledge Graph, den sie da vorgestellt haben, also das war ja schon länger bekannt, dass Apple auch einen eigenen Suchindex aufbaut. Das ist im Prinzip das, dieses World-Knowledge-Ding, was sie damit aufgebaut haben, was dann im Prinzip das Model unterstützt. Sie haben Cloud-Image vorgestellt für diese ganzen Build-Feature, die sie ja auch gezeigt haben in der Keynote. Und es gibt Cloud Pro, das größte Modell, von dem sie behaupten, es ist so mit Gemini Frontier-Modellen vergleichbar. Wie gesagt, da gibt es noch keine Benchmarks oder genauere Vergleiche. Aber das ist das, was halt so auch scheinbar ausschließlich auf Nvidia GPUs läuft. So. Mit der Grund, warum es dann halt auch bei Google läuft. Wir haben schon darüber gesprochen, irgendwie 12 GB RAM und du brauchst irgendwie einen M3 oder einen M4-Prozessor, um das alles zu nutzen. Also auch schon ein sehr harter Cut-Off im Vergleich zu wie lange iPhone oder macOS-Hardware sonst irgendwie unterstützt wird. Was ich aber eigentlich am interessantesten fand an dieser Diskussion, ist, dass es ein cooles Beispiel war für synonym mittlerweile eigentlich Model-Bezeichnungen und Produktbezeichnungen irgendwie einhergehen. Also als ihr da auf der Bühne stand und haben gesagt, naja, wir nutzen jetzt irgendwie Gemini, hat wahrscheinlich Otto Normalverbraucher irgendwie beim Zuhören gedacht, naja, Gemini, das ist ja dieser Google-Assistant, so den kenne ich, der kann mir Bilder machen, der kann mir irgendwie meine Planung machen, der kann in meinen Dokumenten arbeiten. Aber dass natürlich der Gemini Assistant so nicht in Apple jetzt irgendwie drin ist, sondern halt irgendwie das Gemini-Modell und vielleicht auch gar nicht das Modell selbst, sondern sie haben halt nur das Modell genommen, um ihr eigenes Modell File zu tunen, zu verbessern, wie auch immer sie das gemacht haben. Schwamm drüber. Aber das ist, glaube ich, was, wo man in Zukunft so ein bisschen lernen muss, da genauer hinzuhören oder genauer zu verstehen, was da eigentlich drunter liegt. Also auch, in der Diskussion, die wir am Anfang hatten, man spricht irgendwie über Fable 5, aber dass man damit vielleicht gar nicht zwangsläufig das Modell meint, weil das Produkt hintendran noch ganz andere Entscheidungen für dich trifft und ein anderes Routing macht und je nachdem du bei einem anderen Modell physisch sozusagen landen kannst und andere Tools enabled oder disabled sind, das ist glaube ich so ein ganz interessanter Trend, der zwar irgendwie schon immer da war, aber jetzt irgendwie immer entscheidender wird.
SPEAKER_01Ja, bleibt spannend. Ich freue mich auf jeden Fall auf die neue Bildbearbeitungs-EA-Features. Dass man noch besser Objekte entfernen kann.
SPEAKER_00Ungelogen, ich hebe seit Jahren, weiß nicht, wahrscheinlich schon seit zehn Jahren, auch so Bilder auf, die grottig schlecht sind, weil ich mir denke, so irgendwann müssen wir ja compute-mäßig weit genug sein, dass du halt sagen kannst: so ja, dieser Shot von meinem Kind oder von einem Verwandten, von dem ich nicht viele Bilder habe oder ein guter Freund, keine Ahnung, der ist zwar so schlecht, aber in ein paar Jahren, da drückst du halt irgendwie einen Button und das ist halt ein gutes Foto. Cool. Cool, wenn wir jetzt endlich irgendwie da sind. Yes. Das war es auch schon wieder. Mehr habe ich gar nicht dabei. Hast du noch was, Philipp? Dann ist das ja eine ordnungsgemäße, knapp 30 Minuten Folge. Ich bin stolz auf uns. Haben wir gut gemacht, auch ohne Dennis und Fabi. Ich wollte noch, wir haben uns ja in Las Vegas gesehen, auf der Klau Texton, weil wir gerade über Google Rechenzentren und wurde jetzt das Apple-Zeug sage, ich wollte noch ganz kurz was zeigen. Mein Lieblingsnext-Merch, den ich mitgenommen habe, ist hier dieses kleine Google TPU-Rack aus Lego. Ich weiß gar nicht, ob man das jetzt so hat. Ja, also ich hatte das nicht. Da, ja. Aber warte. Jetzt kommt, du hast doch noch den Chip irgendwo rumliegen. Ja. Ich habe ein Original-TPU-V4, wie auch immer. Das ist natürlich, das ist schon ein bisschen cooler als Air Lego, ob die decommissioned wurde. Was ist das nebendran? Das sieht doch auch aus wie ein Chip. Ja, das ist ein AEWS Stranium-Chip. Ja. Also sammeln wir jetzt einfach Chips oben im Regal. Ja. Ich kann auch ein paar alte Pentiums beisteuern, wenn du das nicht. Nee, nee. Sonst war was, es soll schon was Besonderes sein. Oh, Schatz fired für Inter hier. Wunderbar. Dann, Philipp, danke dir für die Zeit. Ich weiß nicht, wann wir uns das nächste Mal sehen. Vielleicht sehen wir uns auf der Programmierkon. Ansonsten seht ihr wahrscheinlich hier in zwei Wochen erstmal wieder Fabio und Dennis, insofern sie wieder da sind. Ansonsten spreche ich nochmal ein. Hat mir Spaß gemacht, war cool. Bis dann, Philipp. Ciao, ciao.