Der Blick des Kapitalmarkts auf DeepSeek

DeepSeek sorgte in den vergangenen Tagen für Aufsehen und Experten analysieren nun die möglichen Auswirkungen auf die KI-Entwicklung. Von Ben Ritchie*

Das chinesische Unternehmen DeepSeek hat vor Kurzem ein neues KI-Modell auf den Markt gebracht, das den Markt überraschte und zu einem ersten Ausverkauf bei Nvidia und im Technologiesektor führte. Dieses fortschrittliche Modell benötigt deutlich weniger Rechenleistung und kann auch mit weniger hoch entwickelten Chips betrieben werden, was bisherige Annahmen über die Entwicklung von KI in Frage stellt. Die Auswirkungen dieser Innovation erstrecken sich sowohl über den Software- als auch auf den Hardwaresektor in China, den USA und weltweit.

Ist das Wettrüsten vorbei?

Der Ansatz von DeepSeek legt nahe, dass das Training von KI-Modellen nicht unbedingt die modernsten Nvidia-GPUs oder Brute-Force-Trainingsmethoden erfordert. Diese Aussicht treibt die Investitionsausgaben (CAPEX) von US-Hyperscalern an, die sich einen Wettbewerbsvorteil verschaffen wollen. Obwohl es noch zu früh ist, um die genauen Auswirkungen dieser Entwicklung zu bestimmen, besteht die Gefahr, dass diese Unternehmen die Rechtfertigung für zukünftige Ausgaben neu bewerten und ihre Wettbewerbsstrategien überdenken müssen.

Produkte, kein Potenzial

KI-Werkzeuge existieren derzeit als Lösungen, die nach Problemen suchen. Der Schwerpunkt liegt auf der Erhöhung der Anzahl von Grafikprozessoren in fortschrittlichen Clustern, um möglichst leistungsfähige Modelle zu trainieren. DeepSeek hat jedoch einen alternativen Ansatz zur Erstellung komplexer Modelle aufgezeigt, der deutlich weniger anfängliche Rechenleistung erfordert. Dies könnte den Wettbewerb fördern, da mehr Teilnehmer die Möglichkeit haben, maßgeschneiderte KI-Modelle zu entwickeln, was die Kommodifizierung von KI beschleunigen könnte, da die Marktteilnehmer versuchen, durch Produktdifferenzierung und Spezialisierung zu konkurrieren. […]

Performance-Vergleich mit DeepSeek

Performance-Vergleich DeepSeek

Was sind die Fakten und was ist Fiktion?

Überraschend ist, dass China aufgrund des Chip-Embargos weniger leistungsstarke Grafikprozessoren (GPUs) verwendet hat, um seine Modelle auf alternative Weise zu optimieren – etwa durch den Verzicht auf CUDA und eine effizientere Vernetzung von GPU-Clustern. Dies führte zu beeindruckenden Ergebnissen und ist eine der unbeabsichtigten Folgen der Beschränkung Chinas auf nicht mehr führende Technologien.

Viele fortschrittliche Modelle sind seit 2022 an Skalierungsgrenzen gestoßen – die zuvor formulierten Skalierungsgesetze besagten, dass eine Erhöhung der Rechenleistung in der Vortrainingsphase bessere Modelle hervorbringen würde. Dies führte zu bahnbrechenden Fortschritten und einem enormen Verbrauch modernster Chips (hauptsächlich GPUs). Da die Menge an verfügbarem Trainingsdatenmaterial jedoch begrenzt ist, experimentieren Modelle inzwischen mit alternativen Ansätzen zur Weiterentwicklung von KI – darunter auch solche, die weniger rechenintensiv sind und möglicherweise weniger Chips benötigen. Dies hat eine Schwachstelle in einem KI-Markt offenbart, der stark von Rechenleistung und Chipverbrauch abhängig ist.

Was aber wahrscheinlich nicht stimmt, ist die Angabe von Kosten in Höhe von 6 Mio. USD – und DeepSeek stellt das in ihrer eigenen Veröffentlichung klar. Sie erklären dort, dass die angegebenen Kosten nur für den finalen Trainingslauf gelten. Diese Zahl ist also nicht korrekt, aber die Distillation und die Art, wie sie das Modell trainiert haben (Testzeit-Berechnung), dürften tatsächlich mit geringeren Kosten verbunden sein als beispielsweise bei OpenAI.

Sicht der Analysten

[…] Nvidia hat weiterhin enorme Vorteile durch seine Software-Programmiersprache und die Flexibilität seiner GPUs. Doch China hat bewiesen, dass Innovation nicht nur durch brachiale Skalierung, sondern auch durch Optimierung entstehen kann. Das bedeutet jedoch nicht, dass Rechenleistung unwichtig wird – ich gehe davon aus, dass die Investitionen in hyperskalierte Rechenzentren weiterhin hoch bleiben. Zudem könnte laut Nadella sinkende Inferenzkosten zu einer erheblichen Steigerung der Monetarisierung von KI und einer besseren Verfügbarkeit von KI-Anwendungen an der ‚Edge‘ führen. […]

Implikationen für Asien und Global Emerging Markets

Ben Richie

[…] Generell könnte ein sinkender Wettbewerbsvorteil der USA und eine schwindende US-‚Ausnahmestellung‘ förderlich für den Technologiesektor in der Region sein. Wir erwarten jedoch eine schrittweise Verschiebung des Fokus von Hardware hin zu Software, da sich die Anwendungsschicht von KI-Lösungen weiterentwickelt. Falls die Einführung von DeepSeek in die KI-Landschaft eine Neubewertung der US-‚Ausnahmestellung‘ anstößt, könnte dies sowohl für Asien als auch für den Rest der Welt positiv sein. […]

*) Ben Richie ist Head of Developed Market Equities bei abrdn

——————————-

Die neueste BondGuide-Jahresausgabe (Okt 2024) ist erschienen: das Special „Finanzierung im Mittelstand 2024“. Daneben können auch alle weiteren Nachschlagewerke wie Green & Sustainable Finance 2024 (Apr 2024) oder Digitalisierung, Krypto, künstliche Intelligenz 2023 weiterhin als kostenlose e-Magazine bequem heruntergeladen, gespeichert, durchgeblättert oder weitergeleitet werden.

! NEU ! Die neue Jahresausgabe Biotechnologie 2024 (26. Jahrgang!) ist erschienen (Sep. 2024): Die Ausgabe kann wie gewohnt kostenlos als e-Magazin oder pdf heruntergeladen werden.

Bitte nutzen Sie für Fragen und Meinungen Twitter – damit die gesamte Community davon profitiert. Verfolgen Sie alle Diskussionen & News zeitnaher auf twitter@bondguide !