DeepSeek: Wie ein chinesisches Startup die KI-Welt aufmischt

1. Februar 2025
ℹ️Hinweis zur Quelle

Dieser Blogartikel wurde automatisch erstellt (und übersetzt). Er basiert auf dem folgenden Original, das ich für die Veröffentlichung auf diesem Blog ausgewählt habe:
The Man Behind DeepSeek (Liang Wenfeng) – YouTube.

DeepSeek: Wie ein chinesisches Startup die KI-Welt aufmischt

Im Dezember 2024 sorgte das chinesische Startup DeepSeek für Aufsehen in der KI-Welt. Mit seinem V3-Modell stellte das Unternehmen die etablierten Tech-Giganten in Frage.

Der Aufstieg von DeepSeek

DeepSeek, bis dahin ein eher unbekannter Akteur, demonstrierte mit seinem V3-Modell, dass für Spitzenleistungen im Bereich KI nicht zwingend enorme finanzielle Mittel und Hardware-Ressourcen erforderlich sind. Das Modell, trainiert auf lediglich 2.000 NVIDIA H800 GPUs, übertraf in Bereichen wie Programmierung, logisches Denken und Mathematik viele Top-Modelle. Dies führte zu einer Neubewertung der Strategien in Silicon Valley.

Liang Wenfeng: Das Mastermind hinter DeepSeek

Hinter diesem Erfolg steht Liang Wenfeng, geboren 1985 in der Provinz Guangdong. Schon in jungen Jahren zeigte er ein außergewöhnliches Talent für Mathematik. Nach seinem Studium der elektronischen Informationstechnik an der Zhejiang Universität konzentrierte er sich auf algorithmischen Handel und entwickelte Computerprogramme für schnelle, datengetriebene Entscheidungen an der Börse.

Ein Wendepunkt war das Angebot von Wang Tao, dem Gründer des Drohnenherstellers DJI, als Partner einzusteigen. Liang lehnte ab, da er das transformative Potenzial der KI in anderen Bereichen sah.

Innovation in der Krise

Während der Finanzkrise 2008 erkannte Liang die Möglichkeit, seine Fähigkeiten einzusetzen. Er nutzte Machine Learning, um Marktanalysen schneller und präziser als Menschen durchzuführen. Trotz anfänglicher Schwierigkeiten gelang es seinem Team, Algorithmen zu entwickeln, die verborgene Trends erkannten und akkurate Vorhersagen trafen.

Der Weg zum Erfolg

Im Jahr 2013 gründete Liang zusammen mit Xu Jin Hangzhou Jacoby Investment Management und testete seine KI-basierten Handelsstrategien. Zwei Jahre später folgte Hangzhou HiFlyer Technology, das sich auf die Entwicklung intelligenterer Handelssysteme konzentrierte. Mit der Veröffentlichung des ersten KI-Handelsmodells im Jahr 2016 erzielte das Unternehmen beeindruckende Ergebnisse und verwaltete bis Ende des Jahres über 1 Milliarde Yuan.

Investitionen in Supercomputer

Um seine KI-Trainingssysteme weiter zu verbessern, investierte Liang in den Bau von Supercomputern. 2019 entstand Firefly No. 1 und 2021 Firefly No. 2, ausgestattet mit 10.000 Nvidia A100 GPUs. Firefly No. 2 zeichnete sich nicht nur durch Leistung, sondern auch durch Effizienz aus und senkte den Energieverbrauch erheblich.

Der Fokus auf AGI

Im Mai 2023 wagte Liang den Schritt von der Finanzwelt zur allgemeinen künstlichen Intelligenz (AGI). Mit der Gründung von DeepSeek verfolgte er das Ziel, eine KI auf menschlichem Niveau zu schaffen. Dabei setzte er auf junge Talente und eine offene Unternehmenskultur. DeepSeek V2, ein KI-Modell, das mit GPT-4 Turbo mithalten konnte, aber nur einen Bruchteil der Kosten verursachte, unterstrich diesen Ansatz.

DeepSeek V3: Ein Meilenstein mit begrenzten Ressourcen

Am 26. Dezember 2024 präsentierte DeepSeek DeepSeek V3. Das Besondere: Das Modell wurde mit vergleichsweise einfacher Hardware entwickelt. Trotzdem übertraf es Modelle, die auf deutlich leistungsstärkeren Systemen trainiert wurden. Dies gelang durch innovative Methoden wie FP8 Mixed Precision Training und die Vorhersage mehrerer Wörter gleichzeitig.

Ein Weckruf für die KI-Welt

Der Erfolg von DeepSeek V3 sorgte für Diskussionen in der KI-Community. Experten erkannten, dass intelligente Methoden und effiziente Programme es kleineren Unternehmen ermöglichen, mit großen Tech-Konzernen zu konkurrieren. Alexander Wang, Gründer von Scale AI, bezeichnete den Erfolg von DeepSeek als Weckruf für amerikanische Technologieunternehmen.

Die Entwicklung zeigt, dass Innovation und clevere Ingenieurskunst entscheidend sind, um im KI-Bereich erfolgreich zu sein. Es stellt sich die Frage, ob dies der Beginn einer neuen Ära ist, in der kleinere, agilere Unternehmen die KI-Entwicklung vorantreiben.


Die Kommentare sind geschlossen.