Huawei Ascend 910C: Ein Schritt zur Unabhängigkeit von Nvidia in der KI?
Dieser Blogartikel wurde automatisch erstellt (und übersetzt). Er basiert auf dem folgenden Original, das ich für die Veröffentlichung auf diesem Blog ausgewählt habe:
DeepSeek research suggests Huawei’s Ascend 910C delivers 60% of Nvidia H100 inference performance | Tom’s Hardware.
Huawei Ascend 910C: Ein Schritt zur Unabhängigkeit von Nvidia in der KI?
Der Ascend 910C, Huaweis aktualisierte Version des Ascend 910 AI-Prozessors von 2019, rückt in den Fokus. Während seine Fähigkeiten für das Training großer KI-Modelle nicht mehr ausreichen, zeigt er bemerkenswerte Leistungen im Bereich des Inferencing.
Inferencing-Leistung übertrifft Erwartungen
Forschungen von DeepSeek zufolge erreicht der Ascend 910C im Inferencing etwa 60 % der Leistung von Nvidias H100. Dies deutet darauf hin, dass Huawei trotz US-Sanktionen und des eingeschränkten Zugangs zu modernsten Fertigungstechnologien Fortschritte im Bereich der KI-Prozessoren macht.
Die manuelle Optimierung von CUNN-Kernels könnte die Effizienz des Ascend 910C weiter steigern. Die native Unterstützung von DeepSeek für Ascend-Prozessoren und das PyTorch-Repository erleichtern die Konvertierung von CUDA zu CUNN, wodurch die Integration von Huaweis Hardware in KI-Workflows vereinfacht wird.
Herausforderungen beim KI-Training
Obwohl der Ascend 910C im Inferencing überzeugt, bleibt das KI-Training eine Domäne, in der Nvidia weiterhin führend ist. Yuchen Jin von DeepSeek betonte, dass die langfristige Zuverlässigkeit beim Training eine Schwäche chinesischer Prozessoren darstellt.
Die tiefe Integration von Nvidias Hardware und Software-Ökosystem, das über zwei Jahrzehnte entwickelt wurde, stellt eine erhebliche Hürde dar. Während die Inferencing-Leistung optimiert werden kann, erfordern anhaltende Trainingslasten weitere Verbesserungen in Huaweis Hardware- und Software-Stack.
Technischer Einblick
Wie der ursprüngliche Ascend 910 verwendet auch der Ascend 910C ein Chiplet-Packaging. Der Haupt-Compute-SoC umfasst rund 53 Milliarden Transistoren. Während der ursprüngliche Compute-Chiplet des Ascend 910 von TSMC mit der N7+-Fertigungstechnologie (7nm-Klasse mit EUV) hergestellt wurde, wird der Compute-Chiplet des Ascend 910C von SMIC mit der 2. Generation der 7nm-Klasse-Prozesstechnologie (N+2) gefertigt.
Die Zukunft: Transformer-Architekturen und Software-Optimierung
Einige Experten prognostizieren, dass die Bedeutung von Nvidias Software-Ökosystem abnehmen könnte, da sich KI-Modelle auf Transformer-Architekturen konzentrieren. DeepSeeks Expertise in der Optimierung von Hardware und Software könnte die Abhängigkeit von Nvidia erheblich reduzieren und KI-Unternehmen eine kostengünstigere Alternative bieten, insbesondere für Inferencing.
Um jedoch auf globaler Ebene wettbewerbsfähig zu sein, muss China die Herausforderungen der Trainingsstabilität meistern und seine KI-Computing-Infrastruktur weiter verfeinern. Es bleibt abzuwarten, ob Huawei und SMIC die Lücke zu Nvidia vollständig schließen können.
Es stellt sich die Frage, ob der Ascend 910C langfristig eine echte Alternative zu Nvidias Angeboten darstellen kann. Die Antwort wird maßgeblich von den Fortschritten in der chinesischen Chipfertigung und der Entwicklung eines konkurrenzfähigen Software-Ökosystems abhängen.