Für eine korrekte Anzeige der Webseite wird JavaScript benötigt

Reproduktion des „Aha-Moments“ von DeepSeek R1: Reasoning mit GRPO und dem Countdown-Spiel

31.01.2025

Ein Blogartikel über die Reproduktion von DeepSeek R1 mit GRPO und dem Countdown-Spiel.

weiterlesen...

Open-R1: Der Versuch, DeepSeek-R1 zu replizieren und die Geheimnisse des LLM-Reasoning zu lüften

31.01.2025

Das Open-R1 Projekt zielt darauf ab, die Datensätze und Trainingsmethoden hinter DeepSeek-R1 zu rekonstruieren, um Transparenz und Innovation im Bereich der Large Language Model (LLM) zu fördern.

weiterlesen...

Warum Open-Source-KI-Modelle wie DeepSeek die Zukunft sein könnten

31.01.2025

Die wachsende Bedeutung von Open-Source-KI-Modellen und ihre potenziellen Vorteile gegenüber proprietären Lösungen werden untersucht.

weiterlesen...

KI-Exportkontrollen: DeepSeek als Wendepunkt?

31.01.2025

Die Fortschritte von DeepSeek unterstreichen die Notwendigkeit verstärkter Exportkontrollen für KI-Chips nach China, um ein Kräfteungleichgewicht im Bereich der künstlichen Intelligenz zu verhindern.

weiterlesen...

Zero Downtime: Ein Erfahrungsbericht zur PostgreSQL-Versionsaktualisierung

31.01.2025

Ein Team berichtet über seine Erfahrungen bei der Durchführung eines Major Version Upgrades von PostgreSQL, wobei sie eine Downtime von null Sekunden erreichten.

weiterlesen...

Mistral Small 3: Ein neuer Stern am Open-Source-KI-Himmel

30.01.2025

Mistral AI veröffentlicht Mistral Small 3, ein latenzoptimiertes 24B-Parameter-Modell unter Apache 2.0 Lizenz, das mit größeren Modellen konkurriert und eine Alternative zu proprietären Lösungen darstellt.

weiterlesen...

Droht eine Generation von KI-abhängigen Programmierern?

30.01.2025

Künstliche Intelligenz verändert die Art und Weise, wie Software entwickelt wird, doch birgt die zunehmende Abhängigkeit von KI-Tools Risiken für die Kompetenzen und die Unabhängigkeit von Programmierern.

weiterlesen...

Quen 2.5 VL: Ein neues, lokales Vision-Modell für Agentenaufgaben

30.01.2025

Quen hat mit Quen 2.5 VL ein neues Vision-Modell vorgestellt, das sich besonders für Agentenaufgaben eignet und lokal ausgeführt werden kann.

weiterlesen...

Quen 2.5 Max: Ein neuer Konkurrent für DeepSeek V3?

30.01.2025

Das neue Sprachmodell Quen 2.5 Max tritt an, um mit DeepSeek V3 zu konkurrieren, aber kann es die hohen Erwartungen erfüllen?

weiterlesen...

DeepSeek R1: Chinas Antwort auf die KI-Dominanz der USA?

30.01.2025

Die Veröffentlichung des Open-Source-KI-Modells DeepSeek R1 aus China hat die KI-Welt aufgeschreckt und eine neue Runde im globalen Wettrennen um KI-Vorherrschaft eingeläutet.

weiterlesen...

Zurück
Weiter