Computerhaus Quickborn

Hugging Face rekonstruiert DeepSeek R1​

Geht’s um Open Source, will Hugging Face keine Abstriche machen.Tada Images | shutterstock.com Das chinesische KI-Startup DeepSeek AI und sein KI-Modell R1 sind in aller Munde. Nicht nur, weil das Large Language Model (LLM) der Chinesen ohne Einschränkungen kommerziell genutzt werden kann. Nun haben die KI-Experten von Hugging Face ein neues Projekt angekündigt, in dessen Rahmen sie DeepSeek R1 rekonstruieren wollen – allerdings in vollständig quelloffener Form. Open-R1 – das bessere DeepSeek R1? „Der Release von DeepSeek R1 ist ein Segen für die Community, aber nicht vollständig transparent: Zwar sind die Modellgewichtungen öffentlich verfügbar, die Datensätze und der Code, die genutzt wurden, um das Modell zu trainieren, aber nicht“, konstatieren Hugging-Face-Experten im Blogbeitrag zum Open-R1-Projekt, der weitere, technische Details zur geplanten Umsetzung enthält. Aus Sicht von Hugging Face blieben mit Blick auf die Veröffentlichung von DeepSeek R1 im Wesentlichen drei Fragen offen: Wie wurden die Reasoning-spezifischen Datensätze kuratiert? Welche Hyperparameter funktionieren am besten und welche Unterschiede gibt es zwischen den verschiedenen Modellfamilien und Skalierungsebenen? Welche Kompromisse wurden beim Modelltraining mit Blick auf Rechenleistung und Daten gemacht? Das Ziel von Open-R1 sei es, diese fehlenden Teile zu ergänzen, damit auf dieser Grundlage ähnliche oder bessere Modelle entstehen könnten: „Mit Open-R1 wollen wir Transparenz darüber schaffen, wie Reinforcement Learning das Reasoning von KI-Modellen vorantreibt und der Open-Source-Community entsprechende, reproduzierbare Insights zur Verfügung stellen“, stellen die Hugging-Face-Autoren in Aussicht. Open R1, an open attempt by @huggingface to repro DeepSeek R1 training, is the most interesting and potentially impactful open source project in the world today(link in reply) pic.twitter.com/fjCiOVSA1K— Jared Palmer (@jaredpalmer) January 27, 2025 Sie wollen weitere interessante Beiträge zu diversen Themen aus der IT-Welt lesen? Unsere kostenlosen Newsletter liefern Ihnen alles, was IT-Profis wissen sollten – direkt in Ihre Inbox! 

Hugging Face rekonstruiert DeepSeek R1​ Geht’s um Open Source, will Hugging Face keine Abstriche machen.Tada Images | shutterstock.com Das chinesische KI-Startup DeepSeek AI und sein KI-Modell R1 sind in aller Munde. Nicht nur, weil das Large Language Model (LLM) der Chinesen ohne Einschränkungen kommerziell genutzt werden kann. Nun haben die KI-Experten von Hugging Face ein neues Projekt angekündigt, in dessen Rahmen sie DeepSeek R1 rekonstruieren wollen – allerdings in vollständig quelloffener Form. Open-R1 – das bessere DeepSeek R1? „Der Release von DeepSeek R1 ist ein Segen für die Community, aber nicht vollständig transparent: Zwar sind die Modellgewichtungen öffentlich verfügbar, die Datensätze und der Code, die genutzt wurden, um das Modell zu trainieren, aber nicht“, konstatieren Hugging-Face-Experten im Blogbeitrag zum Open-R1-Projekt, der weitere, technische Details zur geplanten Umsetzung enthält. Aus Sicht von Hugging Face blieben mit Blick auf die Veröffentlichung von DeepSeek R1 im Wesentlichen drei Fragen offen: Wie wurden die Reasoning-spezifischen Datensätze kuratiert? Welche Hyperparameter funktionieren am besten und welche Unterschiede gibt es zwischen den verschiedenen Modellfamilien und Skalierungsebenen? Welche Kompromisse wurden beim Modelltraining mit Blick auf Rechenleistung und Daten gemacht? Das Ziel von Open-R1 sei es, diese fehlenden Teile zu ergänzen, damit auf dieser Grundlage ähnliche oder bessere Modelle entstehen könnten: „Mit Open-R1 wollen wir Transparenz darüber schaffen, wie Reinforcement Learning das Reasoning von KI-Modellen vorantreibt und der Open-Source-Community entsprechende, reproduzierbare Insights zur Verfügung stellen“, stellen die Hugging-Face-Autoren in Aussicht. Open R1, an open attempt by @huggingface to repro DeepSeek R1 training, is the most interesting and potentially impactful open source project in the world today(link in reply) pic.twitter.com/fjCiOVSA1K— Jared Palmer (@jaredpalmer) January 27, 2025 Sie wollen weitere interessante Beiträge zu diversen Themen aus der IT-Welt lesen? Unsere kostenlosen Newsletter liefern Ihnen alles, was IT-Profis wissen sollten – direkt in Ihre Inbox!

Hugging Face rekonstruiert DeepSeek R1​

Geht’s um Open Source, will Hugging Face keine Abstriche machen.Tada Images | shutterstock.com Das chinesische KI-Startup DeepSeek AI und sein KI-Modell R1 sind in aller Munde. Nicht nur, weil das Large Language Model (LLM) der Chinesen ohne Einschränkungen kommerziell genutzt werden kann. Nun haben die KI-Experten von Hugging Face ein neues Projekt angekündigt, in dessen Rahmen sie DeepSeek R1 rekonstruieren wollen – allerdings in vollständig quelloffener Form. Open-R1 – das bessere DeepSeek R1? „Der Release von DeepSeek R1 ist ein Segen für die Community, aber nicht vollständig transparent: Zwar sind die Modellgewichtungen öffentlich verfügbar, die Datensätze und der Code, die genutzt wurden, um das Modell zu trainieren, aber nicht“, konstatieren Hugging-Face-Experten im Blogbeitrag zum Open-R1-Projekt, der weitere, technische Details zur geplanten Umsetzung enthält. Aus Sicht von Hugging Face blieben mit Blick auf die Veröffentlichung von DeepSeek R1 im Wesentlichen drei Fragen offen: Wie wurden die Reasoning-spezifischen Datensätze kuratiert? Welche Hyperparameter funktionieren am besten und welche Unterschiede gibt es zwischen den verschiedenen Modellfamilien und Skalierungsebenen? Welche Kompromisse wurden beim Modelltraining mit Blick auf Rechenleistung und Daten gemacht? Das Ziel von Open-R1 sei es, diese fehlenden Teile zu ergänzen, damit auf dieser Grundlage ähnliche oder bessere Modelle entstehen könnten: „Mit Open-R1 wollen wir Transparenz darüber schaffen, wie Reinforcement Learning das Reasoning von KI-Modellen vorantreibt und der Open-Source-Community entsprechende, reproduzierbare Insights zur Verfügung stellen“, stellen die Hugging-Face-Autoren in Aussicht. Open R1, an open attempt by @huggingface to repro DeepSeek R1 training, is the most interesting and potentially impactful open source project in the world today(link in reply) pic.twitter.com/fjCiOVSA1K— Jared Palmer (@jaredpalmer) January 27, 2025 Sie wollen weitere interessante Beiträge zu diversen Themen aus der IT-Welt lesen? Unsere kostenlosen Newsletter liefern Ihnen alles, was IT-Profis wissen sollten – direkt in Ihre Inbox! 

Nach oben scrollen