A kínai DeepSeek előrehozza az R2 nevű új modelljének bevezetését, amelyet eredetileg májusra terveztek. A vállalat azt reméli, hogy az új modell jobb kódolási képességekkel rendelkezik majd, és az angol mellett más nyelveken is képes lesz következtetések levonására.
A cég januárban bemutatott R1 modellje már bizonyított: kevésbé erős Nvidia chipekkel építették, mégis felvette a versenyt az amerikai technológiai óriások több százmilliárd dolláros fejlesztéseivel. A modell bejelentése több mint 1ezer milliárd dolláros értékvesztést okozott a globális részvénypiacokon.
A DeepSeek sikere Liang Wenfeng alapító vezetési stílusának is köszönhető. A milliárdos üzletember, aki korábban kvantitatív fedezeti alapjával szerzett hírnevet, szakított a kínai technológiai ipar hagyományos, hierarchikus felépítésével. Cége inkább kutatólaboratóriumként működik, ahol a fiatal szakemberek és gyakornokok is jelentős felelősséget kapnak.
A vállalat sikerének kulcsa a költséghatékony AI architektúra. Olyan technikákat alkalmaznak, (pl. Mixture-of-Experts/MoE és multihead latent attention, MLA), amelyek jelentősen csökkentik a számítási költségeket. A Bernstein elemzői szerint a DeepSeek árazása 20-40-szer kedvezőbb, mint az OpenAI hasonló modelljeié.
A kínai kormány lelkesen támogatja a DeepSeeket, amit jól mutat, hogy már legalább 13 városi önkormányzat és 10 állami energetikai vállalat integrálta rendszereibe a cég modelljét. Ugyanakkor nyugati országok, köztük Dél-Korea és Olaszország, adatvédelmi aggályokra hivatkozva eltávolították a DeepSeek alkalmazásait nemzeti app store-jaikból.
A vállalat legnagyobb kihívása továbbra is a fejlett AI chipekre vonatkozó amerikai exportkorlátozások, amit maga Liang is elismert egy korábbi interjúban.
A mi problémánk sosem a finanszírozás volt, hanem a csúcskategóriás chipekre vonatkozó embargó
- nyilatkozta tavaly júliusban.
A címlapkép illusztráció. Címlapkép forrása: Getty Images