A kínai mesterséges intelligencia fejlesztések új fejezetet nyitottak a globális technológiai versenyben a DeepSeek R1 modell bemutatásával, amely az OpenAI és a Meta legjobb modelljeivel vetekszik. Az R1 különlegessége, hogy jóval költséghatékonyabb, és egyszerűbb hardveren is képes futni, ami jelentősen csökkenti a mesterséges intelligencia fejlesztéséhez szükséges erőforrásokat.
A modell nyílt forráskódú hozzáférése és alacsony árazású API-ja lehetővé teszi kisebb vállalkozások és kutatók számára is, hogy kihasználják a technológiát, ami új lendületet adhat a kínai AI iparágnak, és egyúttal megkérdőjelezi az amerikai dominanciát a szektorban – ahogy arról összefoglalónkban is írtunk hétfőn.
A DeepSeek R1 bemutatójának időzítése nem véletlen: Donald Trump elnök a múlt héten jelentette be a Stargate Project névre keresztelt, 500 milliárd dolláros MI-beruházási programot.
A kínai vállalat vezérigazgatója, Liang Venfeng provokatív kijelentésével – miszerint az Nvidia grafikus kártyái elméletben könnyen másolhatók – további feszültséget gerjesztett, ami az amerikai technológiai részvények árfolyamának eséséhez vezetett.
A DeepSeek R1 megjelenése rávilágít arra, hogy Kína célja nemcsak az amerikai fölény megkérdőjelezése, hanem az AI iparág újragondolása is.
Elsőre pedig a leggyakrabban letöltött applikációval lépett elő az Apple és az Android alkalmazásboltjaiban is.
A legtöbben azért ugrottak rá, mert jóval olcsóbb alternatíva, mint a ChatGPT, amelynek előfizetői díja 25 dollár felhasználónként, míg a DeepSeek azonosnak tekinthető csomagja 2,2 dollárba kerül havonta.
Ehhez képest az egész világ megfeledkezik a francia fejlesztésű, az EU által is támogatott Mistral AI-ról, ami teljesen ingyenes.
Az európai Mistral AI, az egyik legértékesebb AI-cég a kontinensen, bővítési terveket fontolgat az Egyesült Államokban, és már dolgozik egy Palo Altó-i irodán. A vállalat jelenleg több mint 100 alkalmazottal működik, akiknek többsége még Párizsban dolgozik, míg 20 munkatársuk már az Egyesült Államokban tevékenykedik, akik már a hírek szerint dolgoznak az amerikai expanzión.
A Mistral AI fiatal cég, kevesebb mint két éve működik, mégis azzal büszkélkedhet, hogy hatékonyabb és költségtakarékosabb modelleket fejleszt, amelyek versenyelőnyt jelenthetnek számára a globális piacon.
A cég nemrég partnerségre lépett a Microsofttal és a Capgeminivel, hogy elősegítse a generatív AI technológiák globális elterjedését. A közös munka a testreszabott AI-megoldások fejlesztésére és a Capgemini Intelligent App Factory bővítésére összpontosít a Microsoft Azure platformján. A Mistral AI vezérigazgatója, Arthur Mensch szerint a partnerség célja az, hogy átalakítsák a vállalkozások AI-alapú működését, miközben a technológia gyorsabb és hatékonyabb alkalmazását biztosítják.
Miközben a világ a DeepSeekre figyelt, a teljesen ingyenes elérhető, szöveghossz-korlát nélkül működő, képgenerálóval és más egyéb, a ChatGPT-ből ismerős szolgáltatással is rendelkezik, nem jött ki egy új programozási fejlesztéscsomaggal.
A Mistral AI új nyílt forráskódú AI modellje, a Codestral 25.01-et, amely a kódgenerálás és a Fill-in-the-Middle (FIM) feladatok terén új mércét állított fel – értékelte a hackernoon.com.
A modell 95,3%-os FIM pontosságot ért el, ezzel túlszárnyalva az OpenAI hasonló modelljeit. A technikai előrelépések között szerepel egy fejlett, 256k kontextusablak, amely nyolcszor nagyobb az előző verziókénál, valamint egy újratervezett tokenizer, amely kétszer gyorsabb kódgenerálást tesz lehetővé.
Bár a legtöbb felhasználó a Google-keresések alternatívájaként használja az AI-eszközöket, az iparág egyik legfontosabb mércéje, hogy mennyire hatékony a programozásban az eszköz. Ezért is különösen fontos, hogy
a mostani Mistral-modell különösen erős Python, JavaScript és Java nyelveken, és jelentős javulást mutatott például az SQL és kódszerkesztési feladatok terén.
A Codestral 25.01 kiemelkedő eredményeket ért el a teljesítménymutatók terén: a Python HumanEval teszten 86,6%-os pontosságot produkált, ami 5,5%-os javulás az előző verzióhoz képest, míg a FIM feladatokban 2,6 százalékponttal múlta felül az OpenAI API-ját. A modell hatékony erőforrás-kezelése révén ideális nagyfrekvenciás, alacsony késleltetésű alkalmazásokhoz, például automatizált teszteléshez, keresztprogramozási fordításokhoz és pontos kódkitöltési feladatokhoz.
A rendszer egyelőre nem csatlakozik az internethez, tanított adatbázisokat használ csak. Bár ez sok felhasználó számára csökkentheti a vonzerejét, sok esetben pontosabb vagy hitelesebb válaszokat ad, mint a legnépszerűbb versenytársa, a ChatGPT. Utóbbi esetében már a peak-data problémával küzdenek a fejlesztők: vagyis az internetes, AI-által előállított tartalmak már rontják a válaszok minőségét.
Magyar nyelven is tud a Mistral AI rendszere, bár érezhetően több hibát vét, mint az OpenAI megoldása, az elmúlt hónapokban érdemi fejlesztéseket kapott és sokat javult a szöveggenerálási képessége.
Címlapkép forrása: Portfolio