Az Alibaba a kínai újév első napján jelentette be legújabb mesterséges intelligencia modelljét, a Qwen 2.5-t. A vállalat állítása szerint
az új verzió teljesítménye meghaladja a nemrégiben nagy figyelmet kapott DeepSeek-V3 modellét is.
A bejelentés szokatlan időzítése rávilágít a verseny rendkívül intenzívvé válására, amely a mesterséges intelligencia piacán alakult ki - a DeepSeek startup látványos előretörése nemcsak a külföldi, de a hazai versenytársakat is lépéskényszerbe hozta.
Az Alibaba felhőszolgáltatási részlegének WeChat-fiókján közzétett közlemény szerint
a Qwen 2.5-Max szinte minden téren felülmúlja a GPT-4, a DeepSeek-V3 és a Llama-3.1-405B modelleket.
(ezzel az OpenAI és a Meta legfejlettebb, nyílt forráskódú AI-modelljeire utaltak).
A DeepSeek új modelljei komoly visszhangot váltottak ki a technológiai szektorban: a startup állítólagosan alacsony fejlesztési és üzemeltetési költségei miatt több befektető is megkérdőjelezte az amerikai vezető AI-cégek magas kiadásait, ami a technológiai részvények árfolyamának bezuhanásához vezetett hétfőn, élen az Nvidiával.
A DeepSeek sikere a kínai versenytársakat is saját modelljeik fejlesztésére ösztönözte. A TikTok tulajdonosa, a ByteDance például két nappal a DeepSeek-R1 megjelenése után frissítette saját AI-modelljét, a cég közlése szerint új modelljük az AIME tesztben - amely az AI-modellek komplex utasítások megértését és végrehajtását méri - felülmúlta az OpenAI GPT-4 modelljét. Ez hasonló a DeepSeek korábbi állításához, miszerint R1 modelljük több teljesítménymérő tesztben is felveszi a versenyt az OpenAI legújabb modelljével.
Az Alibaba mostani bejelentésére a befektetők is reagáltak,
6,7 százalékos pluszban zárta a tegnapi kereskedést a részvény.
A címlapkép illusztráció. Címlapkép forrása: Getty Images