A közvetlen forrásból származó információk szerint a Baidu új AI modellje
jelentős előrelépést jelent majd a következtetési képességek terén, valamint a multimodális funkciók területén is.
Ez utóbbi lehetővé teszi különböző típusú adatok - szöveg, videó, kép és hang - feldolgozását és integrálását, valamint ezek között a formátumok közötti konverziót.
A vállalat korábban bejelentette, hogy az Ernie 4.5 sorozatot fokozatosan vezetik be az elkövetkező hónapokban,
és június 30-tól hivatalosan is nyílt forráskódúvá teszik.
Ez a lépés jelentős változást jelent a Baidu korábbi stratégiájához képest, amikor Robin Li vezérigazgató még a zárt forráskódú fejlesztést tartotta egyedül járható útnak.
A stratégiaváltást részben a kínai DeepSeek startup sikere ösztönözte, amely olyan AI-modelleket mutatott be, amelyek teljesítménye állításuk szerint vetekszik az amerikai vezető modellekével, ráadásul töredék költséggel működik. A Baidu, bár az egyik első kínai technológiai óriás volt, amely ChatGPT-szerű chatbotot indított, nehezen tudott széles körű elfogadottságot szerezni az Ernie nyelvi modelljének, annak ellenére, hogy teljesítménye állítólag az OpenAI GPT-4-gyel vetekszik.
A verseny tovább fokozódik a szektorban, amit jól mutat, hogy az Alibaba is bejelentette, nyílt forráskódúvá teszi Wan 2.1 nevű, videó- és képgeneráló AI modelljét. Li a legutóbbi elemzői híváson az Ernie 4.5-öt a cég 'valaha volt legjobb modelljének' nevezte, elismerve, hogy a DeepSeek sikere ösztönözte őket a nyílt forráskódú megközelítés felé való elmozdulásra.
A címlapkép illusztráció. Címlapkép forrása: Getty Images