A GPT 3.5-öt az Microsoft Azure AI szuperszámítógépes infrastruktúráján képezték ki. A nyelvi modell optimalizálásához egy emberi visszajelzéseken alapuló megerősítő tanulási módszert, vagyis az RLHF-et (reinforcement learning from human feedback) alkalmazták. A forradalmi újítást, amely az egyszerűbb kérdések megválaszolása mellett olyan komplexebb feladatokat is teljesít...
Kedves Olvasónk!
A keresett cikk a portfolio.hu hírarchívumához tartozik, melynek olvasása előfizetéses regisztrációhoz kötött.
- Portfolio.hu teljes cikkarchívum
- Kötéslisták: BÉT elmúlt 2 év napon belüli kötéslistái