**Mesterséges intelligencia és emberi intelligencia: A legfejlettebb nyelvi modellek gyengeségei** | Fintech.hu A mesterséges intelligencia (MI) és az emberi intelligencia közötti különbségek folyamatosan napirenden vannak, különösen a legújabb nyelvi mo

A PeakX, a Peak csoport mesterséges intelligencia üzletágának csapata átfogó kutatást végzett a jelenleg legismertebb modellek teljesítményéről. Arra voltak kíváncsiak, hogy valós környezetben milyen eredményeket érnek el szövegértési, matematikai és egyéb tudományterületeken. Az eredmények szemléletesen igazolták azt a hipotézist, hogy az ezekről publikált laboratóriumi benchmark-tesztek gyakran túlzottan optimista képet festenek a modellek képességeiről.
A kutatás keretein belül a nagy nyelvi modelleknek a magyarországi kompetenciamérések során 6., 8. és 10. osztályos tanulók által kitöltött tesztek megoldására volt szükség. A PeakX csapata összesen 70 szövegértési és 70 matematikai feladatot alkalmazott az AI modellek teljesítményének vizsgálatára, emellett történelem, természettudomány és digitális kultúra témakörökkel is kiegészítették a kérdéseket. Az AI modellek válaszait egy objektív pontozási rendszer segítségével értékelték, így biztosítva a pontos és megbízható eredményeket.
A vizsgálat során a következő szempontokat is figyelembe vették:
A PeakX csapata az elemzés folyamán felfedezte, hogy a vizsgált mesterséges intelligencia modellek között markáns különbségek mutatkoznak a szövegértés és a matematikai feladatok megoldása során.
Erősségek és gyengeségek: Az emberi jellem komplexitása mindig is lenyűgöző téma volt. Az erősségek a belső fényünk, amelyek előrevisznek minket a céljaink felé, míg a gyengeségek árnyékot vetnek ránk, emlékeztetve minket arra, hogy tökéletlenek vagyunk. Az erősségek lehetnek a kitartás, az empátia vagy a kreativitás, amelyek segítenek a kihívások leküzdésében. Ezzel szemben a gyengeségek, mint például a türelmetlenség vagy a bizonytalanság, lehetőséget adnak a fejlődésre. Az önreflexió és a tudatosság révén képesek vagyunk felismerni ezeket a tulajdonságokat, és így harmonikusabbá tehetjük életünket.
Összességében megállapítható, hogy bár az érvelő (reasoning) modellek működése lassabb és költségesebb, mégis minden egyes kategóriában jobb teljesítményt nyújtanak, mint a többi típusú modell. Az eredmények arra utalnak, hogy a nagy nyelvi modellek még mindig nem tudják maradéktalanul helyettesíteni az embereket a problémamegoldás és analitikai képességeket igénylő területeken. Különösen a bonyolult matematikai feladatok terén mutatkozik meg a hátrányuk.
A magyarországi kompetenciamérés célja a 6., 8. és 10. évfolyamos diákok tudásának felmérése, amely két alapvető területre összpontosít:
A feladatlapok zárt végű kérdéseket alkalmaznak, amelyek segítségével évfolyamfüggetlen skálán értékelhetjük a tanulók teljesítményét. Ez a megközelítés lehetőséget biztosít a fejlődésük összevetésére, így nyomon követhetjük előrehaladásukat.
A Peak egy forradalmi pénzügyi és technológiai vállalatcsoport, amely a fintech, mesterséges intelligencia és digitális banki megoldások élvonalában helyezkedik el. A cégcsoport különböző ágazatai – mint például a Peak Fintech Solutions, PeakX, Peak Advisory és Peak Media – széles spektrumú szolgáltatásokat kínálnak, a tanácsadástól kezdve a jövő banki termékek fejlesztéséig, egészen az AI-alapú innovációkig. A PeakX, a Peak mesterséges intelligencia szegmense, az intelligens alkalmazások és automatizált rendszerek létrehozására specializálódott, kiemelt figyelmet fordítva az oktatás és a pénzügyi szektor igényeire.