Modelet e mëdha gjuhësore, si ato që mundësojnë bisedat me Gemini ose ChatGPT, po shfaqin disa tipare të pakëndshme, si “mendimi i tepërt” para se të japin një përgjigje. Modelet e avancuara, si OpenAI o1 dhe DeepSeek R1, janë trajnuar për të vënë në dyshim logjikën e tyre dhe për të kontrolluar përgjigjet, por kur ky proces zgjat shumë, cilësia e përgjigjeve fillon të bie.
Jared Quincy Davis, themelues dhe CEO i Foundry, shpjegon për Business Insider se “sa më gjatë që ai mendon, aq më shumë ka gjasa që ai të bëjë një gabim sepse ngec”. Ai e krahasoi këtë me një student që kalon orë të tëra duke u ngatërruar në pyetjen e parë të një testi, duke bllokuar procesin e mendimit dhe duke e bërë më të vështirë të arrihen përgjigje të sakta.
Për të adresuar këtë çështje, Davis, së bashku me studiues nga Nvidia, Google, IBM, MIT, Stanford, DataBricks dhe institucione të tjera, ka prezantuar një kornizë me burim të hapur të quajtur Ember. Kjo kornizë besohet të paralajmërojë fazën tjetër të zhvillimit të modeleve të mëdha gjuhësore, duke mundësuar një qasje më të mirë për kontrollin e procesit të mendimit të modeleve, transmeton Telegrafi.
Disa ekspertë, si Jensen Hwang, e kundërshtojnë këtë qasje, duke theksuar se modelet që kërkojnë më shumë kohë për të dhënë përgjigje më të qëllimshme mund të përfaqësojnë të ardhmen e përmirësimit të performancës. Sidoqoftë, ekipi i Ember po avancojnë metodën e Davis, duke përfshirë përdorimin e sistemeve të komplikuara në të cilat çdo pyetje do të kërkonte një kombinim të modeleve të ndryshme, me kohë të ndryshme mendimi dhe optimizim për secilën pyetje.
Aktualisht, përdoruesit zgjedhin një model të vetëm për të marrë përgjigje (si ChatGPT 4), por Davis parashikon që ky model nuk do të jetë i përhershëm. Kompanitë e AI po punojnë për të arritur rezultate më të mira duke përdorur strategji më komplekse, duke drejtuar pyetje përmes një rrjeti modelesh me kohë të ndryshme dhe performancë të përshtatur për çdo pyetje.
Davis e krahasoi këtë proces me inxhinierinë kimike, duke theksuar se është një fushë shkencore e re që do të kërkojë një qasje të re dhe më të avancuar në përdorimin e inteligjencës artificiale. Kjo qasje e re mund të jetë veçanërisht e rëndësishme për agjentët AI që do të kryejnë detyra pa ndërhyrje njerëzore. /Katror.info
Përgatiti:
