Grupet kryesore të inteligjencës artificiale në botë po e rrisin fokusin e tyre në të ashtuquajturat modele botërore që mund të kuptojnë më mirë mjedisin njerëzor, në kërkim të mënyrave të reja për të arritur “superinteligjencën” e makinerive.
Google DeepMind, Meta dhe Nvidia janë ndër kompanitë që përpiqen të fitojnë terren në garën e AI duke zhvilluar sisteme që synojnë të lundrojnë në botën fizike duke mësuar nga videot dhe të dhënat robotike në vend të vetëm gjuhës.
Nxitja vjen ndërsa lindin pyetje nëse modelet e mëdha gjuhësore – teknologjia që fuqizon chatbot-et e njohura si ChatGPT e OpenAI – po arrijnë një kufi në progresin e tyre.
Rritja e performancës midis LLM-ve të publikuara nga kompani në të gjithë sektorin, të tilla si OpenAI, Google dhe xAI e Elon Musk, është ngadalësuar, pavarësisht shumave të mëdha të investuara në zhvillimin e tyre.
Tregu potencial për modelet botërore mund të jetë i madh, pothuajse sa madhësia e ekonomisë globale, sipas Rev Lebaredian, nënkryetar i Omniverse dhe teknologjisë së simulimit në Nvidia, pasi sjell teknologjinë në domenin fizik, siç janë sektorët e prodhimit dhe kujdesit shëndetësor.
“Cila është mundësia për modelet themelore botërore? Në thelb… 100 trilionë dollarë nëse mund të krijojmë një inteligjencë që mund të kuptojë botën fizike dhe të veprojë në botën fizike”, tha ai.
Modelet botërore trajnohen duke përdorur rrjedha të dhënash të mjediseve reale ose të simuluara.
Ato shihen si një hap i rëndësishëm në shtyrjen përpara të progresit në makinat autonome, robotikën dhe të ashtuquajturit agjentë të AI, por kërkojnë një sasi të madhe të dhënash dhe fuqie llogaritëse për t’u trajnuar dhe konsiderohen një sfidë teknike e pazgjidhur.
Ky fokus në një qasje alternative ndaj LLM-ve është bërë i dukshëm pasi disa grupe të AI-së kanë zbuluar një sërë përparimesh në modelet botërore në muajt e fundit.
Muajin e kaluar, Google DeepMind publikoi Genie 3, i cili gjeneron video kornizë pas kornize dhe merr parasysh ndërveprimet e kaluara.
Më parë, modelet e gjenerimit të videove zakonisht e kanë krijuar të gjithë videon menjëherë, në vend që ta bëjnë hap pas hapi.
“AI mbetet shumë e kufizuar në fushën digjitale”, tha Shlomi Fruchter, bashkëdrejtues i Genie 3 në Google DeepMind.
“Duke ndërtuar mjedise që duken ose sillen si bota reale, ne mund të kemi mënyra shumë më të shkallëzueshme për të trajnuar AI… pa implikimet reale të bërjes së një gabimi në botën reale.”/AP/Katror.info