Studiuesit në Universitetin e Kalifornisë Jugore ishin të interesuar nëse një model i madh gjuhësor mund të prodhonte përmbajtje humoristike.
Hulumtimet e mëparshme janë fokusuar në shembuj anekdotikë të LLM-ve që bëjnë shaka me shkallë të ndryshme suksesi. Këta shembuj, ndonëse interesant, nuk shqyrtonin aftësinë e Chat-GPT për të prodhuar humor në mënyra të krahasueshme me njeriun, as nuk hetuan se sa qesharake është Chat-GPT për publikun e gjerë.
Për të krahasuar zgjuarsinë e njerëzve dhe modelin gjuhësor, studiuesit kryen dy teste. Në të parën, ata i kërkuan “Chat-GPT 3.5” të gjeneronte tituj satirikë humoristikë në stilin e “Qepës”, dhe më pas i krahasuan me materialet e publikuara në faqet e kësaj reviste satirike, të shkruara nga humoristë profesionistë.
Njerëzit vlerësuan zgjuarsinë e përgjigjeve, të pavetëdijshëm nëse ato ishin krijuar nga njerëzit apo AI. Rezultatet e provës, të publikuara në revistën PLOS ONE, tregojnë se shakatë e krijuara nga Chat-GPT 3.5 u vlerësuan si më qesharake sesa shakatë e krijuara nga njerëzit. /Katror.info