Razvoj umetne inteligence za dekodiranje pasjega lajanja
Raziskovalci z Univerze v Michiganu razvijajo umetno inteligenco, ki v realnem času dekodira pasje lajanje – od pasme do razpoloženja štirinožca. Cilj je izboljšati naše razumevanje psov.
Ekipa je preoblikovala obstoječe računalniške modele, ki so bili usposobljeni na podlagi človeškega jezika, in verjame, da bi napredek v umetni inteligenci lahko revolucioniral naš pogled na živalsko komunikacijo. Po mnenju analitika za umetno inteligenco pa je AI še daleč od prevajalskega orodja.
Sistemi, ki temeljijo na umetni inteligenci, se v raziskavah uporabljajo za razlikovanje odtenkov v tonu glasu, višini tona in naglasu, kar omogoča tehnologije, kot je programska oprema za prepoznavanje govora. Ekipa je ustvarila zvočne posnetke 74 psov, ki lajajo, renčijo in cvilijo. S pomočjo strojnega učenja in teh zvočnih posnetkov bi lahko ugotovili, za katerega psa gre, kateremu spolu in pasmi pripada ter v kakšnem razpoloženju je – ali je agresiven, utrujen ali vznemirjen.
Ena glavnih ovir za razvoj modelov umetne inteligence, ki lahko analizirajo živalske glasove, je pomanjkanje javno dostopnih podatkov. Živali ne proizvajajo zvokov preprosto na ukaz, kar pomeni, da je snemanje in pridobivanje živalskih glasov zahtevno. "Tehnologije AI delujejo dobro le, če jih nahranimo z milijardami besed. V študiji s psi je bilo skupaj približno 17.000 posnetkov pasjih zvokov," razloži analitik. V primerjavi z drugimi modeli umetne inteligence je to majhen nabor podatkov. Kljub temu so bile stopnje prepoznavanja bistveno boljše kot pri prejšnjih metodah, vendar so bile na splošno še vedno precej nizke.
"Prepoznavanje pasjih zvokov je s tem trikom delovalo bistveno bolje kot v prejšnjih študijah," ugotavlja analitik. Zlasti pasmo in situacijo, v kateri se je pes znašel, je bilo mogoče bolje prepoznati. Pri prepoznavanju spola psov pa so bili rezultati slabši.
Kljub napredku so stopnje prepoznavanja še vedno precej nizke, včasih celo blizu naključja. "Še vedno ostaja vprašanje, ali ti človeški podatki za usposabljanje res vodijo k boljšemu razumevanju med ljudmi in psi," dodaja analitik. Pomembna točka je tudi, da psi komunicirajo predvsem neverbalno, veliko informacij se prenaša z gibanjem štirinožcev in ne z lajanjem. "Prav tako je še vedno odprto vprašanje, ali ti človeški podatki za usposabljanje res pomagajo ali bo na koncu vendarle potrebnih več podatkov o psih," še dodaja.
Raziskovalna skupina želi to metodo uporabiti tudi pri ptičjih zvokih, saj je o pticah na voljo veliko več posnetkov kot o psih. Raziskovalci upajo, da bodo tako dosegli boljše rezultate. "Osebno bi se mi zdela zanimiva analiza mačjih posnetkov, saj pravijo, da se mačke učijo zvokov od ljudi in z ljudmi komunicirajo drugače kot med seboj," zaključi analitik, vendar študija o tem še ni načrtovana.