Razumijevanje prirodnog jezika – put do istinske vještačke inteligencije

Share

Vještačka inteligencija (artificial inteligence – AI) je termin koji ćete danas vrlo često čuti. Pametne tehnologije poput mašinskog učenja (machine learning), polako ali sigurno postaju dio svakodnevice, mijenjajući način na koji radimo, živimo i provodimo slobodno vrijeme. Iako njihovo prisustvo možda na prvi pogled i nije toliko očigledno, svaki put kada vam Google search izlista moguće pretrage na osnovu par slova koje ste ukucali ili prepozna uneseni termin uprkos pisanim greškama, svaki put kada koristite softver za prevođenje ili vam Netflix ili Amazon predlože neku novu seriju ili proizvod, iza toga stoje moćni algoritmi koji su sposobni da se usavršavaju i uče koristeći vaše reakcije na ponuđene sadržaje.

Personalni asistenti poput Amazon-ove Alexe, Apple-ove Siri i Windows-ove Cortane, personalizovani marketing, čet-botovi, filteri neželjenih email poruka, detekcija online prevara, predikcija kretanja finansijskog tržišta, rana detekcija raka korišćenjem kompjuterizovane tomografije, samo su neki od primjera primjene pametnih tehnologija. Automobilska industrija se sve više fokusira na proizvodnju inteligentnih automobila, koji bi bili svjesni svoje okoline (integrisanjem u Internet stvari – Internet Of Things), visoko personalizovani u smislu poznavanja potreba i preferenci svoga vlasnika i sposobni za samostalne akcije, poput nezavisnog upravljanja, podešavanja postavki u automobilu na osnovu unutrašnjih i spoljnih parametara, predikcije uslova na putu  i preventivnih akcija u opasnim situacijama.

Međutim, iako se termin AI  koristi dosta često i dosta velikodušno, koliko smo zaista daleko od prave vještačke inteligencije?

Iako su oblasti poput prepoznavanja slika (image recognition i computer vision) i dubokog učenja (deep learning) dosta uznapredovale, jedan neizbježan aspekat potencijalne istinske vještačke inteligencije i dalje ostaje neostvaren, a to je razumijevanje prirodnog jezika.

Oblast vještačke inteligencije koja se bavi ovim problemom je obrada prirodnog jezika (Natural Language processing- NLP). Uzevši u obzir izuzetnu kompleksnost i organsku prirodu prirodnog jezika, NLP predstavlja simbiozu nekoliko disciplina, između ostalog i kompjutacione lingvistike.

Jezik je najkompleksniji oblik ponašanja na planeti. Uzmimo u obzir broj različitih jezika koji postoje, svaki od njih sa specifičnim skupom pravila, dijalekata, kolokvijalizama; različita značenja jezika u zavisnosti od konteksta; jezičke konstrukte kao što su metafora ili sarkazam. Jezik podrazumijeva sposobnost da se razumiju pisane i izgovorene riječi, kao i sposobnost komunikacije u realnom vremenu pisanjem ili izgovaranjem riječi. Bez postojanja jezika, da li bismo bili u stanju da razmišljamo jednako efikasno kao sada? Bez sumnje, jezik je integralni dio ljudske inteligencije.

Kako naučiti mašinu da razumije jezik onako kako ga mi razumijemo?

Personalni asistenti poput Siri su u stanju da prate jednostavne izgovorene ili pisane komande, ali ne i da vode kompleksan i smislen razgovor ili da suštinski razumiju riječi koje koriste. Isto važi i za većinu čet-botova. Veliki broj danas postojećih rješenja se bazira na statističkoj obradi teksta, što podrazumijeva konverziju teksta u strukturirane podatke i obradu pojedinačnih riječi, pri čemu se u potpunosti ignorišu značenje i kontekst jezika. Logika koja stoji iza ovih metoda je čisto mehanička, jer tekst tretira kao bilo koje druge podatke, uzimajući za pretpostavku da će se u dovoljno velikom korpusu naći sve moguće kombinacije riječi na osnovu kojih bi se onda mogli prepoznati uzorci u jeziku, što u realnim situacijama najčešće nije slučaj.

U pokušaju da se pronađe drugačiji pristup, došlo je do izdvajanja pod-discipline NLP-ja koja se bavi razumijevanjem jezika – Razumijevanje prirodnog jezika (Natural language understanding- NLU). Ova oblast s razlogom spada u AI-hard probleme. NLU pristupa problemu primjenom nekolicine principa iz oblasti kompjutacione lingvistike da bi se izvršila dekompozicija teksta na fundamentalne ideje i veze kojima su one povezane da bi se izgradilo značenje.

Aplikacije NLU-a, ukoliko bismo uspjeli da istinski osposobimo mašine da razumiju, a samim tim i generišu prirodni jezik, su bezbrojne, budući da je veliki procenat podataka koji se svakodnevno generišu u obliku teksta. Da nabrojim samo nekoliko: sumarizacija teksta, ekstrakcija znanja i odgovaranje na pitanja, automatsko prevođenje, čet-botovi koji bi revolucionizovali korisničke servise. Uzevši u obzir napredak tehnologije i  rastuću kompleksnost mašina, velike su šanse da će naš odnos sa njima u bliskoj budućnosti prerasti u kolaboraciju, pa će samim tim mogućnost međusobne komunikacije biti od izuzetnog značaja.

Share

Prijavi se da prvi dobijaš nove blogove i vesti.

Ostavite odgovor

Sanja Umićević

Senior AM engineer @ Endava
mm

Sanja je poslednjih 5 godina provela u Endavi, kao C++ i Java developer, a od skora i kao Data science practice lead u Beogradu. Voli da bude u toku sa novim tehnologijama. U slobodno vrijeme putuje, čita naučnu fantastiku i bavi se ilustracijom.

Prijavi se da prvi dobijaš nove blogove i vesti.

Kategorije