Ključna riječ u novoj fazi interneta , koja se sada naziva web3.0 ili semantički web (još jedan buzzword), i je semantika. Osnovni problem pri računalnoj obradi i razumijevanju prirodnih jezika oduvijek je bila višeznačnosti u jeziku. Višeznačnost je prisutna na svim jezičnim razinama i na svakoj od njih je potrebno njezino razrješavanje. Mogu li računala razlikovati riječi kao što su homografi, npr. riječ jaguar razložiti na sva njezina značenja? I mogu li znati koje značenje riječi jaguar treba vratiti u rezultatima pretraživanja s obzirom na informacijsku potrebu korisnika? Mogu li uočiti da riječ rose može biti i imenica i glagol i u skladu s time razlikovati kojoj vrsti riječi pripada navedena riječ u korisničkom upitu? Semantički web bi na području pretraživanja informacija trebao omogućiti razvoj tražilica ili pretraživača koje bi mogle razlikovati homografe, ali i razriješavati ostale probleme višeznačnosti.
Objavljeno 20.02.2009, NLP, Pretraživanje, Semantički web, Tražilice, Umjetna inteligencija, Web3.0 Autor Marija
Twine je servis / aplikacija tvrtke Radar Networks koja se temelji na tehnologiji semantičkog weba (tehnologija koja omogućuje da računala procesiraju ili razumiju značenja web stranica na način da označavaju sadržaj dodjeljujući mu meta oznake). Aplikacija koristi tehnike strojnog učenja i obrade prirodnog jezika kako bi parsirala sadržaj web stranica korisnika iz kojih potom crpi podatke / objekte kao što su ljudi, mjesta i organizacije (Technology Review). Twine omogućuje korisnicima da pronađu, organiziraju, dijele i otkrivaju informacije.
Opširnije »


Komentari