Ključna riječ u novoj fazi interneta , koja se sada naziva web3.0 ili semantički web (još jedan buzzword), i je semantika. Osnovni problem pri računalnoj obradi i razumijevanju prirodnih jezika oduvijek je bila višeznačnosti u jeziku. Višeznačnost je prisutna na svim jezičnim razinama i na svakoj od njih je potrebno njezino razrješavanje. Mogu li računala razlikovati riječi kao što su homografi, npr. riječ jaguar razložiti na sva njezina značenja? I mogu li znati koje značenje riječi jaguar treba vratiti u rezultatima pretraživanja s obzirom na informacijsku potrebu korisnika? Mogu li uočiti da riječ rose može biti i imenica i glagol i u skladu s time razlikovati kojoj vrsti riječi pripada navedena riječ u korisničkom upitu? Semantički web bi na području pretraživanja informacija trebao omogućiti razvoj tražilica ili pretraživača koje bi mogle razlikovati homografe, ali i razriješavati ostale probleme višeznačnosti.
Objavljeno 20.02.2009, NLP, Pretraživanje, Semantički web, Tražilice, Umjetna inteligencija, Web3.0 Autor Marija
Objavljeno 15.01.2009, Pretraživanje Autor Marija
Information Retrieval predstavlja selektivni postupak za dohvat informacija, pa i njihovo spremanje i indeksiranje. Odnosno, predstavlja pronalaženje informacija iz velikih kolekcija informacija kako bi se zadovoljila informacijska potreba. Sustavi za dohvat informacija su se koristili tradicionalno za dohvat informacija koje su po svom tipu bili tekstualne (nestrukturirane informacije – cjeloviti tekstovi, sažeci tekstova, itd.), a danas dohvaćaju i audio-vizualne informacije (slika, video, itd.).


Komentari