
Ključna riječ u novoj fazi interneta , koja se sada naziva web3.0 ili semantički web (još jedan buzzword), i je semantika. Osnovni problem pri računalnoj obradi i razumijevanju prirodnih jezika oduvijek je bila višeznačnosti u jeziku. Višeznačnost je prisutna na svim jezičnim razinama i na svakoj od njih je potrebno njezino razrješavanje. Mogu li računala razlikovati riječi kao što su homografi, npr. riječ jaguar razložiti na sva njezina značenja? I mogu li znati koje značenje riječi jaguar treba vratiti u rezultatima pretraživanja s obzirom na informacijsku potrebu korisnika? Mogu li uočiti da riječ rose može biti i imenica i glagol i u skladu s time razlikovati kojoj vrsti riječi pripada navedena riječ u korisničkom upitu? Semantički web bi na području pretraživanja informacija trebao omogućiti razvoj tražilica ili pretraživača koje bi mogle razlikovati homografe, ali i razriješavati ostale probleme višeznačnosti.

Komentari