Semantičke tražilice: Hakia i DeepDyve
Ključna riječ u novoj fazi interneta , koja se sada naziva web3.0 ili semantički web (još jedan buzzword), i je semantika. Osnovni problem pri računalnoj obradi i razumijevanju prirodnih jezika oduvijek je bila višeznačnosti u jeziku. Višeznačnost je prisutna na svim jezičnim razinama i na svakoj od njih je potrebno njezino razrješavanje.
Freebase: baza znanja semantičkog weba
Freebase je baza znanja/informacija koja podržava formu otvorenog pristupa, a sadržaj ili podatke crpi s Wikipedije, MusicBrainza, i dr. Informacije organiziraju i korisnici. Sve informacije su strukturirane u formatu koji je razumljiv računalima. Podaci su sortirani po kategorijama i temama unutar kategorija. Korisnicima je dozvoljeno da sami kreiraju takozvane baze ili vlastite stranice u kojima će moći organizirati, dijeliti već postojeće informacije koje omogućuje Freebase, ali i unositi vlastiti sadržaj i kategorizirati ga.
Powerset: kontekstulano pretraživanje članaka s Wikipedije
Powerset je tvrtka i servis koji omogućuje pretraživanje na način da poštuje lingvističku strukturu našega upita. To bi značilo da vaš upit možete postaviti u obliku imenskog entiteta, egzaktne fraze ili pitanja. Ova Microsoftova semantička tražilica koristi Freebase kako bi dala odgovore na upite postavljene u obliku pitanja, te pretražuje engleske članke s Wikipedije.
Ono što je značajno kod ovoga servisa jest da implementira cijeli niz lingvističkih formalnih opisa jezika u svoje algoritme i na taj način poštuje značenje našega upita i stavlja ga kontekst – odnosno, omogućuje kontekstualno ili semantičko pretraživanje.