Tagaroo: još jedan primjerak semantičkog weba za blogere i izdavače

Autor Marija, 13.11.2008. | 1 komentar

Tagaroo je plugin (za WordPress) koji omogućuje automatsku analizu sadržaja posta bloga i na temelju te analize preporučuje relevantne tagove i slike koji mogu nadopuniti sadržaj bloga o kojem pišete. Tagaroo u svakom slučaju svojom funkcijom podsjeća do određene mjere na spomenutu Zemantu. Razlika je u izvorima iz koje dohvaćaju svoje informacije – Zemanta ih pronalazi iz više njih, dok Tagaroo to čini iz jednog izvora – Flickra.

Što uopće podrazumijevamo pod pojmom automatska analiza? Taj postupak zasigurno uključuje korištenje znanja i alata za obradu prirodnog jezika.  Sigurno je da se radi o ekstrakciji (analizi, dohvatu) informacija (engl. information extraction) iz određenih nestrukturiranih dokumenata (teksta, sadržaja) koja uključuje prepoznavanje imenskih entiteta (engl. named entity recognition) – vlastitih imena, organizacija, mjesta, valuta, datuma i sl. te pronalazi za prepoznate podatke rezultate fotografija s Flickra što bi bilo pronalaženje informacija (engl. information retrieval).

Tagaroo zapravo omogućuje tagiranje sadržaja vašega posta na način da dodjeljuje metapodatke ili tagove riječima u vašem postu svrstavajući ih primjerice u kategorije vlastito ime, tvrtka, grad, i sl. Na taj način ostvaruje se uvid u kontekst vašega posta. Primjerice ukoliko se u vašem tekstu pojavljuju riječ mouse koja može označavati životinju ili izlaznu jedinicu računala (dok MOUSE napisan velikim slovima označava organizaciju, ista riječ se pojavljuje u imenu recimo Mickey Mouse, koji zapravo predstavlja jedan token, itd.) metapodaci bi trebali razriješiti taj problem višeznačnosti, odnosno utvrditi na što se ta riječ odnosi u vašem tekstu. Ili primjerice odnosi li se riječ Washington u vašem postu na grad, osobu ili saveznu državu? Naravno, ako se Washington odnosi na vlastito ime onda bi zasigurno trebalo pisati recimo George Washington što onda predstavlja jedan token i onda to Tagaroo prepoznaje kao osobu ili ‘person’. I u slučaju hrvatskoga jezika prepoznaje imenske entitete u tekstu i predlaže odgovarajuće tagove.

1 comment

  1. danijel
    11.10.2009.

    e sada si mi uljepšala dan :) baš ću testirati ovaj plugin, do sada sam koristio addone za FF pa nisam mogao pisati blogove sa nekih drugih browsera :)
    hvala…
    ps super su ti postovi

Komentiraj