Sémantický web 4. díl, Ontologické schéma

Napsal O webu (») 7. 1. 2008 v kategorii Internet, přečteno: 1674×

Ontologie

Co jsou ontologie? Vize sémantického webu předpokládá organizaci a provázanost informací umožňující jejich zpracování a pochopení“ nejen člověkem, ale i počítačem. Prostředkem k dosažení tohoto (dlouhodobého) cíle mají být mj. ontologie. V oblasti informatiky jsou dnes ontologie chápány jako explicitní, formální specifikace pojmu a vztahu mezi nimi. Cílem ontologie je definovat společné, jednotné chápání určité třídy pojmu.



Je zřejmé, že jednotnosti se snáze dosáhne v určité uzavřené oblasti – doméně. Proto dnes existuje poměrně velké množství tzv. doménových ontologií. Aktuální otázkou výzkumu je, zda pro úspěšnou realizaci informačních systémů budoucnosti postačí rozšiřování počtu těchto kamínku mozaiky sémantického webu, či zda je nutné zapojit i nějakou obecnou, široce pojatou, všeobjímající“ ontologii.

I kdybychom se však spokojili s tím, že široce zaměřenou ontologii pro potřeby sémantického webu zpracuje jen nějaká skupina lidí podle svého nejlepšího vědomí, zůstává stále mnoho nevyřešených těžkostí.

Nejvýznamnější je patrně časová náročnost tvorby takového zdroje. K překonání tohoto slabého místa může vést tradiční cesta – pokusit se použít to, co je již hotovo. Cílem takového přístupu k budování ontologií je integrace existujících databází, rozsáhlých bází znalostí budovaných pro jiné účely a dalších zdrojů, jejich „vyčištění“, zpřesnění uložených informací a nakonec integrace do jednotné ontologické struktury.



Wordnet

Nejpopulárnějším výchozím zdrojem pro budování ontologií je wordnet . Jak název napovídá,
jedná se o sít slov, spojených sémantickými vztahy. Základními stavebními kameny wordnetu jsou synonymické rady – synsety – tvořené slovy, která mají v určitém kontextu totožný význam. Jednotlivé prvky synsetů se nazývají literály. Wordnet dále obsahuje celou radu sémantických vazeb mezi literály a zejména mezi synsety. Nejvýznamnějším typem jsou hypero / hyponymické vztahy spojující synsety s obecnejším / konkrétnejším významem, např. flanel je druhem textilie. Důležité jsou dále vztahy meronymie, zachycující vztahy mezi částí a celkem, např. že nos je částí obličeje.

V předchozím odstavci jsme mluvili zjednodušeně o slovech. Synsety všako bsahují i slovní spojení, napr. vysoká škola“.Obecně tedy mluvíme o jazykových výrazech. Literály dále obsahují číselný identifikátor významu, např. anglické podstatné jméno bank:

1) označuje finanční instituci
2) břeh

První a současně největší (americký) wordnet vznikl a je dále vyvíjen a rozšiřován na Princenstonské univerzitě pod vedením George Millera a Christinne Felbaum. V aktuální verzi 2.0 obsahuje více ne 100 000 synsetů složených přibližně z dvojnásobku literálu. V roce 1996 odstartoval evropský projekt EuroWordNet s cílem vytvořit wordnety pro další jazyky a provázat všech je do multilingvální databáze.
Autor: Radim Gál
Facebook Twitter Topčlánky.cz Linkuj.cz

Komentáře

Martin Burda z IP 82.100.1.*** | 7.1.2008 17:40
Vážený pane, když už produkujete "Vaše" články pomocí kombinace CTRL+C a CTRL+V, bylo by vhodné, kdybyste uvedl, že se jedná o převzatý text, případně uvedl citaci, pokud je to pouze část článku.


Nový komentář

Téma:
Jméno:
Notif. e-mail *:
Komentář:
  [b] [obr]
Odpovězte prosím číslicemi: Součet čísel pět a osm