Outlines: Semantic annotation of data from web resources

From semanticweb.org
Jump to: navigation, search

Contents

[edit] Úvod

[edit] Motivační příklady

[edit] Vylepšeme své stránky!

http://annotation.semanticweb.org/help/introduction/

[edit] Spojme naše znalosti!

Je mnoho oblastí výzkumu, kde se více lidí na různých místech zabývá podobným nebo dokonce stejným tématem. Bylo by jistě přínosné, když by tito lidé mohli snadno porovnat a spojit své výsledky. Takovou oblastí je například Data Mining. Často se stává že více lidí zkoumá stejná data a každý z nich v těchto datech objeví jiné závislosti a vztahy. Každý odborník na závěr svého datového výzkumu sepíše své výsledky do analytické zprávy. Pokud chceme výsledky všech prací nějak porovnat a shrnout, nezbude nám než projít všechny analytické zprávy a srovnání provést ručně nebo se můžeme pokusit znalosti ve zprávách popisované reprezentovat nějakým strojově srozumitelným způsobem.

dopsat: Co všecko sem. anotace přinese.

[edit] Dovíme se přesně to, co jsme chtěli vědět.

  • burzy, investiční fondy
  • Informace o právních subjektech
    • Výsledky auditů, konkurz

... Tohle všecko anotovat a pak už jen snadno hledat, nechávat se informovat

[edit] Teoretické modely

[edit] Pojem sémantické anotace

V procesu sémantické anotace se snažíme znalosti obsažené ve zdroji a srozumitelné pouze pro člověka interpretovat pro co možná nejširší publikum SW systémů.

[edit] Zobrazení "dokument -> dokument + anotace"

[edit] Měření kvality anotace

  • Precision, Recall, F-measure
  • Náš rozšířený model (správné, nesprávné, nevíme)

[edit] Preferenční dotazování

[edit] Sémantický web

[edit] Metody

... Přehled

[edit] Autorská a dodatečná anotace

[edit] Doporučení pro autory web-stránek

  • Uznávané ontologie
  • RDFa, HTMLa

[edit] Ruční, poloautomatická až automatická anotace

[edit] Rozdělení

[edit] Text, XML, Obrázky, Video

  • spousty zdrojů v článcích

[edit] Software

[edit] Existující

[edit] Náš

  1. Navržený
  2. Realizovaný

[edit] Data

[edit] Vstupní

  • Analytické reporty
  • Novinové zprávy
  • Wikipedia
  •  ?Ontologie domény? - vytvořit, nebo získat

[edit] Interní

  • Ontologie domény
  • Extrakční ontologie
  • ...

[edit] Výstupní

  • Ontologie domény doplněná o získané znalosti
  • Anotované články
  • Anotace k článkům
... Anotace jsou uloženy vně zdrojového textu, ale lze přesně dohledat ke kterým místům zdroje s vztahují.

[edit] Experiment

  • Prozkoumat stromy vzniklé lingvistickou analýzou.
    • Případně jen vrchní 3 vrcholy stromu.
    • Indexovat podobně jako ve vektorovém modelu?
  • Pokusit se realizovat anotaci.
    • Více domén

[edit] Závěr

[edit] Přínosy (očekávané)

[edit] Nová data

V rámci diplomové práce by měla vzniknout následující data.

  • Soubor vstupních dat (zpráv, článků, web-stránek) nad kterými bude možné vyvíjet další SW.
  • Ontologie
    • Doménové (popisující doménu)
    • Extrakční
    • Se znalostmi (výstup, doménové naplněné získanými znalostmi)
  • Anotované stránky, zprávy, články
    • Trénovací data pro učení a vývoj dalšího SW.

[edit] Nový SW

Nově vzniklý SW by měl být schopen spustit lingvistickou analýzu nad českým textem. Výsledek lingvistické analýzy nějakým způsobem zpracovat a převést na znalosti, získané znalosti uložit tak, aby byly sémanticky interpretovatelné.

Přínos k anotaci?

[edit] Experimenty

Experimenty budou spočívat v aplikaci nového SW v různých doménách (na různé druhy vstupů).

[edit] Východiska pro další práci

  • Zadání SwP
  • Zadání PhD práce
  • Vědecký článek
Personal tools
Namespaces

Variants
Actions
Navigation
services
Toolbox