Semantic annotation of data from web resources
- Diplomová práce
- Řešitel: Jan Dědek
- Vedoucí: Prof. RNDr. Peter Vojtáš, DrSc.
- Originál zadání
Contents |
[edit] Rychlé odkazy
- http://czSem.berlios.de/ - SW cast projektu na berlios.de
[edit] Zadání
Diplomová práce má za cíl zmapovat oblast sémantické anotace dat. Průzkum se bude týkat používaných metod a jejich efektivity a obecnosti, vzorových dat a software (ať komerčního nebo veřejně přístupného). Součástí výzkumu bude i ryze praktické seznámení s lingvistickými metodami, speciálně s wordnetem. V praktické části se řešitel pokusí o anotaci v určené doméně. Využije metody prozkoumané v teoretické části, které bude moci upravit podle zvolené domény. Téma je z dynamicky se vyvíjející domény a předpokládá kontinuální kontakt (zadání diplomové práce se bude průběžně upřesňovat). Nedílnou součástí práce je sběr dat, implementace v definovaném prostředí a experiment.
[edit] Seznam odborné literatury
- The Lixto Project: Exploring New Frontiers of Web Data Extraction, Julien Carme, Michal Ceresna, Oliver Frolich, Georg Gottlob, Tamir Hassan, Marcus Herzog, Wolfgang Holzinger, and Bernhard Krupl [1]
- Semantic Annotation, Indexing, and Retrieval 2nd International Semantic Web Conference (ISWC2003), 20-23 October 2003, Florida, USA. LNAI Vol. 2870, pp. 484-499, Springer-Verlag Berlin Heidelberg 2003. [2]
- From Manual to Semi-automatic Semantic Annotation: About Ontology-based Text Annotation Tools (2000) M. Erdmann, A. Maedche, H.-P. Schnurr, S. Staab [3]
- Survey of Semantic Annotation Platforms, Lawrence Reeve, Hyoil Han [4]
[edit] Prezentace
- Úvodní prezentace
- A General KIM Platform Presentation (30/09/2006, 56 slides, 1.8mb)
[edit] Poznatky z článků
[edit] Materiály
- The Lixto Project
- Semantic Annotation, Indexing, and Retrieval (KIM - Bulharsko)
- From Manual to Semi-automatic Semantic Annotation (Karlsruhe)
- Survey of Semantic Annotation Platforms (Philadelphia)
[edit] Annotation for the Semantic Web
- http://www.iospress.nl/html/9781586033453.php
- http://www.amazon.com/Annotation-Frontiers-Artificial-Intelligence-Applications/dp/158603345X
[edit] The Digital Library Approach
- Semantic Annotation in Mathematics and Math-Net, Wolfgang Dalitz, Winfried Neun and Wolfram Sperber [5]
[edit] Manual Annotations
- Annotating of the Shallow and the Deep Web, Siegfried Handschuh and Steffen Staab [6]
- Collaboration through Annotations in the Semantic Web, Marja-Riitta Koivunen and Ralph R.Swick [7]
[edit] Wrapping
- Semantic Markup of News Items with Lixto, Robert Baumgartner, Sebastian Eichholz, Sergio Flesca, Georg Gottlob and Marcus Herzog
- Using RDF Schema to Interpret XML Documents Meaningfully, Michel Klein
[edit] Information Extraction & Linguistics
- Linguistic Annotation for the Semantic Web, Paul Buitelaar and Thierry Declerck [8]
- Designing Adaptive Information Extraction for the Semantic Web in Amilcare, Fabio Ciravegna and Yorick Wilks [9]
- Content-based Indexing and Searching of Multimedia Documents, Thierry Declerck, Jan Kuper, Horacio Saggion, Anna Samiotou and Peter Wittenburg MUMIS
[edit] Graphics
- Supporting Semantic Image Annotation and Search, Jan Wielemaker, August Th. Schreiber and Bob J. Wielinga ???[10]???
- Image Semantics without Annotations, Simone Santini podobné, méně zajímavé?
- MUSETTE: Uses-based Annotation for the Semantic Web, Pierre-Antoine Champin and Yannick Prié [11]
[edit] Usage of Annotations
- COHSE: Conceptual Open Hypermedia Service, Sean Bechhofer and Carole Goble [12]
- Annotation for an Open Learning Repository for Computer Science, Jan Brase and Wolfgang Nejdl [13]
[edit] Relation Extraction
- http://dfki.de/~paulb/iswc2005.pdf - RelExt
- http://kmi.open.ac.uk/publications/pdf/KMI-TR-06-17.pdf
- Exploiting Shallow Linguistic Information for Relation Extraction from Biomedical Literature
- Preemptive information extraction using unrestricted relation discovery - univerzální technika
- Ontotriple: A semantic-oriented symbolic learning algorithm for extracting relation triples
- Automatic Content Extraction - ACE
- Relation Extraction for Mining the Semantic Web ...TRex
[edit] Artequakt
- ArtEquAKT home page
- http://data.archives.ecs.soton.ac.uk/data/archive/equator/papers/Artequakt.pdf
- http://gate.ac.uk/conferences/iswc2003/proceedings/alani.pdf
[edit] Projít
- clanek Annotated web as corpus
- nezaujalo
- SW projekt SemWeb
- odloženo, nezajímavé
[edit] WEESA
- Web Engineering for Semantic Web Applications
- http://www.infosys.tuwien.ac.at/weesa/
- Mapování XML do ontologií
- http://citeseer.ist.psu.edu/reif05weesa.html
[edit] Autorská anotace
[edit] Nástroje pro anotaci
[edit] Zajímavé ontologie
- DublinCore [14]
- VRA core4 - art images?
- swrc [15]
- [16]
- [17]
- Standard Upper Ontology Working Group (SUO WG)
- vCard
- FOAF
[edit] Anotované stránky
[edit] Information Extraction
[edit] Survey papers
- Grishman, R.: Information extraction: Techniques and challenges. In: SCIE ’97: Int. Summer School on IE, London, UK, Springer (1997) 10–27 URL
- "excellent tutorial" Appelt, D.E., Israel, D.J.: Introduction to information extraction technology. A tutorial prepared for IJCAI-99, Stockholm, Schweden (1999) URL
- Cowie, J., Wilks, Y.: Information extraction. In Dale, R., Moisl, H., Somers, H., eds.: Handbook of Natural Language Processing. Marcel Dekker, New York (2000) URL
[edit] Lingvistika
- Functors of Valency Frames - M, A, T
- Czech National Corpus
- The Prague Dependency Treebank 2.0
- Valency Lexicon of Czech Verbs - VALLEX 2.0
- Tomáš Holan: Syntactical Analysis for Czech
- Patrick Hanks: Computing Natural-Language Meaning for The Semantic Web 16.4.2007
[edit] Tektogramatická rovina
- TECTOGRAMMATICAL LAYER PDT 1.0
- Reference PDT 1.0
- Eva HAJÍČOVÁ: DEPENDENCY-BASED UNDERLYING-STRUCTURE TAGGING OF A VERY LARGE CZECH CORPUS
[edit] Czech Parsing Tools
- A Complete Guide to Czech Language Parsing - parsery (závislostní vrstva)
- Tree Editor TrEd
- btred/ntred tutorial api pro práci se stromy
[edit] WordNet
- EuroWordNet
- EuroWordNet Czech Academic org. Research Use 256.48 EUR
- EuroWordNet Sample and Viewer
- Karel Pala MU Brno
--195.113.20.96 09:31, 2 April 2009 (UTC)
[edit] SW
- Příklad Soccer game annotation
- Příklad Disease annotation
[edit] Data
- Příklad policejní zprávy
- Příklad hasičské zprávy
- Příklad Evidence úpadců
[edit] Osnova práce
Outlines: Semantic annotation of data from web resources
--dedekj 17:07, 13 April 2007 (CEST)
