Learning Event Patterns from Text

We propose a pipeline for learning event templates from a large corpus of textual news articles. An event template is a machine-usable semantic data structure, in our case a graph, describing a certain event type. Such a template encodes the most characteristic information for a certain type of event; for instance, an earthquake template would encode "x people dead” and/or “town y shook at time z". Event templates have potential to be used as an input for information extraction tasks or automated ontology extension. We present preliminary results of applying the proposed pipeline on a subset of news articles. Povzetek: Predstavljen je cevovod za samodejno ekstrahiranje dogodkovnih predlog (event templates) na podlagi obsežnejšega korpusa časopisnih novic. Dogodkovna predloga je za računalniku prijazna semantična podatkovna struktura, v našem primeru graf, ki nosi vse najbolj tipične informacije za določen tip dogodka. Kot primer: za tip dogodka "potres" si želimo predlogo, ki bi pomnila informacije tipa "x smrtnih žrtev" in/ali "mesto y se je streslo ob času z". Dogodkovne predloge so potencialno uporabne v različnih nalogah ekstrahiranja informacij ter za avtomatske razširitve ontologij. V članku predstavimo uvodne rezultate, dobljene z uporabo cevovoda na testni množici novičarskih člankov.