Sustainable long-term WordNet development and maintenance: Case study of the Czech WordNet Czech WordNet represents one of the first national wordnets created during the EuroWordNet and BalkaNet projects. However, the data contains various issues that affect the use of Czech WordNet in NLP applications. Since the publication of the first CzWN version, the semantic network was augmented in several phases, however, complex final editing and publishing process has not been finished. In 2017, we have started a project to evaluate and update the Czech WordNet, followed by a connection to the Collaborative Interlingual Index. In this paper, we provide an overview of Czech WordNet data updates and extensions, and present the roadmap to publish a revised version of the Czech WordNet under open license. Moreover, we introduce a developed concept for long-term updates and maintenance of the data based on crowdsourcing activities. Zrownowazony i dlugafalowy proces rozwoju i utrzymania wordnetu na przykladzie wordnetu czeskiego Czeski WordNet jest jednym z pierwszych narodowych wordnetow powstalych podczas projektow EuroWordNet i BalkaNet. Jednakze dane zawierają bledy, ktore wplywają na uzywanie czeskiego wordnetu w aplikacjach NLP. Od momentu opublikowania pierwszej wersji czeskiego wordnetu siec semantyczna zostala rozszerzona w kilku etapach, jednak zlozony proces koncowej edycji i publikacji nie zostal jeszcze zakonczony. W roku 2017 zaczeliśmy projekt mający na celu ocene i aktualizacje czeskiego wordnetu, a nastepnie polączenie go z Collaborative Interlingual Index. W danym artykule przedstawiamy ogolny zarys uaktualnien i rozszerzen zawartości czeskiego wordnetu, a takze prezentujemy plan dzialania, ktory doprowadzi do publikacji udoskonalonej wersji czeskiego wordnetu na otwartej licencji. Ponadto prezentujemy opracowaną koncepcje dlugoterminowych uaktualnien i utrzymania danych w oparciu o dzialania crowdsourcingowe.
[1]
Miroslav Grepl.
Příruční mluvnice češtiny
,
1995
.
[2]
Karel Pala,et al.
Overview and Future of Czech Wordnet
,
2017,
LDK Workshops.
[3]
Karel Pala,et al.
Extending Czech WordNet Using a Bilingual Dictionary
,
2012
.
[4]
Aleš Horák,et al.
New Features of Wordnet Editor VisDic
,
2004
.
[5]
Christiane Fellbaum,et al.
Book Reviews: WordNet: An Electronic Lexical Database
,
1999,
CL.
[6]
Aleš Horák,et al.
DEBVisDic: Instant Wordnet Building
,
2016,
GWC.
[7]
Vojtech Kovár,et al.
Czech Morphological Tagset Revisited
,
2011,
RASLAN.
[8]
Ales Horák,et al.
New features in DEBVisDic for WordNet Visualization and User Feedback
,
2017,
RASLAN.
[9]
Vladimír Kadlec,et al.
Exploitation of the VerbaLex Verb Valency Lexicon in the Syntactic Analysis of Czech
,
2006,
TSD.
[10]
Piek Vossen,et al.
Wordnet-LMF: fleshing out a standardized format for wordnet interoperability
,
2009,
IWIC '09.
[11]
Aleš Horák,et al.
DEBVisDic - First Version of New Client-Server Wordnet Browsing and Editing Tool
,
2005
.
[12]
John P. McCrae,et al.
CILI: the Collaborative Interlingual Index
,
2016,
GWC.
[14]
Aleš Horák,et al.
VisDic ñ Wordnet Browsing and Editing Tool
,
2003
.
[15]
Karel Pala,et al.
Building Czech Wordnet
,
2004
.
[16]
Francis Bond,et al.
Linking and Extending an Open Multilingual Wordnet
,
2013,
ACL.