LinguaKit: uma ferramenta multilingue para a análise linguística e a extração de informação

Este artigo apresenta LinguaKit, uma suite multilingue de ferramentas de analise, extracao, anotacao e correcao linguisticas. LinguaKit permite realizar tarefas tao diversas como a lematizacao, a etiquetagem morfossintatica ou a analise sintatica (entre outras), incluindo tambem aplicacoes para a analise de sentimentos (ou minaria de opinioes), a extracao de termos multipalavra, ou a anotacao concetual e ligacao a recursos enciclopedicos tais como a DBpedia. A maior parte dos modulos funcionam para quatro variedades linguisticas: portugues, espanhol, ingles e galego. A linguagem de programacao de LinguaKit e Perl, e o codigo esta disponivel sob a licenca livre GPLv3.