Análise Morfossintáctica para Português Europeu e Galego: Problemas, Soluções e Avaliação

As diferentes tarefas de analise morfossintactica tem muita importância para posteriores niveis do processamento da linguagem natural. Por isso, estes processos devem ser realizados com ferramentas que garantam bons desempenhos em relacao a cobertura, precisao e robustez na analise. FreeLing e uma suite com licenca GPL desenvolvida pelo Grupo TALP da Universitat Politecnica de Catalunya. Este software contem -entre outros- modulos de tokenizacao, segmentacao de oracoes, reconhecimento de entidades e anotacao morfossintactica. Com o fim de obtermos ferramentas que nos sirvam de base para a analise sintactica, bem como para disponibilizar software livre para o processamento de superficie de Portugues Europeu e Galego, adaptamos FreeLing para estas variedades. A primeira delas foi desenvolvida com ajuda de recursos linguisticos disponiveis on-line, enquanto os ficheiros do Galego tiveram como base a versao anterior de FreeLing (criados pelo Seminario de Linguistica Informatica da Universidade de Vigo), que ja realizava a analise desta lingua. O presente trabalho descreve os principais aspectos do desenvolvimento das ferramentas, com enfase nos problemas encontrados e nas solucoes adoptadas em cada caso. Alem disso, sao apresentados os resultados de avaliacao do modulo PoS-tagger.