Extração de relações semanticas via análise de correlação de termos em documentos
暂无分享,去创建一个
Sistemas de recuperacao de informacao sao ferramentas para automatizar os procedimentos de busca por informacoes. Surgiram com propostas simples nas quais a recuperacao era baseada exclusivamente na sintaxe das palavras e evoluiram para sistemas baseados na semântica das palavras como, por exemplo, os que utilizam ontologias. Entretanto, a especificacao manual de ontologias e uma tarefa extremamente custosa e sujeita a erros humanos. Metodos automaticos para a construcao de ontologias mostraram-se ineficientes, identificando falsas relacoes semânticas. O presente trabalho apresenta uma tecnica baseada em processamento de linguagem natural e um novo algoritmo de agrupamento para a extracao semi-automatica de relacoes que utiliza o conteudo dos documentos, uma ontologia de senso comum e supervisao do usuario para identificar corretamente as relacoes semânticas. A proposta envolve um estagio que utiliza recursos linguisticos para a extracao de termos e outro que utiliza algoritmos de agrupamento para a identificacao de conceitos e relacoes semânticas de instanciacao entre termos e conceitos. O algoritmo proposto e baseado em tecnicas de agrupamento possibilistico e de bi-agrupamento e permite a extracao interativa de conceitos e relacoes. Os resultados sao promissores, similares as metodologias mais recentes, com a vantagem de permitir a supervisao do processo de extracao
Abstract