Choosing the most suitable conference to submit a paper is a task that depends on a number of factors including: (i) the topic of the paper needs to be among the topics of interest of the conference; (ii) submission deadlines need to be compatible with the necessary time for paper writing; and (iii) the quality or impact of the conference. These factors allied to the existence of thousands of conferences, make the search of the right event very time consuming, especially when researching in a new area. Intending to help researchers finding conferences, this paper presents a method developed to retrieve and extract data from conferences web sites. Our method combines the identification of conference URL and deadline extraction. The retrieved data is stored in a database to be searched with an online tool. The paper also reports on experiments that evaluate the quality of the extracted data, focusing on the deadlines. Resumo. A escolha da conferência adequada para o envio de um artigo é uma tarefa que depende de vários fatores incluindo: (i) o tema do artigo deve estar entre os temas de interesse do evento; (ii) o prazo de submissão do evento deve ser compatı́vel com tempo necessário para a escrita do artigo; e (iii) a qualidade da conferência. Esses fatores aliados à existência de milhares de conferências tornam a busca pelo evento adequado bastante demorada, em especial quando se está pesquisando em uma área nova. A fim de auxiliar os pesquisadores na busca de conferências, esse artigo apresenta um método desenvolvido para a coleta e extração de dados de sites de conferências. Este método combina a identificação de URLs de conferências da Tabela Qualis à identificação de deadlines. Os dados coletados populam uma base de dados que poderá ser consultada através de uma ferramenta online. O artigo também relata experimentos que avaliam a qualidade dos dados extraı́dos, enfatizando a extração dos deadlines. 1. Introdução O processo de escrita e submissão de artigos cientı́ficos é crucial na vida dos pesquisadores. A escolha do periódico ou conferência mais adequados para a divulgação da pesquisa realizada é uma tarefa bastante importante e que por vezes toma bastante tempo dos pesquisadores. Existem milhares de conferências cientı́ficas que ocorrem anualmente. Quando se deseja submeter um artigo para uma conferência, vários aspectos precisam ser levados em consideração: (i) tema do trabalho deve estar entre os temas de interesse do evento para que ele possa ser considerado; (ii) é necessário saber se os prazos (deadlines) do evento são compatı́veis com os do término da escrita do artigo (ou algum outro critério temporal como o prazo para a conclusão do curso, por exemplo); (iii) questões de valores 32nd SBBD – Full Papers – ISSN 2316-5170 October 2-5, 2017 – Uberlândia, MG, Brazil
[1]
Juliana Freire,et al.
Learning to extract form labels
,
2008,
Proc. VLDB Endow..
[2]
Qiang Liu,et al.
Automatic web page segmentation and information extraction using conditional random fields
,
2012,
Proceedings of the 2012 IEEE 16th International Conference on Computer Supported Cooperative Work in Design (CSCWD).
[3]
Marco Cristo,et al.
A Self-training CRF Method for Recognizing Product Model Mentions in Web Forums
,
2015,
ECIR.
[4]
Jan Sedivý,et al.
Deep Neural Networks for Web Page Information Extraction
,
2016,
AIAI.
[5]
Oren Etzioni,et al.
Open Information Extraction from the Web
,
2007,
CACM.
[6]
Rosaldo J. F. Rossetti,et al.
AllCall: An automated call for paper information extractor
,
2010,
5th Iberian Conference on Information Systems and Technologies.
[7]
Yao Meng,et al.
Conditional Random Fields Model for Web Content Extraction
,
2010,
2010 Fifth International Multi-conference on Computing in the Global Information Technology.
[8]
W. Bruce Croft,et al.
Table extraction using conditional random fields
,
2003,
DG.O.
[9]
Wei-Ying Ma,et al.
2D Conditional Random Fields for Web information extraction
,
2005,
ICML.