Como incrementar a qualidade dos resultados das máquinas de busca: da análise de logs à interação em português

Com o intuito de avaliar a submissao de consultas em lingua natural, especificamente em portugues, a maquinas de busca na Web, e contrastar com as consultas por palavras-chave, realizou-se um experimento com alunos, professores e funcionarios de uma universidade brasileira. Particularmente, analisaram-se as consultas para verificar se os usuarios expressavam bem seus objetivos em palavras-chave; como expressariam seus objetivos em lingua natural, caso esta possibilidade fosse oferecida; se as consultas em lingua natural forneciam informacoes que pudessem facilitar a recuperacao de informacao. O pedido de colaboracao foi enviado a 440 pessoas de um instituto de computacao da universidade. Foram obtidas 63 consultas, correspondentes a 42 objetivos. Observou-se que, para o item a, na maioria dos casos (71,43%), as consultas por meio de palavras-chave nao trazem todas as informacoes declaradas importantes no objetivo; para o item b as consultas foram feitas por meio de perguntas (71,87%), afirmacoes (18,75%) e ordens (9,37%); e, para o item c todas as perguntas diretas deixavam claro o objetivo da consulta ja com a primeira palavra da frase, ou com as duas ou tres primeiras, com excecao das iniciadas pela palavra "qual".

[1]  Amanda Spink,et al.  Vox populi: The public searching of the web , 2001, J. Assoc. Inf. Sci. Technol..

[2]  Amanda Spink,et al.  From E-Sex to E-Commerce: Web Search Changes , 2002, Computer.

[3]  Koichi Takeda,et al.  Information retrieval on the web , 2000, CSUR.

[4]  Amanda Spink,et al.  Real life information retrieval: a study of user queries on the Web , 1998, SIGF.

[5]  Nancy C. M. Ross,et al.  End user searching on the Internet: An analysis of term pair topics submitted to the Excite search engine , 2000, J. Am. Soc. Inf. Sci..

[6]  Fidel Cacheda,et al.  Understanding how people use search engines: a statistical analysis for e-Business , 2000 .

[7]  Bernard J. Jansen,et al.  A review of web searching studies and a framework for future research , 2001 .

[8]  Tom Peters,et al.  The history and development of transaction log analysis , 1993 .

[9]  Evangelos P. Markatos,et al.  On caching search engine query results , 2001, Comput. Commun..

[10]  Amanda Spink,et al.  Real life, real users, and real needs: a study and analysis of user queries on the web , 2000, Inf. Process. Manag..

[11]  C. Lee Giles,et al.  Accessibility of information on the Web , 2000, INTL.

[12]  Amanda Spink,et al.  Selected results from a large study of Web searching: the Excite study , 2000, Inf. Res..

[13]  Monika Henzinger,et al.  Analysis of a very large web search engine query log , 1999, SIGF.

[14]  Bernard J. Jansen An Investigation Into the Use of Simple Queries On Web IR Systems , 2000 .

[15]  Amanda Spink,et al.  Searching the Web: the public and their queries , 2001 .