Referência: AFONSO, Alexandre Ribeiro, DUQUE, Cláudio Gottschalg . O impacto da variação temática na categorização automática de artigos científicos em português do Brasil . . ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 13., 2012, Rio de Janeiro. Anais.... Rio de Janeiro : Fiocruz, 2012
Descritor(es):
CATEGORIZAÇÃO AUTOMÁTICA DE TEXTOS, PORTUGUÊS DO BRASIL, EFETIVIDADE, ARTIGOS CIENTÍFICOS, BIBLIOTECAS DIGITAIS.
Resumo: Nesta pesquisa, é verificado o impacto da variação de áreas científicas nos corpora textuais de entrada para um sistema automático de categorização textual. Foi medida a efetividade de três algoritmos de categorização textual, também considerando as características linguísticas do português do Brasil em tais textos. Observou-se que a presença de artigos científicos de uma mesma grande área, em um corpus de teste, causa uma queda de efetividade considerável sobre os algoritmos de categorização, mas para alguns corpora, mesmo contendo artigos de uma mesma grande área, a queda de efetividade não é acentuada. Considerando os experimentos realizados, é possível inferir que específicas combinações de áreas científicas dentro do corpus de teste produzem resultados específicos de categorização. Conclui que a efetiva categorização automática depende de vários fatores, inclusive das características do corpus de entrada, e não somente dos algoritmos de pré-processamento e categorização.
Endereço eletrônico:
http://enancib.ibict.br/index.php/enancib/xiiienancib/paper/viewFile/3855/2978 Acessado em: 25 jul. 2016
|