Registro Completo


[013097]

[ impressão]

Referência:
SILVA, Edson Marchetti da, SOUZA, Renato Rocha. Fundamentos em processamento de linguagem natural: uma proposta para extracao de bigramas. . Encontros Bibli: Revista Eletronica de Biblioteconomia e Ciencia da Informacao , Florianópolis , v.19 , n.40 , p.1-32 , maio/ago. 2014

Descritor(es):
EXTRAÇÃO DE EXPRESSÕES MULTIPALAVRAS, MEDIDAS DE ASSOCIAÇÃO ESTATÍSTICAS, HEUDET.

Resumo:
Ë senso comum que o texto escrito é uma importante forma de registrar as informações e que atualmente grande parte desse conteúdo informacional está disponível em meio digital. Entretanto, de maneira geral, os computadores lidam com o texto como sendo uma cadeia de caracteres que não têm nenhum significado. A área de Processamento de Linguagem Natural (PLN) vem se empenhando em extrair significados do texto. Nesse sentido este trabalho apresenta uma revisão desse tema e propõe um método automatizado que utiliza uma heurística determinística denominada Heudet que visa extrair bigramas do texto. A meta é extrair o significado do texto através de um conjunto de expressões multipalavras identificadas. Os resultados obtidos foram melhores se comparados com aqueles que utilizam-se das técnicas de medidas de associação estatística obtidas pelo software Ngram Statistics Package (NSP)

Endereço eletrônico:
https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2014v19n40p1/27573 Acessado em: