Ontologia como recurso de padronização terminológica no processo de recuperação de informação

  • Jorge Janaite Neto Universidade Estadual Paulista UNESP-Marília
  • Edberto Ferneda Universidade Estadual Paulista UNESP-Marília
Palavras-chave: Recuperação de informação, Indexação automática, Expansão de consulta, Ontologia, Modelos de recuperação de informação.

Resumo

O processo de recuperação de informação envolve um acervo documental que deve ser representado por expressões linguísticas e usuários que tentam descrever linguisticamente as suas necessidades de informação a fim de obterem documentos relevantes para satisfazer tais necessidades. Um sistema de recuperação de informação é, portanto, um ambiente linguístico mediador na comunicação entre um estoque de informação e seus requisitantes. Sua eficiência depende de um controle adequado da linguagem de representação dos itens de informação e das requisições dos usuários. Este trabalho apresenta um método de utilização de ontologias na recuperação de informação. Utiliza-se o Modelo Espaço Vetorial como estrutura formal para a representação dos documentos e das buscas dos usuários. Os vetores dos documentos são criados durante o processo de indexação automática no qual uma ontologia fornece novos termos além daqueles extraídos do texto, enriquecendo, assim a representação do documento. O vetor de busca é criado a partir de um processo de expansão de consulta no qual, a partir de inferências em uma ontologia, novos termos são inseridos na expressão de busca inicialmente formulada pelo usuário. Pretende-se com isso uniformizar as representações dos documentos e das buscas, melhorando assim a precisão do processo de recuperação de informação.

 

Biografia do Autor

Jorge Janaite Neto, Universidade Estadual Paulista UNESP-Marília
Possui graduação em História pela Universidade Estadual Paulista Júlio de Mesquita Filho (2004), especialização em Planejamento, Implementação e Gestão de Educação à Distância pela Universidade Federal Fluminense (2012) e especialização em Redes de Computadores pela Universidade Tecnológica Federal do Paraná (2015) . Atualmente é Analista de Informática da Universidade Estadual Paulista Júlio de Mesquita Filho.
Edberto Ferneda, Universidade Estadual Paulista UNESP-Marília
Possui graduação em Processamento de Dados pela antiga Fundação Educacional de Bauru (1985). Mestre em Informática pela Universidade Federal da Paraíba (1997) . Doutor em Ciências da Comunicação (Ciência da Informação) pela Universidade de São Paulo (2003). Pós-doutorado pela Universidade Federal da Paraíba (2013). Atualmente é professor do Departamento de Ciência da Informação da Universidade Estadual Paulista 'Julio Mesquita Filho' (UNESP) - Campus de Marília. Atua na Ciência da Informação, principalmente nas áreas de Indexação Automática e  Recuperação de Informação. Bolsista Produtividade em Pesquisa CNPq - Nível 2.
Publicado
2016-06-30
Como Citar
JANAITE NETO, J.; FERNEDA, E. Ontologia como recurso de padronização terminológica no processo de recuperação de informação. Informação em Pauta, v. 1, n. 1, p. 30-45, 30 jun. 2016.