Inf. Pauta, Fortaleza, CE, v. 8, 2023 | ISSN 2525-3468
ABSTRACT
Information retrieval is a recent term, created in
1951, but its objective has been desired for
millennia in society. With the evolution of
information technology, in the 1970s, and
especially the creation of the Web, in 1989, the
term had its meaning enhanced in new
scenarios. The classic information retrieval
models obtained contributions from computing
techniques to optimize results and dialogue with
users, as proposed by the ChatGPT artificial
intelligence language model, launched in 2022.
The objective of this report was to analyze
information retrieval on the Web with ChatGPT.
For this purpose, a domain was selected: open
data, which is originally diverse, and exploratory
searches were carried out to identify the
information and digital objects recovered, in
February 2023. The model used in ChatGPT
demonstrated a superior capacity to web search
engines, by retrieving information and resources
from different sources and presenting them in
an organized and cohesive text. However, the
lack of reference to the sources used and clarity
on ethical issues are problems seen in the free
version. It is expected that, with adjustments,
ChatGPT will recover several resources on the
Web, achieving interoperability with other
systems, contributing to the exchange of data in
different domains.
Keywords: information retrieval; artificial
intelligence;ChatGPT;virtual assistant; open
data.
1 INTRODUÇÃO
A recuperação de informação é uma área da ciência da computação aplicada a
diversos domínios. Na ciência da informação, a temática trata da representação,
armazenamento, organização e acesso à informação, sempre considerando o contexto do
usuário. Apesar de o termo ter sido criado somente nos anos 1950, por Calvin Moores,
há milênios as bibliotecas já organizavam a informação com o objetivo de facilitar sua
recuperação.
Durante a década de 1970, vários modelos de recuperação de informação foram
propostos, se tornando base para os sistemas de informação da época. Contudo, além
dos modelos clássicos, evoluções foram percebidas com a criação dos modelos
dinâmicos, especialmente após a criação da Web, em 1989.
Na representação do processo de recuperação, a expressão de busca é o meio que
o usuário emprega para comunicar a sua necessidade informacional para o sistema de
informação, sendo composta por linguagem natural ou artificial. Ao utilizar uma
linguagem artificial é necessário que o usuário tenha conhecimento do tema de interesse
e do seu vocabulário de domínio (Ferneda, 2012).
Com isso, pensado em oferecer facilidades ao usuário, são cada vez mais comuns
sistemas que utilizam a linguagem natural para interação com usuário e tratam a
representação da busca no sistema, traduzindo a necessidade de informação do usuário.
Assistentes virtuais, ou chatbot, foram desenvolvidos para ter uma conversa com um