TECNOLOGIA NA ELABORAÇÃO DE DICIONÁRIO: O USO DO SOFTWARE ANTCONC

Autores

  • Bruno Roberto Machado Oliveira
  • Antônio Luciano Pontes
  • Lucimara Alves da Conceição Costa
  • Maria Claudete Lima

Resumo

Antes do desenvolvimento das tecnologias computacionais, a elaboração de trabalhos lexicográficos era de grande dificuldade. Para a seleção de termos, era necessário um enorme labor: dever-se-ia analisar todo o corpus coletado manualmente para a procura de termos que não haviam sido ainda compilados, atividade que poderia levar dias. O avanço tecnológico permitiu o desenvolvimento de programas de busca terminológicas, que analisam instantaneamente o corpus construído e que tornam mais confiável a análise dos dados coletados. Uma atividade que demandava dias, agora é feita em minutos de maneira mais eficiente. Um dos programas responsáveis por isso é o AntConc, que vem sendo utilizado na seleção de termos dos volumes do Dicionário Enciclopédico da Linguística. Este trabalho tem como objetivo descrever os resultados do levantamento lexicográfico de termos da área da linguística, que comporão o primeiro volume, dedicado ao Léxico, Lexicologia e Lexicografia. Foram compilados como corpus 95 trabalhos acadêmicos sobre a área do Léxico, dentre eles, artigos de revistas e anais, monografias, dissertações de mestrado, teses de doutorado, que juntos somaram 273.373 palavras. Utilizando o AntConc, foram excluídos os termos gramaticais, restando 116.134 palavras, das quais 1184 eram termos simples a serem analisados. Após essa etapa, fez-se, por meio do programa, a procura de termos compostos, os Clusters, baseada nos 10 termos que mais frequentemente apareceram, resultando em 10.156 clusters. Após a análise dos termos simples e compostos, chegou-se a 34 e 52 termos, respectivamente, totalizando 86 termos. Após a retirada de sinônimos, restaram 64 termos, os quais serão entradas de verbetes enciclopédicos constituintes do primeiro volume do Dicionário Enciclopédico de Linguística, que será disponibilizado gratuitamente e on-line e será composto por vários volumes, publicados aos poucos e dedicados, cada um, a uma subárea da ciência linguística.

Publicado

2021-01-01

Edição

Seção

XXX Encontro de Extensão