IMPLEMENTAÇÃO LINGUÍSTICO-COMPUTACIONAL DE EXPRESSÕES MULTIPALAVRAS: UMA ANÁLISE A PARTIR DA HPSG EM UM CORPUS DE DOMÍNIO JURÍDICO

Autores

  • Katiuscia de Moraes Andrade
  • Leonel Figueiredo de Alencar Araripe

Resumo

Este trabalho tem por objetivo a construção de uma minigramática do Português Brasileiro (PB), utilizando o formalismo da HPSG no ambiente LKB Fos, capaz de identificar e gerar Expressões Multipalavras (MWEs) de um corpus de domínio jurídico. MWEs podem ser compreendidas como manifestações de fenômenos linguísticos (verbos de suporte, expressões idiomáticas, compostos etc) que apresentam alguma idiossincrasia lexical, sintática, semântica, pragmática ou estatística. A sistematização dessas construções é bastante complexa em razão do caráter idiossincrático e, até onde conhecemos, poucas são as gramáticas em PB que lhes dedicam algum registro. Por outro lado, as MWEs têm sido cada vez mais reconhecidas como elemento essencial para o conhecimento de uma língua. Além das lacunas teóricas, também há questões não solucionadas no âmbito do Processamento de Linguagem Natural (NLP), envolvendo as MWEs, que comprometem significativamente o desempenho dos sistemas, sobretudo, os que envolvem processamento semântico (VILLAVICENCIO et al., 2010). O formalismo da HPSG (Head-Driven Phrase Structure), por sua vez, possibilita a articulação entre os seus sub-módulos (fonologia, morfologia, sintaxe, semântica). O corpus escolhido foi o voto do Ministro Relator, Carlos Ayres Britto, no julgamento conjunto das ações ADPF 132/RJ e ADI 4277/DF, que reconheceu a união homoafetiva como entidade familiar. A próxima etapa do trabalho consistirá na limpeza e pré-processamento do corpus e a utilização de ferramentas computacionais para identificar automaticamente MWE’s, com posterior revisão manual.

Publicado

2019-01-01

Edição

Seção

XII Encontro de Pesquisa e Pós-Graduação