o projecto Lextec

O Lextec é um projecto de carácter incremental, financiado pelo Instituto Camões entre 2005 e 2009, que visa a construção de um conjunto de recursos para domínios de especialidade. A versão agora disponibilizada cobre 10 domínios técnicos: Ambiente; Banca; Comércio; Construção Civil; Energia; Seguros; Telecomunicações; Turismo; Direito Comercial Internacional; e Economia e Gestão de Empresas. Cada domínio técnico tem sido trabalhado de forma independente e progressiva, o que deixa em aberto a possibilidade de incremento tanto da cobertura de cada um dos domínios representados como do seu número, que foi alargado já por duas vezes desde o início deste projecto: de quatro para oito domínios, numa segunda fase do projecto Lextec; e de oito para dez domínios, numa terceira fase. Os resultados finais são apresentados e disponibilizados nesta página.

Para cada um destes domínios é disponibilizado: um glossário que integra expressões linguísticas específicas do domínio em causa; uma base de textos autênticos que ilustram os contextos de uso das expressões codificadas e/ou fornecem informações adicionais de interesse para a compreensão dos conceitos envolvidos; e uma rede léxico-conceptual (wordnet) que relaciona entre si as expressões codificadas através de relações de significado. Das relações estruturantes especificadas nesta rede destacam-se as relações de sinonímia, hiponímia/hiperonímia e meronímia/ holonímia, para além de um grande número de relações que envolvem a estrutura dos eventos e as entidades neles participantes e de uma série de relações inter-categoriais que permitem definir o significado de cada conceito com maior precisão (para uma descrição detalhada destas relações, ver sobre os conteúdos). A cada expressão é ainda associada uma definição precisa de cada conceito para o domínio técnico considerado. São também assinalados registos marcados, em particular relativos a origem e contexto pragmático, por exemplo. Para todas as expressões integradas neste recurso são ainda especificadas relações de correspondência com expressões em Inglês.

Para além da consulta directa pelo utilizador, os resultados deste projecto podem também servir de base a aplicações específicas no âmbito da Linguística Computacional e da Engenharia da Linguagem, em particular as que envolvam sistemas de busca e extracção de informação para os domínios técnicos cobertos.

Cada domínio de especialidade inclui 1000 expressões linguísticas de grande produtividade no domínio em causa. O conjunto dos diferentes domínios envolve assim a codificação de informação relativa a mais de 10000 unidades, incluindo a especificação de cerca de 20 000 relações léxico-conceptuais.

Ainda no âmbito do projecto Lextec, e dada a pretendida utilização directa dos resultados deste projecto em contextos de ensino/aprendizagem do Português e de tradução de textos de especialidade, foi também desenvolvido trabalho adicional no sentido de renomear as designações canónicas das relações que integram as wordnets, por vezes opacas para um utilizador não especialista, para que a versão que aqui se disponibiliza inclua designações mais transparentes.

Finalmente, cabe ainda referir o trabalho desenvolvido no que respeita à aplicação de disponibilização dos resultados, desenhada de forma a ter um aspecto e funcionamento orgânicos, garantindo que o utilizador possa aceder facilmente à informação codificada, através de uma interface flexível e intuitiva, que permite uma navegação ágil dentro de cada um dos domínios de especialidade.



Para referir este trabalho:

Marrafa, P., R. Amaro, S. Mendes, R. P. Chaves & S. Lourosa (2009) LexTec – Léxico Técnico do Português: Ambiente, Banca, Comércio, Construção Civil, Direito Comercial Internacional, Economia e Gestão de Empresas, Energia, Seguros, Turismo, Telecomunicações, Instituto Camões, http://instituto-camoes.pt/lextec.