O Lextec é um projecto de carácter incremental, financiado pelo
Instituto Camões entre 2005 e 2009, que visa a
construção de um conjunto de recursos para domínios de especialidade. A versão agora
disponibilizada cobre 10 domínios técnicos: Ambiente;
Banca; Comércio;
Construção Civil; Energia;
Seguros; Telecomunicações;
Turismo; Direito Comercial Internacional;
e Economia e Gestão de Empresas. Cada domínio técnico
tem sido trabalhado de forma independente e progressiva, o que deixa em aberto a possibilidade de incremento
tanto da cobertura de cada um dos domínios representados como do seu número, que foi alargado
já por duas vezes desde o início deste projecto: de quatro para oito domínios, numa
segunda fase do projecto Lextec; e de oito para dez domínios, numa terceira fase. Os resultados finais
são apresentados e disponibilizados nesta página.
Para cada um destes domínios é disponibilizado: um glossário que integra expressões
linguísticas específicas do domínio em causa; uma base de textos autênticos que ilustram os
contextos de uso das expressões codificadas e/ou fornecem informações adicionais de interesse para a
compreensão dos conceitos envolvidos; e uma rede léxico-conceptual (wordnet) que relaciona entre si
as expressões codificadas através de relações de significado. Das relações
estruturantes especificadas nesta rede destacam-se as relações de sinonímia,
hiponímia/hiperonímia e meronímia/
holonímia, para além de um grande número de relações que
envolvem a estrutura dos eventos e as entidades neles participantes e de uma série de relações
inter-categoriais que permitem definir o significado de cada conceito com maior precisão (para uma descrição
detalhada destas relações, ver sobre os conteúdos). A cada expressão
é ainda associada uma definição precisa de cada conceito para o domínio técnico considerado.
São também assinalados registos marcados, em particular relativos a origem e contexto pragmático, por exemplo.
Para todas as expressões integradas neste recurso são ainda especificadas relações de
correspondência com expressões em Inglês.
Para além da consulta directa pelo utilizador, os resultados deste projecto podem também servir
de base a aplicações específicas no âmbito da Linguística Computacional e da Engenharia
da Linguagem, em particular as que envolvam sistemas de busca e extracção de informação para os
domínios técnicos cobertos.
Cada domínio de especialidade inclui 1000 expressões linguísticas de grande produtividade
no domínio em causa. O conjunto dos diferentes domínios envolve assim a codificação de
informação relativa a mais de 10000 unidades, incluindo a especificação de cerca de
20 000 relações léxico-conceptuais.
Ainda no âmbito do projecto Lextec, e dada a pretendida utilização directa dos resultados deste
projecto em contextos de ensino/aprendizagem do Português e de tradução de textos de especialidade, foi
também desenvolvido trabalho adicional no sentido de renomear as designações canónicas das
relações que integram as wordnets, por vezes opacas para um utilizador não especialista,
para que a versão que aqui se disponibiliza inclua designações mais transparentes.
Finalmente, cabe ainda referir o trabalho desenvolvido no que respeita à aplicação de
disponibilização dos resultados, desenhada de forma a ter um aspecto e funcionamento orgânicos,
garantindo que o utilizador possa aceder facilmente à informação codificada, através de uma
interface flexível e intuitiva, que permite uma navegação ágil dentro de cada um dos
domínios de especialidade.
Para referir este trabalho:
Marrafa, P., R. Amaro, S. Mendes, R. P. Chaves & S. Lourosa (2009) LexTec –
Léxico Técnico do Português: Ambiente, Banca, Comércio,
Construção Civil, Direito Comercial Internacional, Economia e Gestão
de Empresas, Energia, Seguros, Turismo, Telecomunicações, Instituto Camões,
http://instituto-camoes.pt/lextec.