página inicial

 
o projecto TemaNet

O Temanet é um projecto de carácter incremental, financiado pelo Instituto Camões no biénio 2005-2006, que visa a construção de redes léxico-conceptuais (wordnets) do Português organizadas em domínios semânticos. A selecção dos domínios semânticos visa a utilização directa dos resultados deste projecto em contextos de ensino/aprendizagem do Português, entre outros. Na versão actual incluem-se doze domínios semânticos: Alimentação, Arte, Comunicação, Desporto, Educação, Geografia, Habitação, Relações Humanas, Saúde, Seres Vivos, Transportes e Vestuário. Para além da sua consulta directa pelo utilizador, os resultados deste projecto podem também servir de base a aplicações específicas no âmbito da Linguística Computacional e da Engenharia da Linguagem, em particular nas que envolvam sistemas de busca e extracção de informação.

Cada wordnet integrada neste projecto inclui expressões lexicais que representam conceitos do respectivo domínio, ligadas entre si por relações de diversos tipos (para uma descrição detalhada destas relações, ver sobre os conteúdos). À semelhança da WordNet.PT, cada uma das redes é desenvolvida no quadro geral da EuroWordNet). Por conseguinte, a par das relações que estruturam a rede, permitindo deduzir o significado das unidades lexicais codificadas em função da posição que ocupam na rede, todas as wordnets contemplam ainda uma relação externa, que estabelece a correspondência das lexicalizações de um dado conceito com um registo do "Inter Lingual Index" (ILI) que permite aceder às lexicalizações desse mesmo conceito em Inglês e, através desta ligação, a lexicalizações noutras línguas.

Cada rede inclui as lexicalizações fundamentais do domínio em causa, com particular destaque para as três categorias lexicais mais representativas: nomes, adjectivos e verbos. O conjunto das diferentes redes envolve a codificação de informação relativa a mais de 15000 unidades, representadas através de cerca de 65000 relações, das quais mais de 51000 são relações internas e 14000 ligações a registos do ILI, i.e. às lexicalizações em Inglês dos conceitos em causa.

Ainda no âmbito do projecto Temanet, e dada a pretendida utilização directa dos resultados deste projecto em contextos de ensino/aprendizagem do Português, foi também desenvolvido trabalho adicional no sentido de renomear as designações canónicas das relações que integram as wordnets, por vezes opacas para um utilizador não especialista, no sentido de que a versão que aqui se disponibiliza inclua designações mais transparentes.

Finalmente, cabe ainda referir o trabalho desenvolvido no que respeita à aplicação de disponibilização dos resultados, desenhada de forma a ter um aspecto e funcionamento orgânicos, garantindo que o utilizador possa aceder facilmente à informação codificada, através de uma interface flexível e intuitiva, que permite uma navegação ágil intra- e inter-redes.



Para referir este trabalho:

Marrafa, P. , R. Amaro, S. Mendes, S. Lourosa & R. P. Chaves (2006) TemaNet – WordNets Temáticas do Português: Alimentação, Arte, Comunicação, Desporto, Educação, Geografia, Habitação, Relações Humanas, Saúde, Seres Vivos, Transportes e Turismo, Instituto Camões, http://www.instituto-camoes.pt/temanet.