Ferramentas da linguística computacional para ensino do Português

ferramentasdalinguisticacomputacional

* As candidaturas encerraram a 9 de fevereiro de 2014 *

Formação a distância - Camões, Instituto da Cooperação e da Língua

211_14 Ferramentas da linguística computacional para ensino do Português

2013-2014 | 2.º Semestre

Coordenação e tutoria:Jorge Baptista

Este curso decorrerá inteiramente a distância, através da plataforma de aprendizagem do Camões I.P., na modalidade de Oficina de Formação, com a duração de 25 horas (mais 25 horas de trabalho autónomo) e é creditado com o máximo de 2 créditos, relevando para a progressão em carreira de Professores dos Ensinos Básico e Secundário.

Processo de candidatura: Os candidatos à frequência desta oficina de formação a distância deverão preencher o formulário eletrónico disponível na página do Centro Virtual Camões, até ao dia 9 de fevereiro de 2014, impreterivelmente. Os dados fornecidos estão sujeitos a verificação por parte do Instituto Camões.

Início do curso: 19 de fevereiro de 2014

Preço do curso: A frequência da oficina implica o pagamento de 200 EUR (duzentos euros). No caso dos docentes da rede de Ensino do Português no Estrangeiro do IC, I.P., este custo é suportado em 50% pelo IC, I.P., pelo que os docentes terão de pagar apenas metade do valor indicado. O pagamento será feito através de transferência bancária. O número da conta será enviado aos candidatos que forem selecionados.

Número de formandos: O número de formandos será de vinte e cinco (25). De acordo com o regulamento da formação a distância, o Camões, I.P. reserva-se o direito de cancelar os cursos que, à data de início, não tenham o número mínimo de inscrições necessárias à sua realização, o qual corresponde às vagas definidas na publicitação do curso. O Camões, I.P. procederá à devolução do pagamento já efetuado por formandos de cursos nessa situação.

 
Razões justificativas da ação: Problema/Necessidade de formação identificado

O ensino da língua nas escolas talvez não tenha acompanhado adequadamente a evolução tecnológica, continuando a basear-se, em grande medida, nos métodos e instrumentos de aprendizagem tradicionais do "papel e lápis". Contudo, estão hoje à disposição de professores e alunos um grande conjunto de recursos e ferramentas que possibilitam explorar materiais linguísticos para aprendizagem da língua, tanto do ponto de vista da gramática como da expressão, entendendo esta como um objeto vivo, em permanente evolução. Conhecer esses recursos e saber usar as ferramentas disponíveis para os trabalhar, pode permitir ao professor de Português, tanto de língua materna como não-materna, elaborar, desenvolver e explorar materiais, refletir de forma mais rigorosa sobre o funcionamento da língua e motivar melhor as novas gerações para a dimensão experimental da gramática descritiva.

 
Efeitos a produzir: Mudança de práticas, procedimentos ou materiais didáticos

O objetivo principal deste curso consiste em divulgar um conjunto de recursos linguísticos e de ferramentas disponíveis na internet, exemplificando como estes podem ser utilizados no desenvolvimento de materiais didáticos para ensino de Português, tanto língua materna como não-materna; pretende-se assim contribuir ainda para uma melhor compreensão do funcionamento da língua graças ao desenvolvimento de atividades que desenvolvam uma dimensão experimental da descrição linguística, utilizando as chamadas novas tecnologias e, deste modo, motivar de forma mais eficaz a aprendizagem.

 
Conteúdos da ação

1. Corpora.

1.1. Conceitos gerais de linguística de corpus: representatividade, balanceamento, amostragem, amostragem estratificada, unidade de amostragem, universo de amostragem, 'closure', tipologia de corpora.

1.2. Corpora disponíveis para o português: apresentação. Dimensões, composição/géneros, mecanismos de busca, disponibilização e direitos/condições associados ao seu uso.

1.3. Procurar exemplos: Uso de expressões regulares para pesquisa de corpora (expressões simples); concordância e parametrização de concordâncias.

2. Aprender a Morfologia: (de/re/trans)formar palavras.

2.1. Ferramentas para descrição da morfologia flexional.

Breve introdução aos conceitos de máquinas de estados finitos, autómatos e transdutores (FSA e FST). Aplicações à flexão do português (casos simples: nomes, adjetivos e verbos).

2.2. A criatividade linguística na morfologia derivacional.

3. Aprender a Sintaxe: padrões, expressões, combinações.

3.1. Procura de padrões combinatórios entre as palavras: aprender ativamente "como se diz" e porque "soa melhor", ajudando a definir o "correto".

3.2. Descoberta de padrões de associação entre palavras (colocações). Conceito de medida de associação e algumas medidas simples.

4. Aprender a Semântica: Explorar o significado, as relações entre conceitos e redes de significado.

4.1. Recursos disponíveis (apresentação) e sua aplicação.

4.2. Experiências com relações de significado entre palavras.

 
Metodologias de realização da ação

O curso terá uma duração de 15 semanas, prevendo-se um total de 50 (cinquenta) horas de trabalho por parte dos alunos. Este trabalho inclui atividade: (a) autónoma, para leitura de textos e reflexão sobre as matérias neles versadas; (b) com apoio à distância através de tutoria síncrona; (c) com participação assíncrona em fóruns de discussão e (d) de elaboração de trabalhos e/ou testes.

 
Regime de avaliação dos formandos

Escala de avaliação de 1 a 10 valores, de acordo com a Carta Circular CCPFC-3/2007. A aprovação no curso dependerá da obtenção de classificação igual ou superior a 5 valores e da frequência mínima de 2/3 do total de horas da ação.

A Classificação final será obtida através da ponderação da seguinte fórmula:

AC*20% + APTP*60% + RFRC*20%

AC – Avaliação da participação em fóruns

APTP – Avaliação do portfólio e dos trabalhos produzidos

RFRC – Relatórios dos formandos/reflexão crítica

 
Forma de avaliação da ação

A ação será avaliada através de um questionário anónimo relativo à satisfação com o curso e serviços associados, assim como através de um Inquérito de Ambiente de Aprendizagem Em-linha COLLES.

O inquérito COLLES inclui 24 declarações agrupadas em seis escalas, cada uma destinada a uma questão chave sobre a qualidade do ambiente de ensino via web (Relevância, Reflexão, Interação, Apoio Tutorial, Apoio dos Colegas, Interpretação).

 

Bibliografia fundamental

Branco, A.; Mendes, A.; Ribeiro, R. (eds.). 2004. Language Technology for Portuguese, shallow processing tools and resources. Lisboa: Colibri.

Généreux, M. ; Hendrickx, I.; Mendes, A. 2011. Manual for the CRPC CQPweb interface. Lisbon:CLUL. http://alfclul.clul.ul.pt/CQPweb/doc/CRPCmanual.v1_en.pdf.

Jurafsky, D.; Martin. 2008. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition (International Version). Pearson.

Manning, Ch.; Schütze, H. 2003. Foundations of Statistical Natural Language Processing (2nd. ed.). Cambridge, MA: MIT Press.

Marques, A. 2007. Tento na Língua! Lisboa: Plátano Editora.

Mitkov, R. (ed.) 2005. The Oxford Handbook of Computational Linguistics. Oxford: OUP.

Paumier, S. 2008. Unitex 2.0 Manual. Marne-la-Vallée: IGM/Université Paris-Est Marne-la-Vallée. http://www-igm.univ-mlv.fr/~unitex/UnitexManual2.0.pdf

Ranchhod, E. 2001. Tratamento das Línguas por Computador. Uma introdução à Linguística Computacional e suas aplicações. Lisboa: Caminho.

McEnery, T.; Xiao, R.; Tono, Y. 2006. Corpus-Based Language Studies. An advanced resource book. London: Routledge.

 
Bibliografia de referência

Bechara, E. 2009. Moderna Gramática Portuguesa (atualizada pelo novo Acordo Ortográfico), 37ª ed. rev. e ampl. Rio de Janeiro: Editora Lucerna.

Mira Mateus, M.; Brito, A.; Duarte, I.; Faria, I.; Frota, S.; Matos, G. Oliveira, F. Vigário, M.; Vilalva, A. 2003. Gramática da Língua Portuguesa. Lisboa: Caminho.

Cunha, C.; Cintra, L. 1986. Nova Gramática do Português Contemporâneo. Lisboa: Edições João Sá da Costa.

 
Ligações

Ciberdúvidas da Língua Portuguesa: http://www.ciberduvidas.pt/

Linguateca: www.linguateca.pt

STRING: https://string.l2f.inesc-id.pt

REAP.PT: http://call.l2f.inesc-id.pt/reap.public/

 
Notas biográficas

Jorge Baptista, docente da Faculdade de Ciências Humanas e Sociais da Universidade do Algarve (UALG) e investigador do Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa (INESC-ID Lisboa) e do Centro de Estudos em Ciências da Linguagem da Universidade do Algarve (CECL). Professor de Linguística e Linguística Computacional. Diretor do Curso de Mestrado Internacional em Processamento de Linguagem Natural e Indústrias da Língua (Mestrado Erasmus Mundus), na UALG.

Conteúdos: