ÚLTIMAS
NOTÍCIAS

Linguateca guarda mais de dois mil milhões de palavras em português
Revista PORT.COM • 17-Mai-2018
Linguateca guarda mais de dois mil milhões de palavras em português



De Oslo, na Noruega, onde dá aulas, Diana Santos coordena a Linguateca, uma 'biblioteca' não de livros, mas de palavras, ao todo mais de dois mil milhões em português, 'arrumadas' em textos dispostos num portal com domínio '.pt'.

Criada em 1999, na sequência de uma discussão pública em Lisboa sobre o processamento computacional da língua portuguesa, a Linguateca funciona como «um serviço à comunidade», refere Diana Santos, uma das coordenadores da Linguateca, professora de português na Universidade de Oslo, há 25 anos a viver na Noruega.

Sem financiamento desde 2011 - o que impede a renovação do portal para o tornar mais acessível e atrativo para as pessoas e a constituição de uma equipa técnica que possa em permanência rever os conteúdos e anotações -, a Linguateca é para «toda a gente», apesar de linguistas, engenheiros da linguagem ou programadores de 'software' informático serem o seu público-alvo.

O acesso ao portal é gratuito e não necessita de palavra-chave ou de inscrição. Uma rede de especialistas portugueses distribuída pelo país e estrangeiro responde a dúvidas.

O repositório linguístico escrito disponível, e que totaliza mais de dois mil milhões de palavras, inclui textos literários, jornalísticos e didáticos dos países lusófonos, cartas comerciais, conversas transcritas, frases em português de Portugal e do Brasil.

Existem também artigos do jornal comunista Avante! e 309 obras de 55 autores portugueses, desde "Carta a el-rei D. Manuel sobre o achamento do Brasil", escrita por Pero Vaz de Caminha em 1500, a "Memórias III", tomo redigido por Raul Brandão em 1933.

Após a sua morte, foi anexado a uma das 'estantes' da Linguateca o "corpo linguístico" José Mariano Gago, que reúne testemunhos, discursos, cartas, entrevistas e artigos.

Como este, todos os restantes corpos linguísticos da Linguateca portuguesa são uma série de textos anotados com informação relacionada com o seu conteúdo, como a categoria gramatical de cada palavra, estrangeirismos, tempo verbal, funções sintáticas, temas e expressões idiomáticas.

Diana Santos, professora catedrática com formação de base em engenharia de computadores, explicou que a Linguateca permite aos linguistas obterem material de estudo da língua e dá às empresas de 'software' informático estrangeiras ferramentas para desenvolverem, por exemplo, um corretor ortográfico para português.

A 'biblioteca' da língua portuguesa tem para consulta listas de publicações (livros, capítulos de livros, atas, 'posters', teses, artigos de conferências científicas, relatórios e monografias), de empresas e associações que trabalham com o idioma, glossários especializados, conjugadores verbais, tradutores automáticos e analisadores sintáticos ou morfológicos.

À Linguateca, que 'guarda' em formato digital a escrita em português, possibilitando o seu estudo em detalhe, foi adicionada uma Gramateca, uma 'filial' vocacionada para a gramática da língua portuguesa.


Etiquetas
Partilhar

OPINIÃO
Quanto 'vale' o investidor da Diáspora?
José Caria
Diretor Adjunto da PORT.COM
Sagres, uma marca de bebida com história e identidade
Nuno Pinto Magalhães
Diretor de Relações Institucionais da SCC
Felicidade? Lusodescendentes! Exemplo: São Paulo
Jack Soifer
Consultor Internacional
DISCURSO DIRETO
Encontro Intercalar na Madeira será iniciativa coroada de êxito
José Luís Carneiro, SEC
PORTUGAL
Invest Madeira: o epicentro da vontade dos investidores
Ana Filipa Ferreira, Dir. Invest Madeira
PORTUGAL
Sejam bem-vindos à Madeira!
Miguel Albuquerque
PORTUGAL
REDES SOCIAIS
GALERIA DE FOTOS
QUIZ