P-PAL: Uma base lexical com índices psicolinguísticos do Português Europeu

نویسندگان

  • Ana Paula Soares
  • Montserrat Comesaña
  • Álvaro Iriarte Sanromán
  • José João Almeida
  • Alberto Simões
  • Ana Costa
  • Patrícia Cunha França
  • João Machado
چکیده

Neste trabalho apresentamos o projecto Procura-PALvras (P-PAL) cujo principal objectivo é desenvolver uma ferramenta electrónica que disponibilize informação sobre ı́ndices psicolingúısticos objectivos e subjectivos de palavras do Português Europeu (PE). O P-PAL será disponibilizado gratuitamente à comunidade cient́ıfica num formato amigável a partir de um śıtio na Internet a construir para o efeito. Ao utilizar o P-PAL, o investigador poderá fazer uma utilização personalizada do programa ao seleccionar, da ampla variedade de análises oferecidas, os ı́ndices que se adequam aos propósitos da sua investigação e numa dupla funcionalidade de utilização: pedir ao programa para analisar listas de palavras previamente constitúıdas nos ı́ndices considerados relevantes para a investigação ou para obter listas de palavras que obedeçam aos parâmetros definidos. O P-PAL assume-se assim como uma ferramenta fundamental à promoção e internacionalização da investigação em Portugal.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Análise Morfossintáctica para Português Europeu e Galego: Problemas, Soluções e Avaliação

As diferentes tarefas de análise morfossintáctica têm muita importância para posteriores níveis do processamento da linguagem natural. Por isso, estes processos devem ser realizados com ferramentas que garantam bons desempenhos em relação à cobertura, precisão e robustez na análise. FreeLing é uma suite com licença GPL desenvolvida pelo Grupo TALP da Universitat Politècnica de Catalunya. Este s...

متن کامل

Vencendo a escassez de recursos computacionais. Carvalho: Tradutor Automático Estatístico Inglês-Galego a partir do corpus paralelo Europarl Inglês-Português

À hora de desenvolver muitas ferramentas estat́ısticas de Processamento da Linguagem Natural tornase essencial a utilização de grandes quantidades de dados. Para salvar a limitação da escassez de recursos computacionais para ĺınguas minorizadas como o galego é necessário desenhar novas estratégias. No caso do galego, importantes romanistas têm teorizado que galego e português são variantes do po...

متن کامل

Reconhecimento de Informações Comuns para a Fusão de Sentenças Comparáveis do Português

A fusão de sentenças é uma tarefa que consiste em produzir, a partir de um conjunto de sentenças relacionadas, uma única sentença que resume as informações comuns apresentadas no conjunto. Essa tarefa é de grande interesse em diversas aplicações do Processamento de Língua Natural (PLN), tais como a Sumarização Automática, a Tradução Automática, os sistemas de Perguntas e Respostas, entre outros...

متن کامل

Audimus - Sistema De Reconhecimento De Fala Cont Inua Para O Português Europeu

Neste artigo apresentamos o trabalho desenvolvido na realiza c~ao do AUDIMUS, um sistema de reconhecimento de fala cont nua para o Português europeu. Para a realiza c~ao de um sistema deste tipo foi necess ario recolher e desenvolver os diferentes componentes que s~ao dependentes da l ngua, como sejam uma base de dados de fala e respectiva segmenta c~ao e etiquetagem, grandes quantidades de tex...

متن کامل

Reindexação Automática em SGBDs Relacionais

We propose a solution to the automatic and online reindex problem. The proposed mechanism runs continuously and with almost no human intervention. The adopted strategy is based on ad-hoc heuristics that monitor the index fragmentation level and, when necessary, reindex it automatically. We have actually implemented our ideas within the PostgreSQL DBMS code. Practical performance tests show the ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Linguamática

دوره 2  شماره 

صفحات  -

تاریخ انتشار 2010