Transkribus

A 17 de janeiro de 2022 teve início o projeto TraPrInq – Transcrever os processos da Inquisição portuguesa (1536-1821), financiado como projeto exploratório pela Fundação para a Ciência e Tecnologia (FCT) (EXPL/HAR-HIS/0499/2021). Com o objetivo de criar um modelo de transcrição automatizada de documentos manuscritos portugueses dos séculos XVI ao XIX, uma equipa de 10 paleógrafos e historiadores, liderada pelo investigador do CHAM Hervé Baudry, tem trabalhado na plataforma Transkribus.

A paleografia digital veio revolucionar o acesso público aos arquivos e aos documentos digitais disponibilizados em linha. A transcrição automatizada da escrita (Handwritten Text Recognition – HTR) coloca ao alcance de todos a leitura, muitas vezes complicada, da imensa produção manuscrita de diferentes épocas. É também um instrumento necessário para a transcrição dos impressos antigos, em regra geral insatisfatoriamente transcritos por OCR. A transcrição automatizada de documentos de proveniência variada implica pelo menos três objetivos: a leitura e a consulta, a edição e a melhoria do modelo.

Ao fim de 14 meses de projeto, as conclusões preliminares são que o modelo permite transcrever pelo menos 54% dos documentos dos processos da Inquisição de Lisboa com uma margem de erro inferior a 5% (dados de abril de 2023). Ao mesmo tempo, tem provado a sua eficácia em documentos dos inícios do século XVI até inícios do século XIX, produzidos em contextos inquisitoriais e não inquisitoriais. O seu potencial de utilização em arquivos e/ou instituições detentoras de manuscritos é enorme, tornando acessível conteúdos não pesquisáveis quando em modo imagem.

O projeto tem a sua conclusão a 16 de julho de 2023. A partir desta data, o modelo ficará operacional na plataforma Transkribus, em acesso público seguindo os princípios da Ciência Aberta. Quanto maior for a utilização do modelo, numa maior diversidade de tipologias documentais produzidas em diferentes contextos, maior será a probabilidade de melhorar a transcrição automática.

A partilha dos resultados do projeto vai ser feita a 22 de junho com um colóquio e a 23 de junho com um encontro entre investigadores e responsáveis convidados, que manifestem interesse em participar (sobre o colóquio.  Quem estiver interessado em conhecer mais sobre o projeto e utilização do modelo no Transkribus, pode enviar um email com manifestação de interesse para traprinq@gmail.com  

Ana Margarida Dias da Silva
Associada BAD 2966

Similar Posts