Anotação multicamada para corpora históricos do Português
Palavras-chave:
Corpus Histórico do português Tycho Brahe, anotação multicamadaResumo
Resumo: No percurso das pesquisas realizadas com corpora embasados na metodologia de anotação do Corpus Histórico do português Tycho Brahe, foram identificados problemas e desafios a serem transpostos no respectivo sistema de anotação. Tendo como parâmetro o princípio de fidedignidade aos documentos originais para corpora históricos que contribuem também com pesquisas filológicas, este trabalho mostra uma proposta inicial de alteração no esquema de anotação morfossintática e de edições do Corpus Tycho Brahe para solucionar por ora o problema encontrado nas representações da quebra de linha/página e das edições. A solução proposta atende ao requisito de fidedignidade ao mesmo tempo em que alcança maiores conformidade e interoperabilidade.
Abstract: In the course of the researches conducted with corpora based on the annotation methodology of the Corpus Histórico do português Tycho Brahe, some problems and challenges in the respective annotation system were identified. Taking as a parameter the principle of reliability of original documents for historical corpora that also contribute to philological research, this work shows an initial proposal to change the morphosyntactic and editions annotation scheme Corpus Tycho Brahe's to solve the problem found in line / page break and text editions. The proposed solution meets the requirement for reliability while achieving greater compliance and interoperability.