Metadados

Os documentos do Portal M.A.P. integram dois formatos de Metadados: Metadados na estrutura gerada automaticamente pelo eDictor e os Metadados na estrutura usada no Catálogo M.A.P.

O eDictor oferece uma estrutura muito simples para os Metadados, que não pode ser editada; entretanto, o conteúdo dos Metadados é inteiramente customizável. Como o eDictor é a base de todas as edições filológicas feitas no M.A.P., precisamos manter nos documentos .xml editados a estrutura de Metadados oferecida pelo eDictor. Partindo dessa contingência, desenvolvemos uma adaptação na qual todas as categorias incluídas na descrição catalográfica do M.A.P. se tornam compatíveis com a estrutura do eDictor, sendo o mapeamento entre as duas estruturas facilitado.

As imagens abaixo permitem comparar a estrutura do XML do Catálogo M.A.P. à estrutura do cabeçalho de um XML gerado pelo eDictor.

Metadados do Catálogo M.A.P.
Metadados eDictor: geração M.A.P.

Originalmente, os documentos gerados pelo eDictor são estruturados com uma única categoria metadata, contendo os dados internos da ferramenta (data de criação, título etc.). Entretanto, o eDictor permite a inserção de quantas camadas de metadata sejam desejadas, desde que preservada a estrutura interna:

<metadata>
    <meta>
        <n>('conteúdo')</n>
        <v>('conteúdo')</v>
    </meta>
</metadata>
Em nossa adaptação, inserimos uma classe metadata com o atributo generation="MAP", e usamos a estrutura n ('nome') e v ('valor') para nomes e valores das categorias catalográficas M.A.P. do documento. Na versão XML simples do Catálogo M.A.P., essas categorias se organizam em uma estrutura plana:

<categoria>('conteúdo')</categoria>
Para adaptar aos metadados do eDictor, os nomes das categorias de catalogação do MAP passam a ser o conteúdo do elemento v da estrutura do eDictor. Por exemplo:

<nome_modernizado>Francisca Luís</nome_modernizado>
<meta>
    <n>nome_modernizado</n>
    <v>Francisca Luís</v>
</meta>

É de fato a partir dessa junção entre o cabeçalho XML do eDictor e o antigo XML do Catálogo M.A.P. que surge o formato básico do Portal M.A.P., no qual cada instância catalogada corresponde apenas a um documento XML, que inclui os dados catalográficos M.A.P. na forma dos Metadados eDictor e, se for o caso, a edição filológica do documento. Esse sistema é ilustrado pelas imagens abaixo.

Observe-se também que, naturalmente, cada um desses documentos XML (bem como o conjunto dos XMLs) pode gerar diferentes visualizações HTML com diferentes finalidades. No momento, temos a visualização de Fichas catalográficas individuais, Edições (semidiplomáticas, modernizadas, etc.) e uma visualização com todas as Fichas reunidas (com ligações para o conjunto documental de cada instância).

Metadados eDictor: todos
Metadados eDictor: camada texto em destaque


As imagens mostram o código XML de base para a instância catalográfica 0031, Francica Luís.

Na primeira imagem está a estrutura XML inteira, em colapso - neste caso, o conteúdo do elemento metadata generation="MAP" seria o ilustrado mais acima.

Na segunda imagem apenas o cabeçalho está em colapso, para mostrar a estrutura do documento editado. O trecho que aparece na imagem é o primeiro parágrafo da edição.

Importa observar que, no futuro próximo, essa estrutura de metadatos será modificada, em particular tendo em vista a remodelação do eDictor em um formato de XML compatível com o TEI (Text Encoding Initiative).

Nesse sentido, pensamos que a opção por tomar a estrutura atual dos metadados do eDictor como base para o Portal M.A.P. é muito apropriada, pois o novo eDictor 2.0 conterá mecanismos simples de importação do XML da versão 1.0. Assim, ao serem importados para o eDictor 2.0 nossos arquivos automaticamente terão seus metadados convertidos em um formato estandardizado.