Título
Visualization and analytics of codicological data of Hebrew books
Autor
Pateiro, Tiago Miguel Garcez
Resumo
pt
A presente dissertação tem como objetivo obter conhecimento estruturado de
manuscritos hebraicos coletados por codicologistas. Estes manuscritos refletem a
produção de livros de uma região específica, nomeadamente a região "Sefarad", no
período entre os séculos X e XVI. O objetivo é fornecer um modelo de dados apropriado,
usando um vocabulário comum, para diminuir a natureza heterogénea desses conjuntos
de dados, bem como sua incerteza inerente causada pela natureza descritiva no campo da
Codicologia. Este projeto de investigação foi desenvolvido com o objetivo de aplicar
técnicas de visualização de dados e "data mining" no campo da Codicologia e Humanidades
Digitais. Usando os dados de manuscritos hebraicos como ponto de partida, esta
dissertação propõe um ambiente para análise exploratória a ser utilizado por especialistas
em Humanidades Digitais e Codicologia para aprofundar a compreensão dos dados
codicológicos, formular novas hipóteses de pesquisa, ou verificar existentes, e comunicar
as suas descobertas de uma forma mais rica. Para melhorar as visualizações e descoberta
de conhecimento, tentaremos usar métodos de data mining, como a "Association Rule
Mining" e "Formal Concept Analysis".
en
The goal is to provide a proper data model, using a common vocabulary, to
decrease the heterogenous nature of these datasets as well as its inherent uncertainty
caused by the descriptive nature of the field of Codicology. This research project was
developed with the goal of applying data visualization and data mining techniques to the
field of Codicology and Digital Humanities. Using Hebrew manuscript data as a starting
point, this dissertation proposes an environment for exploratory analysis to be used by
Humanities experts to deepen their understanding of codicological data, to formulate new,
or verify existing, research hypotheses, and to communicate their findings in a richer way.
To improve the scope of visualizations and knowledge discovery we will try to use data
mining methods such as Association Rule Mining and Formal Concept Analysis. The
present dissertation aims to retrieve information and structure from Hebrew manuscripts
collected by codicologists. These manuscripts reflect the production of books of a specific
region, namely "Sefarad" region, within the period between 10th and 16th.