Login
Primeira defesa de conclusão do curso

defesa geomar

O aluno Geomar Schreiner, orientado pelo Prof. Dr. Denio Duarte, apresentou seu trabalho de conclusão às 8 horas do dia 7 de fevereiro de 2014, sendo aprovado com nota 9. Geomar será o primeiro aluno a concluir o curso e já foi aprovado em 3 programas de mestrado (UFRGS, UFSC e UFPR). Sua opção foi pela UFSC e será orientado pelo Prof. Dr. Ronaldo dos Santos Mello (UFSC).  

 

Título do trabalho de conclusão: "Extração de Esquemas de Documentos XML: Uma Abordagem Probabilística"

 

A banca foi formada pelo Prof. Dr. Denio (presidente - orientador), Profa. Msc Andressa Sebben e o Prof. Msc Marcelo Cezar Pinto.

 

Resumo: Os dados que transitam pela Web são considerados dados semi estruturados. Estes dados possuem uma estrutura heterogênea, muitas vezes extensa e incompleta. Neste contexto, a XML ( Extensible Markup Language) é uma linguagem de marcação que define a estrutura de um documento. A XML possui uma organização hierárquica em árvore baseada em marcas o que a torna muito flexível. Devida a flexibilidade da linguagem XML, manipular documentos XML torna-se muito custoso quando não se possui informações sobre a estrutura (esquema) do mesmo. Assim, este trabalho propõe um método que realiza a extração de um esquema baseado em uma coleção de documentos XML. O método consiste em três passos:(i) criar uma Rede Bayesiana, (ii) com base na rede gerar uma gramática livre de contexto estendida e (iii) transformar a gramática em um esquema XML. A partir do método é proposta a ferramenta pExtract, que implementa o funcionamento do método. São apresentados também alguns resultados de experimentos utilizando a ferramenta criada, demonstrando seu funcionamento e a eficácia do método.