| dc.contributor.advisor | Amorim, Fernanda Araujo Baião | |
| dc.contributor.author | Silva, Mateus Ferreira | |
| dc.date.accessioned | 2018-06-25T20:20:59Z | |
| dc.date.available | 2018-06-25T20:20:59Z | |
| dc.date.issued | 2015-09-24 | |
| dc.identifier.citation | SILVA, Mateus Ferreira. Learning data-aware declarative models from provenance data. 2015. 62 f. Dissertação (Mestrado em Informática) - Universidade Federal do Estado do Rio de Janeiro, Rio de Janeiro, 2015. | pt_BR |
| dc.identifier.uri | http://hdl.handle.net/unirio/11793 | |
| dc.description | Dissertação também disponível em formato impresso, com o número de chamada CCET MI 2015/13. | pt_BR |
| dc.description.sponsorship | n/a | pt_BR |
| dc.language.iso | English | pt_BR |
| dc.rights | openAccess | pt_BR |
| dc.title | Learning data-aware declarative models from provenance data | pt_BR |
| dc.type | masterThesis | pt_BR |
| dc.contributor.advisor-co | Revoredo, Kate Cerqueira | |
| dc.contributor.referee | Amorim, Fernanda Araujo Baião | |
| dc.contributor.referee | Revoredo, Kate Cerqueira | |
| dc.contributor.referee | Santoro, Flávia Maria | |
| dc.contributor.referee | Oliveira, Daniel Cardoso Moraes de | |
| dc.degree.department | CCET | pt_BR |
| dc.degree.grantor | Universidade Federal do Estado do Rio de Janeiro - UNIRIO | pt_BR |
| dc.degree.level | Mestrado Acadêmico | pt_BR |
| dc.degree.local | Rio de Janeiro, RJ. | pt_BR |
| dc.degree.program | Programa de Pós-Graduação em Informática | pt_BR |
| dc.subject.cnpq | CIÊNCIAS EXATAS E DA TERRA | pt_BR |
| dc.subject.cnpq | CIÊNCIA DA COMPUTAÇÃO | pt_BR |
| dc.subject.en | Data-aware | pt_BR |
| dc.subject.en | Declarative model | pt_BR |
| dc.subject.en | Provenance data | pt_BR |
| dc.subject.en | Scientific workflow | pt_BR |
| dc.description.abstracten | Data provenance represents a collection of metadata on the origin and history of data. In scientific workflows, this metadata is essential for operational support of scientific experiments. The amount of provenance data generated from scientific workflow executions grows exponentially through time, becoming infeasible for scientists to manually analyze its content. Thus, mechanisms for extracting and modeling the knowledge implicit in provenance data are demanding. Due to the diversity and flexibility inherent to scientific experimentation scenarios, declarative models are potentially adequate for the task. However, they typically do not consider data attributes, which would enrich its embedded knowledge with relevant information such as parameter values used in each workflow instance. A classification model may fill this gap. This work proposes an approach to automatically learn both declarative and a classification models from provenance data, and combine them into a unique view. This proposed approach was evaluated on two real scientific experiments scenarios on the domain of text mining and of Evapotranspiration estimation. | pt_BR |
| dc.degree.country | Brasil | pt_BR |
| dc.description.sponsordocumentnumber | n/a | pt_BR |
| dc.description.abstractpt | A proveniência de dados representa uma coleção de metadados sobre a origem e histórico dos dados. Em workflows científicos, este metadados é essencial para o apoio operacional de experimentos científicos. A quantidade de dados de proveniência gerados a partir de execuções de workflows científicos cresce exponencialmente ao longo do tempo, tornando-se inviável para os cientistas analisar manualmente o seu conteúdo. Assim, mecanismos para extrair e modelar o conhecimento implícito nos dados de proveniência são demandados. Devido à diversidade e flexibilidade inerente aos cenários de experimentação científica, modelos declarativos são potencialmente adequados para esta tarefa. Entretanto, eles tipicamente não consideram atributos de dados, o que poderia enriquecer seu conhecimento incorporado com informações relevantes, tais como os valores dos parâmetros utilizados em cada instância do workflow. Um modelo de classificação pode preencher esta lacuna. Este trabalho propõe uma abordagem para aprender automaticamente tanto modelos declarativos e de classificação a partir de dados de proveniência, e combiná-los em uma única visão. Esta abordagem proposta foi avaliada em dois cenários reais experimentos científicos no domínio de mineração de texto e de estimativa da evapotranspiração. | pt_BR |
| dc.subject.pt | Data-aware | pt_BR |
| dc.subject.pt | Modelo declarativo | pt_BR |
| dc.subject.pt | Dados de proveniência | pt_BR |
| dc.subject.pt | Workflow científico | pt_BR |