Information, Data and Technology

Guilherme Ataíde Dias

Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.

Moisés Lima Dutra

Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).

Fábio Mosso Moreira

São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.

Fernando de Assis Rodrigues

Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.

Ricardo César Gonçalves Sant'Ana

São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.


Organizators

Guilherme Ataíde Dias

Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.

Moisés Lima Dutra

Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).

Fábio Mosso Moreira

São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.

Fernando de Assis Rodrigues

Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.

Ricardo César Gonçalves Sant'Ana

São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.


Aspects of the data lifecycle in processes of construction of biomedical ontologies

Pages: 527 - 544

Authors

Jeanne Louize Emygdio

Federal University of Minas Gerais (UFMG) | jeanne.emygdio@gmail.com | https://orcid.org/0000-0002-7329-4447 | https://lattes.cnpq.br/6849175974671037

PhD student in Information Science, Federal University of Belo Horizonte - UFMG. Master in Development, Technologies and Society by UNIFEI-Itajubá. Specialist in Software Production with emphasis on Free Software by UFLA-Lavras, in Analysis, Project and Systems Management by PUC-Minas-Poços de Caldas and in Instructional Design for Virtual EaD by UNIFEI-Itajubá. Technologist in Data Processing by FUMEC University of Belo Horizonte. Areas of activity: Information Systems; Software Engineering; Database, Systems development; Implementation and Management of ERPs; Linux Server Administration; Integration of technology platforms and systems; Coordination and development of projects promoted by public agencies such as FAPEMIG and SEBRAE. Experience as an interdisciplinary scientific researcher in the areas of Development and Technologies (UNIFEI) and Management and Technologies of Information and Communication (UFMG / CAPES - in progress).

Eduardo Ribeiro Felipe

Federal University of Minas Gerais (UFMG) | erfelipe@hotmail.com | https://orcid.org/0000-0003-1690-2044 | https://lattes.cnpq.br/1010588591399870

Graduation in Data Processing Technologist from the Newton Paiva University Center, a post-graduate degree in Software Engineering from PUC-Minas and a master's degree from the School of Information Science at UFMG. Currently holds a PhD from ECI-UFMG and is an Information Technology Analyst at UFVJM. As a teaching experience, the following institutions stand out: a) Federal Institute of Southeastern Minas Gerais, b) School of Information Science ECI / UFMG, c) UNA and d) UNI-Bh.

Video Transcription

xOlá a todos meu nome é Eduardo sou aluno de doutorado na Universidade Federal de Minas Gerais sob a orientação do professor doutor Maurício Barcelo de Almeida eu e minha colega Jeane gostaríamos de apresentar o nosso artigo intitulado Aspectos do ciclo de vida de dados em processo de construção de ontologias biomédicas no segundo o workshop de informação dados e tecnologia dos nossos colegas da Universidade Federal da Paraíba.

Estaria apresentando a primeira parte com a introdução, referencial teórico, objetivos e logo em seguida minha colega dará seqüência a essa apresentação. Nessa primeira etapa eu dividi em quatro grandes grupos, onde o artigo na introdução apresenta conceitos ontologias em suas origens na filosofia, a sua vocação na representação na realidade dos seres, os seus aspectos intimamente ligados às classificações e principalmente a sua capacidade de estabelecer relações entre os elementos.

Também o artigo retrata interdisciplinaridade como um ponto forte das das ontologias e contribuições na área médica na questão da web semântica não podemos deixar de citar a capacidade da ontologia de retratar a realidade em um ambiente virtual na questão dos dados, também colocamos a origem das primeiras representações de conceitos de dados na teologia, o dado enquanto reflexo do contexto, o dado dependente da interpretação do observador e também a sua questão como insumo dos sistemas de informação. Insumo é uma unidade básica dos instrumentos informacionais utilizamos a definição da OECD com uma definição norteadora dos conceitos estabelecidos no artigo e com relação ao ciclo de vida citamos nesses slides aqui quatro boas referências que nos ajudaram na construção do trabalho falando mais especificamente sobre ciclo de vida a identificação inicial foi que ciclo de vida muitas vezes é citado em desenvolvimento de software em construção de ontologias mas foi um pouco mais difícil encontrar essa definição relacionada aos dados é importante ressaltar que encontramos definições de ciclo de vida em dados, porém é direcionados unicamente à persistência dos dados em um período onde a preocupação era o armazenamento e recuperação das informações visto que muitas informações foram perdidas quando os suportes informacionais tecnológicos, as fitas magnéticas nos disquetes eram substituídos com uma velocidade muito rápida impossibilitam muitas vezes a recuperação dos dados, a autora Briney ela apresenta dois ciclos de vida interessantes, um ciclo de vida que ela denomina de antigo com quatro processos básicos como é visto no slide e um ciclo de vida que ela denomina novo onde ela acrescenta os processos de preservação e reuso.

Também é importante notar nos dois outros ciclos de vidas importantes no artigo o da DataONE e de Santana especificamente direcionam ciclo de vida para a ciência da informação e nos remete muitas vezes e nos lembra muitas vezes no modelo interativo de desenvolvimento de software, pois bem em relação aos objetivos nós procuramos combinar os interesses de nossas teses do grupo de pesquisa Recol e da disciplina do professor Guilherme Dias, encontramos no trabalho da professora Fernanda Farinelli a ontologia OntoNEO e procuramos então compreender o ciclo de vida dos dados biomédicos em processo de construção ontológica.

Pelo tempo já procurando concluir a primeira parte eu quero destacar então que o ciclo de vida de dados ele traz diversos benefícios, ele pode tratar facilidade na recuperação dos dados da informação, ele pode permitir o uso em análise dos dados na pesquisa pelo próprio pesquisador como colaboradores ele é o ciclo de vida de dados, ele pode melhorar a tomada de decisão e principalmente fornecer dados de qualidade para pesquisas translacionais, onde um instrumento é utilizado como origem como fonte para outros instrumentos, pode permitir que cientistas externos ao projeto encontrem, entendam e utilizem esses dados no futuro e dentro desse cenário acrescentando a documentação por metadados é possível então estabelecer situações e créditos futuros de uma maneira mais ampliada além de permitir a rastreabilidade autoral.

Eu passo então para a segunda parte da apresentação do artigo agradeço a atenção de todos muito obrigado.

Saudações a todos meu nome Jeanne eu sou aluna de doutorado do programa de pós graduação em Gestão e Organização do Conhecimento da Universidade Federal de Minas Gerais e orientanda do Professor Doutor Luis Barcelos já aumenta nessa segunda parte vou apresentar a vocês os procedimentos metodológicos os resultados e as considerações finais do nosso estudo.

O estudo se caracterizou por uma natureza qualitativa caráter descritivo tendo sido realizado em três fases: a primeira delas compreendeu uma análise dos procedimentos de construção do OntoNEO em comparação com os processos de governança de dados previamente estudados representados pelo colega Eduardo utilizei aqui os termos processo de governança para compreender as fases do ciclo de vida de dados e processos dos planos de gestão de dados com vistas ao simplificar a minha apresentação.

A fase 2 nós organizamos os procedimentos de construção da OntoNEO em processos de governança de dados selecionados de Briney (2005), DataONE (2018) e Dias (2018). Esse último trabalho se baseia em padrões da Universidade Virginia para governança de dados.

Na fase 3 fizemos uma análise dos aspectos de qualidade e agregados ao OntoNEO em função das práticas de governança que foram adotadas em sua construção, encontramos dois resultados principais ao término do nosso estudo. O primeiro deles repousa sobre uma percepção clara dos aspectos de qualidade que a governança de dados pode proporcionar aos processos de construção de ontologias biomédicas e o segundo reforço de identificação de cinco macro processos relacionados à governança de dados e que podem ser aplicáveis a construção de ontologias biomédicas.

Então detalhando um pouquinho desses dois resultados nós temos entre os aspectos de qualidade identificados o primeiro deles repousando sobre uma premissa de que a ontologia na ser construída ela seria integrante de uma iniciativa denominada OBO Foundy é uma iniciativa internacional de construção de ontologias de alto valor de qualidade para integração de dados biomédicos.

Então pra que uma ontologia se agregue a esta iniciativa ela precisa também ser construída com altos padrões de qualidade seguindo as premissas definidas por esse projeto.

Então para o alcance desse nível de qualidade nós percebemos que a professora Fernanda ela adotou padrões tecnológicos internacionais especificidades técnicas e administrativas do contexto real médico que eles vão depressivo reuso de dados de outras antologias já integrantes a iniciativa OBO Foundy. Portanto com qualidade já previamente certificada pela iniciativa ou redução de modelos de ciclo de vida para a construção de sistemas de informação da área de engenharia de software da ciência da computação para a condução das práticas de engenharia de antologias no campo da ciência da informação o que também contribuiu para o aumento da qualidade dos artefatos final gerando.

Foi realizada uma prova de conceito que garantiu a eficiência do artefato informacional gerado no atendimento aos propósitos que motivaram sua construção. Esse modelo portanto ele é um modelo de representação do conhecimento de alta qualidade para a representação de dados biomédicos e foi disponibilizado em formato aberto em caráter permanente tendo um site próprio e ainda sendo possível o seu acesso no repositório de acesso público bio portal que também integra a iniciativa OBO Foundy paralelamente percebemo uma ampla divulgação e compartilhamento do conhecimento científico produzido pela pesquisadora.

A pesquisa também recebeu financiamentos de agências de fomento nacionais e internacionais porque ela foi realizada com uma pesquisa do tipo sanduíche, ela se realizou em parte do departamento de filosofia informática biomédica da Universidade de Buffalo e em parte aqui na escola sem essa informação da Universidade Federal de Minas Gerais.

Na sequência nós passamos ao detalhamento dos cinco macro processos que foram percebidos e que compreendem a gestão de informações sobre dados e formatos a gestão de conteúdo dos metadados e formatos a gestão de políticas para acesso, compartilhamento erros de dados a gestão de armazenamento de longo prazo e gestão de questões orçamentárias, então esses 5 macroprocessos, eles nos permitiram é uma visão de aderência ao ciclo de vida estudados em cada um daqueles autores que já foram citados nos dando uma percepção de que ainda não tenha sido esse o propósito inicial da pesquisa realizada pela nossa colega o cuidado a meticulosidade dela durante todas as fases de construção da ontologia ela permitiu uma aderência clara a ciclos de vida relevantes para a governança de dados e uma visualização de macroprocesso candidatos a estruturação de planos de gestão de dados específicos para esse tipo de pesquisa sendo assim nas nossas considerações finais temos retornar aos objetivos do nosso estudo afirmarmos que em função do volume e do valor dos resultados oriundos da pesquisa realizada pela professora doutora Fernanda Farinelli e que foi analisado em nosso estudo concluímos que a adoção de práticas de governança de dados em processos de construção de ontologias elas agregam maior qualidade aos artefatos informacionais gerados possibilita a formalização de melhores práticas para os processos de engenharia de ontologias e podem ainda fomentar pesquisas para formalização de ciclo de vida de dados ou planos de gestão de dados aplicáveis aos processos de engenharia de ontologias promovendo também avanços nas pesquisas voltadas à governança de dados.

Deixamos aqui os nossos contatos para elucidação de possíveis dúvidas e agradecemos a atenção de todos e pela grata oportunidade participarmos do 2º WIDAT um forte abraço.


Support

Federal University of Paraíba (UFPB)São Paulo State University (UNESP)Federal University of Santa Catarina (UFSC)Electronic Journal Digital Skills for Family Farming (RECoDAF)National Council for Scientific and Technological Development (CNPq)