Information, Data and Technology

Guilherme Ataíde Dias

Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.

Moisés Lima Dutra

Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).

Fábio Mosso Moreira

São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.

Fernando de Assis Rodrigues

Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.

Ricardo César Gonçalves Sant'Ana

São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.


Organizators

Guilherme Ataíde Dias

Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.

Moisés Lima Dutra

Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).

Fábio Mosso Moreira

São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.

Fernando de Assis Rodrigues

Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.

Ricardo César Gonçalves Sant'Ana

São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.


Metadata standards for data description: overview of data repositories in Latin America

Pages: 303 - 313

Authors

Felipe Augusto Arakaki

Federal Institute of São Paulo and São Paulo State University | fe.arakaki@gmail.com | https://orcid.org/0000-0002-3983-2563 | https://lattes.cnpq.br/5324289839207169

Doutorando em Ciência da Informação pela Universidade Estadual Paulista - UNESP/Marília, Mestrado em Ciência da Informação pela Universidade Estadual paulista - UNESP/Marília e graduado em Biblioteconomia pela Universidade Estadual Paulista - Campus de Marília. É integrante do Grupo de Pesquisa "Novas Tecnologias em Informação" e do Grupo de Pesquisa "Dados e Metadados". Trabalha como bibliotecário no IFSP - Presidente Epitácio. Áreas de interesse incluem a Ciência da Informação, principalmente nos temas: Biblioteca escolar, Representação e organização da informação, Catalogação, Catalogação Automatizada, Metadados, Interoperabilidade, Padrões de Metadados, Dublin Core, BIBFRAME, Schema.org, Web Semântica e Linked Data.

Ana Carolina Simionato

Federal University of São Carlos | acsimionato@ufscar.br | https://orcid.org/0000-0002-0140-9110 | https://lattes.cnpq.br/9896600626524397

Graduation in Library Science from Universidade Estadual Paulista Júlio de Mesquita Filho - UNESP (2010), a master's degree (2012) and a doctorate (2015) in Information Science (Information and Technology Research Line) Mesquita Filho - UNESP. Since 2015, he has been an Adjunct Professor of the Department of Information Science, Federal University of São Carlos - UFSCar, working in the Postgraduate Program in Information Science - PPCGI / UFSCar and in the undergraduate degree in Librarianship and Information Science - BCI / UFSCar . He is the leader of the research group Data and Metadata and collaborates with research groups Organization and Representation of Information and Knowledge of Imaging Resources and New Technologies in Information. Currently, she is the Coordinator of the Coordination of Programs of Scientific and Technological Initiation (CoPICT) of the Research Pro-Rectory (ProPq) of UFSCar. Has experience in metadata, cataloging and archival and museological description, conceptual and audiovisual modeling. Its preferences are: Data and Metadata, Linked Data, Conceptual model, Data model, Digital curatorship, Cultural heritage, Image and Audiovisual

Paula Regina Ventura Amorim Gonçalez

Federal University of Espírito Santo | paula.goncalez@ufes.br | https://orcid.org/0000-0002-5480-4106 | https://lattes.cnpq.br/1072374287964657

PhD in Information Science at Sao Paulo State University (UNESP), Master in Information Science at UNESP and Bachelor in Librarianship (UNESP). He is currently an Adjunct Professor of the Librarianship Department of the Federal University of Espírito Santo - UFES. Area of activity: Descriptive representation, cataloging, metadata, reliable digital repositories and digital curation.

Plácida Leopoldina Ventura Amorim da Costa Santos

São Paulo State University (UNESP) | placida@marilia.unesp.br | https://lattes.cnpq.br/7408791408049766

Professor at Cataloging at UNESP. PhD in Letters - Semiotics and General Linguistics by FFLCH / USP (1994), Master in Information Science from Campinas (1983) and Bachelor of Librarianship at UNESP (1980). Permanent professor of the Graduate Program in Information Science of the FFC / UNESP, in the research line Information and Technology. Vice-Leader of the Research Group? New Technologies in Information (GP-NTI). He develops his research on the following topics: Metadata, Cataloging and Technologies, Digital Intersemiosis, Information Networks, Human Knowledge Map. Researcher CNPq, coordinator of GT8 - Information and Technology, National Association of Research and Graduate in Information Science - Ancib (2013-2016). Editor of the journal Information & Technology (Itec), member of the editorial board of the journals Brazilian Journal of Information Science: research trends and Revista Eletrônica Informação e Cognição. Ad hoc advisor of development agencies and scientific journals, participates as a reviewer and as a member of Scientific Committees of scientific journals in Information Science in Brazil and abroad. Member of the National Association of Research and Post-Graduation in Information Science? ANCIB and member of the Board of Directors of the Brazilian Society of Cognitive Science? SBCC.

Video Transcription

Olá eu sou Felipe Augusto Arakaki, bibliotecário do Instituto Federal de São Paulo e vou apresentar o trabalho que abrange metadados para a descrição de dados e o panorama nos repositórios da América Latina. Trabalho aprovado no 2º Workshop de Informação Dados e Tecnologia 2018.

Esse trabalho é fruto de uma parceria com a Profª Ana Carolina Simionato da UFSCAR; Paula Regina Ventura Amorim Gonçalez da UFES e Plácida Leopoldina Ventura Amorim da Costa Santos da UNESP.

A preocupação para o efetivo gerenciamento de dados oriundos de pesquisas está sendo amplamente discutido pelas principais agências de fomento à pesquisa, visando o progresso científico além da contemporização de uma ciência aberta a todos os campos do conhecimento, esse movimento torna-se salutar na concepção dos repositórios de dados que são ambientes no auxílio a pesquisadores para a gerência disponibilização e acesso aos dados científicos.

A disponibilização de dados científicos para o acesso uso e reuso requer um planejamento e gerenciamento eficiente que devem ser iniciado desde a confecção do Data Management Plan ou plano de gerenciamento de dados pelo pesquisador no depósito dos dados durante toda a sua execução até a sua finalização para que os dados possam ser disponibilizados à comunidade científica se faz necessário apresentar requisitos padronizados e validadas segundo normas internacionais e assegurar uma infraestrutura adequada para a preservação digital.

Nesse sentido parte dessa infraestrutura equivale a composição dos metadados por meio dos seus padrões, assim a representação e o armazenamento dos dados é uma preocupação recorrente do profissional que tenha informação como seu objeto de trabalho.

Nesse contexto o crescimento do número de repositório de dados nos leva a seguinte indagação: quais são os padrões de metadados utilizado na representação dos dados científicos disponibilizado no repositório de dados na América Latina?

O objetivo desse trabalho é analisar a formalização dos padrões de metadados utilizados para descrição dos conjuntos de dados de pesquisa no âmbito dos repositórios de dados da América Latina registrados no Registry of Research Data Repositories.

O trabalho apresenta os resultado de uma abordagem qualitativa referente à representação da informação dos repositórios de dados científicos, para isso optou-se pela realização de uma pesquisa exploratória documental na literatura nacional e internacional sobre a temática e da descrição de conjuntos de dados em repositórios de dados.

Durante a fase de identificação e verificação dos resultados optou-se pela cobertura geográfica da América Latina. A base escolhida para a busca dos repositórios foi o re3data.org, sendo os resultados recuperados até o dia 4 de agosto de 2018. A base de dados re3data.org configura-se registo global dos repositórios de dados de pesquisa que abrange repositório de dados pesquisa de diferentes disciplinas acadêmicas, o filtro utilizado foi a cobertura geográfica no caso da América Latina e os resultados apresentaram, 29 repositórios cadastrados. Dos 29 repositório identificados foram localizados 11 repositórios do México, oito repositórios do Brasil, dois repositórios na Argentina, dois na Colômbia e dois no Panamá; Chile, El Salvador e Peru, foram localizados um repositório em cada um dos países; Bolívia, Costa Rica, Cuba, Equador, Guatemala, Haiti, Honduras, Nicarágua, Paraguai, República Dominicana, Uruguai e Venezuela não foram localizados nenhum repositório cadastrado.

Durante o levantamento foi observado que cinco repositórios utilizam o software DSpace, três repositórios utiliza o software Dataverse e dois repositórios utilizam o Drupal, um repositório utiliza o MetaCAP, um informou que usa a denominação “outro” mas não especificou o software utilizado. Entre os repositórios analisados ainda um considerou My-SQL como sistema de gerenciamento, os outros 16 repositórios apontaram que o sistema é desconhecido no contexto da plataforma re3data ou não informaram qual é o repositório ou sistema utilizado.

O uso de um software adequado para organizações de tratamento de dados influenciam diretamente nas possibilidades de recuperação, armazenamento, representação, acesso e uso das informações e também os padrões de metadados que vão suportar toda a representação da informação.

Dos 29 repositórios analisados quatro informaram que utilizam o padrão Dublin Core para representação da informação. O Dublin Core é um padrão geral de uso da web e possui basicamente 15 elementos, não foi possível observar nessa fase da pesquisa se esses repositórios utilizam perfis de aplicação ou utilizam o Dublin Core qualificado para descrição das informações, em contrapartida diversos outros repositórios utilizam padrões específicos da área de conhecimento em que o repositório está relacionado. Três repositórios utilizam o data documento iniciativa, um repositório informou que utilizam o padrão Darwin Core para representação dos documentos, ele é um padrão específico para área da biodiversidade, um repositório informou que usa o Ecological Metadata Language (EML) que está dentro do contexto de metadados da ecologia, um repositório informou que utiliza o Federal Geographic Data com Content Standard for Digital Geospatial Metadata que está relacionado a dados geoespaciais, um repositório que está no âmbito da astronomia informou que usa o Flexible Image Transport System, outro repositório informou que utiliza a ISO 19115 que e para dados geográficos também, um repositório informou que utiliza o ABCD que é o Access to Biological Collection Data, os demais repositórios não informaram o padrão de metadados que é utilizado para descrição das informações.

Durante o levantamento realizado constatou-se que grande parte dos repositórios da América Latina não utiliza ou não informaram os padrões de metadados adotados. Entre os 29 repositórios analisados o padrão que mais se destacou foi o Dublin Core. Em compensação alguns repositório utilizam metadados específicos da área do repositório, possibilitando uma descrição exaustiva das informações, além de permitir a interoperabilidade entre esses sistemas, outro ponto de destaque é que os princípios de descrição dos conjuntos de dados são fundamentados nos mesmos princípios de descrição de outros tipos de recursos internacionais, sendo que as propriedades de clareza, precisão, lógica e integridade devem ser equalizadas para todos os tipos de recursos diferenciando se apenas em especificidade relativa na forma e formato.

O reconhecimento para a importância dos dados científicos bem como o seu comportamento em compartilhamento de repositórios vem se potencializando com a criação de novas plataformas software sistemas para gerenciamento e outras possibilidades descrição de conjunto de dados entretanto essas pesquisas ainda carecem de desenvolvimento.

Obrigado.


Support

Federal University of Paraíba (UFPB)São Paulo State University (UNESP)Federal University of Santa Catarina (UFSC)Electronic Journal Digital Skills for Family Farming (RECoDAF)National Council for Scientific and Technological Development (CNPq)