Information, Data and Technology

Guilherme Ataíde Dias

Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.

Moisés Lima Dutra

Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).

Fábio Mosso Moreira

São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.

Fernando de Assis Rodrigues

Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.

Ricardo César Gonçalves Sant'Ana

São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.


Organizators

Guilherme Ataíde Dias

Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.

Moisés Lima Dutra

Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).

Fábio Mosso Moreira

São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.

Fernando de Assis Rodrigues

Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.

Ricardo César Gonçalves Sant'Ana

São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.


The term Big Data: paradigm break of n-V’s

Pages: 314 - 325

Authors

Marcos de Souza

Federal University of Minas Gerais (UFMG) | marcosdesouza82@gmail.com | https://orcid.org/0000-0002-9829-7249 | https://lattes.cnpq.br/3958131052236839

PhD student in Management and Organization of Knowledge by the Federal University of Minas Gerais - UFMG in the line of research in Management & Technology; holds a postgraduate Stricto Sensu in Cognition and Language by the Universidade Estadual Norte Fluminense - UENF in the line of research in? Interdisciplinary Research in Communication, Education and New Information Technologies; Post-graduation Lato Sensu in: Informatics in Education by the Federal Institute of Espírito Santo - IFES; Teaching of Higher Education by Centro Universitário São Camilo - Espírito Santo - CeUSC; Development of Application for WEB by the Higher Education Center of Juiz de Fora - CESJF; Graduated in Information Systems from Centro Universitário São Camilo - Espírito Santo - CeUSC. He worked as a professor (August 2006 to December 2016) and coordinator (April 2015 to December 2016) of the courses on Analysis and Development of Systems and Information Systems and professor of the Lato Sensu postgraduate course in Teaching Higher Education (2014 until 2016). Was responsible for the Distance Education Sector, also at Centro Universitário São Camilo - Espírito Santo CeUSC. He has knowledge in the areas of Distance Education, Publications and Development of Courses Projects. His areas of research are: Information Management; Knowledge management; Information systems; Computer and Society; Software Engineering; New Information and Communication Technologies; Distance Education; Education and Technologies; Man-machine interface; Free Software; Business Electronics; Project management.

Fernanda Gomes Almeida

Federal University of Minas Gerais (UFMG) | usernanda@gmail.com | https://orcid.org/0000-0001-7913-827X | https://lattes.cnpq.br/5601300780102290

PhD student at the Post-Graduate Program in Management & Organization of Knowledge of UFMG (2015-2019). Master in Information Science by the Post-Graduation Program in Information Science of UFMG (2012-2014). Graduated in Librarianship by the Federal University of Minas Gerais (2006). She has worked as a librarian at UFMG since 2008. Areas of interest: scientific data management; data management support services; digital curation; Portal of Journals of Capes; Information Retrieval Systems; User studies; Informational competence in higher education; Evaluation of informational competence; Behavior of information search; User training

Renato Rocha Souza

Federal University of Minas Gerais and Getulio Vargas Foundation | rsouza.fgv@gmail.com | https://orcid.org/0000-0002-1895-3905 | https://lattes.cnpq.br/4726949697973381

Graduation in Electrical Engineering from the Pontifical Catholic University of Rio de Janeiro (1993), a Masters in Production Engineering from the Federal University of Santa Catarina (2000), a PhD in Information Science from the Federal University of Minas Gerais (2005) and postdoctoral (01 / 2009-01 / 2010) in Semantic Technologies for Information Retrieval - University of South Wales, UK, under the supervision of Douglas Tudhope, with a grant from CNPQ. He is currently a professor and researcher at the School of Applied Mathematics (EMAp) of the Getúlio Vargas Foundation and a contributing professor at the School of Information Science of the Federal University of Minas Gerais. He is Visiting Fellow of the University of South Wales (2009-2019) and Senior Associate Researcher at Columbia University. He is a member of the Editorial Board of the "Knowledge Organization" and Deputy Editor of the "New Review of Hypermedia and Multimedia". He works in the areas of Applied Mathematics, Information Science and Data Science, having as research themes: Knowledge Representation, Natural Language Processing, Machine Learning, Information Retrieval Systems, Automatic Indexing, Ontologies, Semantics and Knowledge Management. He has extensive experience in Information Technology, including applied to Education, as well as experience in Distance Learning.

Video Transcription

Olá essa é uma apresentação referente ao trabalho aprovado junto ao 2º Workshop de Informação Dados e Tecnologia - WIDAT, que nessa edição de 2018 acontece na Universidade Federal da Paraíba. É uma pesquisa realizada com contribuição dos pesquisadores Fernando Gomes Almeida da Universidade Federal de Minas Gerais, Renato Rocha Souza também da UFMG e da Fundação Getúlio Vargas do Rio de Janeiro e por mim Marcos de Souza da Universidade Federal de Minas Gerais. O título da pesquisa é “O TERMO BIG DATA: quebra de paradigma dos n-V’s”.

Trata-se de uma pesquisa de referencial teórico, mas como muita contribuição no que diz respeito especificamente dos conceitos e das características de um Big Data. Pois bem para a gente poder falar de Big Data a gente tem que falar de dados, uma matéria que saiu no ano de 2017 no “The Economist” diz que os dados são considerados um novo petróleo na era digital, possuindo um valor altamente estratégico, nessa matéria destacam por exemplo as organizações que detém os dados também detém todo o poder. Ainda mais falando na questão econômica, alguns exemplos, Apple, facebook, Google e a Microsoft tiveram um faturamento de 25 bilhões de dólares apenas no primeiro semestre de 2017. Quer dizer, no ano passado é um faturamento consideravelmente muito alto, empresas que trabalham com dados.

Toda essa questão de produção e armazenamento de dados tem passado por um processo evolutivo desde a popularização dos computadores e da difusão da internet, desta forma pegar destaque a partir de uma produção massiva de dados realizada por exemplo por sites, por redes sociais digitais, por smartphones, sistemas informatizados, satélites, sensores de carros, aviões e trens, câmeras de segurança entre outros tipos de serviços como por exemplo stream que é esse agora que vocês estão vendo neste momento.

Além da evolução referente à capacidade de armazenamento de dados a autora Rosângela Marquesone, ela destaca que faz necessário ressaltar a quantidade de vezes que esses mesmos dados são compartilhados pelos próprios usuários. Partindo deste princípio de dados a gente consegue chegar ao conceito de Big Data cunhado a partir do crescimento e integração do grande volume de dados digitais como esses excitados agora há pouco, por exemplo diversos meios de tecnologias bem como o uso de ferramentas que perpassa pela por algumas etapas sendo elas produção, compartilhamento, curadoria e análise de uma maneira eficiente nessa gigantesca quantidade de dados.

Como resultado nessas informações elas geram por exemplo padrões significativo de novos conhecimentos. A Gartner desenvolveu um estudo no ano de 2001 no qual apresentou três características de um Big Data, sendo elas volume, variedade e velocidade, conhecido na literatura como 3-v’s, como um dos maiores desafios da manipulação e gestão de dados, esse viés tem sido discutido massivamente com muita relevância no meio acadêmico. Posteriormente surgiram mais dois v’s que é a “veracidade” relacionada à qualidade e o “valor” relacionado à relevância, formando assim ou incorporando assim os 5 v’s também na literatura, só que com a veracidade e com valor está voltado mais para um viés empresarial. Então essas cinco características, elas contribuem para uma definição de Big Data.

Justifica-se a importância desse trabalho pela notoriedade do termo de Big Data nos últimos anos, tanto no meio acadêmico quanto no meio empresarial e a discrepância no qual você encontra os conceitos na literatura, não existe uma homogeneidade de um conceito de Big Data e como hipótese acredita-se que por se tratar de um termo relativamente novo, principalmente por estar atrelado aos meios e avanços tecnológicos, pode surgir forma cotidiana novas características que contribuem com a diversidade desse conceito.

O objetivo dessa pesquisas está em identificar os conceitos relacionados ao termo Big Data e as características que compunham este conceito, então a definição de Big Data por exemplo por alguns autores é muito criticado, então por exemplo Boyd e Crawford falam que o tema Big Data é considerado muito pop, é equivocado e genérico por Davenport em um livro de 2017 recém lançado. O conteúdo desse trabalho ele parte do princípio que Big Data é um termo em fase de amadurecimento e que ainda está em processo de consolidação do seu conceito.

Trata-se de uma pesquisa de natureza básica abordando o problema de forma qualitativa do ponto de vista dos seus objetivos a pesquisa se classifica como exploratória e descritiva, da perspectiva dos procedimentos técnicos identifica-se como pesquisa bibliográfica, lógico que estamos nos apoiando em nomes de autores como Gil por exemplo. A pesquisa consiste em um levantamento de análise e seleção de trabalhos que faz a conceituação de Big Data, bem como suas características publicadas entre o período de 2011 e 2018, esse período temporal nós encontramos diversos conceitos que de fato não existe uma homogeneidade do conceito em cima e sim uma discrepância, hoje apresentado no apêndice desta pesquisa.

Os trabalhos foram identificados através de pesquisas realizadas no portal de periódicos da CAPES, no Google Acadêmico além de livros que foram utilizados e artigos científicos, livros digitais, impressos na área de domínio de Big Data. As publicações selecionadas serviram como base para a identificação dos conceitos relacionados ao termo Big Data e com a identificação das características que compõem este conceito.

As características já encontrada massivamente na literatura, nós temos o volume, variedade, velocidade nos três v’s, focado na área acadêmica a veracidade e valor voltado para o meio empresarial, entretanto essa pesquisa trouxe alguns resultados muito interessantes, por exemplo mais dois v’s que a viabilidade e a venalidade. Além disso outro diferencial dessa pesquisa é que o termo que nós utilizamos para o título “n-v’s” não foi encontrada na base de periódicos da CAPES, algumas variações mesmo assim foram zero resultados encontrados.

Do conceito de Big Data, a gente pode falar que é um fenômeno tecnológico e humano no qual são formados dados em diversos formatos que são armazenadas em grande quantidade de dados em dispositivos de armazenamento, refere-se assim as características inerentes de Big Data os n-v’s, em que a literatura hoje fala em 5-v’s, nós já estamos identificando sete e possam surgir novos v’s, novas características que serão apresentados.

Desses novos 2-v’s nós vamos destacar aqui a “viabilidade” que destina-se a investigar um relacionamento entre as variáveis e padrões latente de dados, é uma citação de Biehn de 2013, o que seria isso é padrões latentes de dados na viabilidade pode ser utilizado por exemplo há um conceito de modelagem de tópicos, faz uso de machine learning por exemplo em cima de processamento de linguagem natural, por exemplo eu tenho grandes corpora de dados e aí eu quero identificar a viabilidade por exemplo da imersão desses tópicos, qual é a freqüência desses tópicos, a relação desses tópicos, em cima de um grande Big Data? Então eu trato com relação a isso essa parte latente que é de viabilidade.

Davenport em 2017 a questão da legalidade, projeção futuramente de formatos de Big Data que possam ser vendidos. A gente pode falar assim: ah mas hoje dados são vendidos, por exemplo se eu adquirir um número novo de uma linha telefônica no outro dia já tem alguém oferecendo algum determinado tipo de produto, a venda de fato realmente acontece, mas o que Davenport trabalha, que ele está pleiteando futuramente ou almejando é a questão de um formato de venda de dados.

Considerações finais o termo Big Data comparado a outros conceitos científicos já consolidados na literatura apresenta uma diversidade de conceitos e contribui para uma não consolidação do termo, este fato pode ser observado junto da pesquisa certamente terão acesso aos anais, no apêndice dela nós construímos uma linha temporal de 2011 até 2018 onde vocês poderão observar por exemplo uma não uniformidade entre as definições elaborada pelos autores, inclusive com críticas, com disparidade de conceito e a não homogeneidade das características do conceito.

Essa evolução de características de palavras iniciadas com a letra “v” tem acontecido mediante o surgimento de novas necessidades que aparece para realizar o processamento do Big Data, também por conta dos avanços tecnológicos, isso que as tecnologias estejam longe de serem estabilizadas e com isso novas possibilidades de novas “v’s” poderão surgir nos próximos anos, como por exemplo a variabilidade que diz respeito à capacidade de submeter-se a variações mudança e a própria visualização de dados que já existe mas que pode ser conceituada, associada a um Big Data, então a gente está falando e 9-v’s, n-v’s de acordo com as necessidades de processamento e avanços tecnológicos vão surgir “n” características para tentar formar um conceito sólido de Big Data.

Sugere-se como pesquisas futuras, quebra de paradigmas com a caracterização real do termo. Por fim só mais 2-v’s que são apresentados potencializando mais 2-v’s chegando assim a 9-v’s, para poder caracterizar Big Data, são características que acabam sendo descaracterizados, não sei, seria uma questão mais de discussão. Fica a mesma dica para pesquisas futuras, tenhamos de fato um conceito real, quanto tempo isso vai levar eu não sei responder, mas de toda forma nós agradecemos a contribuição realizada para o evento e todas as críticas, sugestões vocês podem entrar em contato conosco.

Obrigado.


Support

Federal University of Paraíba (UFPB)São Paulo State University (UNESP)Federal University of Santa Catarina (UFSC)Electronic Journal Digital Skills for Family Farming (RECoDAF)National Council for Scientific and Technological Development (CNPq)