Information, Data and Technology
Guilherme Ataíde Dias
Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429
Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.
Moisés Lima Dutra
Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034
Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).
Fábio Mosso Moreira
São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021
Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.
Fernando de Assis Rodrigues
Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582
Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.
Ricardo César Gonçalves Sant'Ana
São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320
Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.
Organizators
Guilherme Ataíde Dias
Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429
Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.
Moisés Lima Dutra
Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034
Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).
Fábio Mosso Moreira
São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021
Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.
Fernando de Assis Rodrigues
Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582
Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.
Ricardo César Gonçalves Sant'Ana
São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320
Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.
Scientific revolution? Reflections for a Critical Theory of Data Science
Pages: 268 - 281
Authors
Max Melquíades da Silva
Federal University of Minas Gerais (UFMG) | iemax@bol.com.br | https://orcid.org/0000-0003-3372-8615 | https://lattes.cnpq.br/5624247693651969
Researcher in Science and Technology at the João Pinheiro Foundation, where he is also an effective professor at the Government School, in undergraduate, postgraduate and training courses. Doctorate in information science by UFMG. Master in Public Administration - Information Management (FJP). Postgraduate in Public Management (UFMG), Bachelor in Philosophy from Pontifícia Universidade Católica de Minas Gerais and Information Systems from Universidade Fumec (ongoing). He worked as a network administrator at the Information Technology Company of Minas Gerais - Prodemge - and in organizations from the Third Sector of Brazil, Spain and Germany. He works in research projects focused on the analysis and proposition of actions for the modernization of public management, information science and distance education in the public sector.
Simone Cristina Dufloth
João Pinheiro Foundation | sduf@uol.com.br | https://orcid.org/0000-0002-1963-7365 | https://lattes.cnpq.br/6166815079725368
PhD in Information Science from the Federal University of Minas Gerais (2002). Master in Nuclear Sciences and Techniques, Federal University of Minas Gerais (1994). Bachelor's degree in Business Administration from University Center UNA (1988) and in Electrical Engineering - Electronic Systems from PUC / MG (1989). Researcher and professor of the School of Government Professor Paulo Neves de Carvalho of the João Pinheiro Foundation, teaching in the undergraduate, specialization and masters courses. Professor of the University Center UNA in the disciplines of Management Theories and Process Management. Has experience in teaching and research in the areas of administration; management of information and knowledge in public, private and third sector organizations; general and strategic administration; theories of administration; processes management; organization, systems and methods; public administration; electronic government; information systems; information and decision making; management and technological information; information and communication technology; Brazilian electoral system and electronic voting.
Video Transcription
Olá participantes do WIDAT 2018, meu nome é Max e eu quero apresentar esse trabalho que a gente submeteu para o evento: Revolução científica? Reflexões para uma teoria crítica da ciência dos dados. Um trabalho meu e da professora Simone Dufloth que deixo aqui as apresentações, professora Simone é Doutora em Ciência da Informação pela UFMG e eu Max sou doutorando em gestão e organização do conhecimento também pela UFMG e ficam aqui os nossos contatos.
Bem o trabalho vai seguir essa organização e o trabalho escrito segue essa organização em que a gente também a utilizou aqui para apresentação online. Vamos lá então, a gente sempre gosta de começar a falar desse tema falando sobre essas recentes inovações tecnológicas que tem permitido uma mudança significativa na forma de trabalho da ciência como escala de dados nunca antes vista.
Alguns teóricos têm feito paralelo com a lei de Moore, que trazia essa premissa de que a cada ano e meio aproximadamente, a velocidade de processamento das informações dos dados duplicaria com uma razoável redução também dos custos, nenhuma redução proporcional dos custos de produção de processadores e dos transistores que se utilizavam na época e agora a gente vive uma época também com um aumento significativo no volume de dados produzidos com redução dos custos de acesso a esses dados, de tal forma que o desafio nesse momento se desloca no tratamento desses dados em detrimento da sua obtenção que hoje se torna algo mais simples de se fazer em comparação com períodos passados, de tal forma que alguns teóricos têm falado da emergência de um quarto paradigma da ciência, que é um paradigma focado em uma lógica computacional de trabalho com grandes volumes de dados.
Então a partir disso a gente propôs essas questões de pesquisa como evoluir um paradigma científico? As transformações em curso no sentido de uma crescente ressignificação do dado como uma unidade de análise chega a constituir um novo paradigma? A produção teórico-conceitual no campo da ciência da informação tem acompanhado esse progressivo trabalho com Big Data?
A partir dessas questões a gente se propôs a este objetivo de analisar à luz da noção de paradigma científico na filosofia da ciência, as características desse paradigma da e-Science e fizemos isso em um trabalho eminentemente de revisão bibliográfica a gente se fundamenta muito na obra desses dois teóricos pós-popperianos, o Thomas Kuhn e Inre Lakatos, dois teóricos que abordam questão da evolução o progresso da ciência.
Então primeiramente a gente fala dessa noção do quarto paradigma, eles surgem na primeira década do ano de 2000 do século né 21 e um dos trabalhos mais significativos nesse sentido e o trabalho de Gray, que consegue uma ciência intensiva de dados efetivamente como um novo paradigma, sendo primeiro um paradigma da ciência empírica depois uma ciência teórica, e ciência computacional e agora já seria uma ciência baseada em dados, resultante dessa exploração de dados que são capturados da natureza ou gerados por simulações por experimentos sempre com suporte computacional.
Esse paradigma na perspectiva de Grey seria caracterizado entre outros por esses elementos uma comunicação científica que já não se restringe a comunicar resultados de publicações finalizadas mas também dados de pesquisa ainda em construção, em dados primários e tal forma que outros pesquisadores possam também a partir desses dados fazer suas simulações, testar hipóteses, tentar refutar ou não, os resultados podem fazer um trabalho na tentativa de falseamento desses dados. Bibliotecas digitais que podem experimentar novas formas de publicações inclusive dados brutos. A revisão por pares passaria a ter essa possibilidade não apenas de descer uma palavra final para dizer que um elemento e tem um artigo, uma publicação pode efetivamente ganhar a comunidade científica, pode ser digamos é referendado, oficializada, publicada, mas você teria possibilidade de construções coletivas, você tem a possibilidade de utilizado pela digitais ter uma construção permanente de um texto ou seja não é porque já recebi uma aprovação dos pares que esse texto está pronto, tá bom, e outros leitores, outros pares também podem continuar colaborando inclusive através de wikis para aperfeiçoar esse trabalho. A internet passa estar cada vez mais controlada por ontologias, vocabulários controlados e outras formas de trabalho propostas ou providas digamos assim pela ciência da informação e a colaboração entre pesquisadores também passa a ter muito mais possibilidades.
Nessa mesma linha no Brasil, Luís Fernando Sayão e Sales são dois dos teóricos mais conceituados nesse sentido de uma reflexão a cerca da e-Science, eles estão sobretudo nessa perspectiva de uma pensada, uma infraestrutura para e-Science e novas possibilidades para bibliotecas de pesquisa.
A partir dessa dessa caracterização muito sucinta, muito breve, a gente traz mais elementos no trabalho escrito, a gente quis pensar o que os filósofos da ciência pensam de um paradigma científico? Até para a gente analisar que ponto que e-Science pode ser caracterizada efetivamente como o quarto paradigma.
Então a gente trouxe que as noções do Tomas Kuhn, com ele traz vários conceitos importantes para a gente compreender a evolução dos paradigmas científicos e a primeira não são Justamente a noção de paradigma que é um mapa, um roteiro através do qual os cientistas dentro de um determinado campo atuam na elaboração de propostas para solução de problemas daquele campo de pesquisa. A noção de enigma, problemas que o paradigma permite resolver e fazer avançar aquele campo do conhecimento, anormalidades problemas persistentes, meio que se recusam a ser resolvidos pelo conteúdo já provido pelo paradigma nesse elementos que desafiam as regras existentes naquele momento.
Isso introduz também de crise que é justamente essa desconfiança no paradigma, parte justamente de um excesso de anormalidades de elementos que aquele paradigma não dá conta de resolver, a noção de revolução científica que reside nessa ideia de uma ruptura e nisso toma com marca uma ruptura também com pensamento anterior a ele sobre todo o pensamento de Karl Popper, que enxergava possibilidade de uma evolução gradual na ciência.
O Thomas Kuhn não fala de rupturas abruptas, efetivamente de revoluções, ele entende que na ciência o progresso se dá dessa forma, através de revoluções realmente as marcantes e alguns exemplos clássicos aí para balizar essa perspectiva nessa disputa entre geocentrismo x heliocentrismo, então passa-se de uma visão em que a Terra era o centro do mundo, do universo, para uma visão em que a gente tem a verdade o sol como centro de um sistema solar de uma galáxia e vários outros cosmos, várias outras estrelas e planetas orbitando aquele corpo que seria o sol. Também nessa perspectiva do criacionismo e do evolucionismo, nessa passagem de uma perspectiva de que um ser criou tudo para uma perspectiva já darwinista de que na verdade houve um processo de evolução que durou milhões de anos para você chegar, para as coisas chegarem até o grau status que estão hoje, a gente tem uma ruptura brusca na forma de concepção do mundo e da forma como as coisas evoluíram conforme cada perspectiva.
O Inre Lakatos ele traz de novidade em relação de partida de vários elementos convergentes em relação a teoria do Kuhn, mas a gente quis destacar programa de pesquisa, então ele percebe a ciência como organizar em torno de vários programas de pesquisa que oferecem regras metodológicas e o corpus teórico também que banaliza o trabalho do cientista e ele entende que o crescimento da ciência acontece por meio da competição entre programas de pesquisa rivais e essa noção de que todo o programa de pesquisa possui núcleo rígido, núcleo duro, tem várias traduções diferentes para esse conceito, mas sempre um núcleo duro que consiste nas ideias fundamentais daquele programa de pesquisas, essa é uma ação conjunto de construções que não pode ser refutado por que se não implicaria numa crise para todo esse programa de pesquisa e entorno deste núcleo rígido, dessas ideias fundamentais que constituem um programa de pesquisa, estaremos no cinturão protetor composto por teorias, hipóteses auxiliares que podem ser refutadas que podem ser falseadas sem maiores problemas para o programa como um todo, inclusive ideias ou teorias que vão surgindo ao longo do tempo até para dar conta de novos problemas que vão sendo identificados por aquele programa de pesquisa.
Parte dessa breve revisão de literatura a gente traz para discussão algumas ideias, pensamentos no sentido de enxergar o mundo da prática, então a gente percebe que esse fenômeno do trabalho com grandes dados ou e-Science como um fenômeno do mundo da práxis ele é inegável e é de fato tem conseguido aglutinar uma grande comunidade de pesquisa em torno desse conceito, desse paradigma, tanto inclusive que esse evento que a gente tá participando é uma comunidade de pesquisa que tem já realizado ao longo dos últimos anos não só pesquisas de cunho teórico quanto prático, o que evidencia que esse fenômeno precisa ser discutido.
O que acontece que a gente identifica muito mais estudo de caso, muito mais estudos práticos do que essas formulações teóricas conceituais sobre as bases epistemológicas da e-Science enquanto paradigma científico.
Qual que é o núcleo duro da e-Science? Quais são as suas teorias de suporte? A gente pode caracterizar aquelas ideias propostas pelo Gray como sendo o núcleo duro, elas constituem um fundamento sólido e se algumas dessas ideias começam a ser refutadas no futuro próximo que a gente tem uma crise para esse programa de pesquisa ou para esse paradigma ou na verdade parte daquelas características seriam proposições auxiliares de suporte que podem ser refutadas sem maiores problemas, falta um pouco dessas discussões.
Tentativas de refutação ou críticas só isso já existem, Martin Frické um dos expoentes críticos é muito cético com relação a ideia, a possibilidade de um big data produzir uma lógica de descobertas científicas que possa ser amplamente aplicada, diversas ciências que eles, três paradigmas mencionados anteriormente, no paradigma teórico-empírico, teórico e o computacional, a gente tem uma a utilização ampla nas mais diversas ciências. A e-Science também teria essa possibilidade ou essa característica de universalidade? Algo a se pensar.
Martin Frické também é bastante cético com relação à possibilidade dessa forma de e-Science produzir conhecimento através da análise de muitos dados que consiste numa forma sobretudo de métodos indutivo de produção de conhecimento. Frické é muito cético com relação às possibilidades disso produzir conhecimento novo porque não entende que os nossos pré-conceitos, pré-juízos na hora de analisar dados empíricos ele já implica em uma visão de mundo que pode distorcer a nossa análise. Então a gente entende que embora seja forçoso reconhecer a urgência desses fundamentos teórico-conceituais para e-Science para que ela possa ser mais confortavelmente chamado de um paradigma científico no campo da prática ou práxis, ela efetivamente já é uma realidade.
Então a gente queria finalizar com essa frase de Boaventura Sousa Santos que dizia assim lá em 1988, final do século 20, ele dizia depois da euforia cientista do século XIX e da consequência aversão a reflexão filosófica bem simbolizada pelo positivismo, chegamos ao final do século 20, possuídos pelo desejo quase desesperado de complementarmos o conhecimento das coisas com conhecimento do conhecimento das coisas.
Aqui ele está falando de epistemologia, tá falando de não apenas fazer mas pensar o que fazemos como fazemos, qual que é a lógica subjacente ao trabalho dos cientistas no caso do cientista de dados, então a gente entende que é preciso conhecer mais sobre como a e-Science quer conhecer o mundo, pensar mais nessas bases epistemológicas.
Queremos agradecer e deixar os nossos dados para contato e convidá-los a fazer a leitura do texto completo e a continuar essa discussão aí nos diversos fóruns possíveis.
Um abraço.