Information, Data and Technology

Guilherme Ataíde Dias

Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.

Moisés Lima Dutra

Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).

Fábio Mosso Moreira

São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.

Fernando de Assis Rodrigues

Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.

Ricardo César Gonçalves Sant'Ana

São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.


Organizators

Guilherme Ataíde Dias

Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.

Moisés Lima Dutra

Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).

Fábio Mosso Moreira

São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.

Fernando de Assis Rodrigues

Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.

Ricardo César Gonçalves Sant'Ana

São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.


Student evasion and Data Science: first steps of an applied research to the distance learning context of the Centro-Oeste State University

Pages: 409 - 423

Authors

Sandro Rautenberg

Centro-Oeste State University (UNICENTRO) | sandro.rautenberg@gmail.com | https://orcid.org/0000-0002-2375-9365 | https://lattes.cnpq.br/1550342830820869

Graduation in Computer Science from the Blumenau Regional University Foundation (1996), master's degree in Production Engineering from the Federal University of Santa Catarina (1998) and PhD in Knowledge Engineering from the Federal University of Santa Catarina (2009). He completed his postdoctoral training at the University of Leipzig - Germany, with emphasis on the development of Ontologies for Linked Open Data (Research Project with the support of CAPES - BEX Process no. 18228 / 12-7). He is a non-titular professor of the State University of the Center-West (UNICENTRO) of the Bachelor of Science in Computer Science and of the Professional Master in Administration (PPGADM). He has experience in the areas of Computer Science and Information Science, working mainly in the following subjects: Engineering and Knowledge Management, Machine Learning, Ontologies, Linked Open Data and Scientometrics.

Alan H. Costa

Centro-Oeste State University (UNICENTRO) | alanhenschel2@gmail.com | https://lattes.cnpq.br/5036418154205354

Internship at Centro-Oeste State University

Paulo R. V. do Carmo

Centro-Oeste State University (UNICENTRO) | pauloviviurka4@gmail.com |

Renan Augusto Mattos Nutse

Centro-Oeste State University (UNICENTRO) | renanmnutse@gmail.com | https://lattes.cnpq.br/6322152109754016

Graduation student of the Computer Science Course at Centro-Oeste State University, Unicentro. The high school was held at the Wolf College of Paraná, in Guarapuava.

Maria Aparecida Crissi Knuppel

Centro-Oeste State University (UNICENTRO) | knuppelc@gmail.com | https://lattes.cnpq.br/2901507472605831

Professor at the Centro-Oeste State University, UNICENTRO. Graduation in Portuguese Portuguese Literature by the State University of the Center-West (1982), Master in Education by the State University of Campinas (1999) and PhD in Education by the State University of Maringá (2013). Experience in Education, with emphasis on Education, working mainly in the following subjects: history of education, cultural history, history of school textbooks, history of school subjects, history of reading, distance education and education technologies. Coordinator of Unicentro Distance Education Nucleus and UAB Coordinator of Unicentro

Marta Clediane Rodrigues Anciutti

Centro-Oeste State University (UNICENTRO) | martanciutti@gmail.com | https://orcid.org/0000-0003-3852-032X | https://lattes.cnpq.br/8331126599019568

Graduation in Pedagogy from the State Faculty of Philosophy, Sciences and Letters of Guarapuava (1992). Specialization in Institutional and Clinical Psychopedagogy. Master in Education from the Federal University of Paraná. Currently, she is the Board of the Magisterium - State Secretariat of Education of Paraná. assistant professor at DEPED / Unicentro and Pedagogical Advisor at the Center for Distance Education of the State University of the Center-West - NEAD / UAB / Guarapuava. Has experience in Education, with emphasis on Educational Management.

Video Transcription

Olá meu nome é Sandro Rautenberg e no WIDAT 2018 vamos apresentar o trabalho evasão estudantil e ciência de dados: os primeiros passos de uma pesquisa aplicada no contexto da educação a distância da Universidade Estadual do Centro-Oeste.

Essa apresentação segue o seguinte roteiro: uma introdução à abordagem dos materiais e métodos apresentação de resultados preliminares visto que é um trabalho em andamento as considerações parciais as referências utilizadas na apresentação seguidos pelos agradecimentos e os contatos dos autores.

Bem, para contextualizar o trabalho vamos a algumas assertivas. Primeiramente é sabido que dados atualmente são produzidos em larga escala e amplamente disponibilizados nas plataformas digitais, nesse sentido alguns estudiosos afirma que dados são como o petróleo do futuro é uma matéria prima a ser refinada para tomada de decisão e para refinar dados atualmente recorre a ciência de dados.

A ciência de dados é caracterizada como a união de métodos e tecnologias para extração de informação útil a partir de complexas e dinâmicas bases de dados, trazendo essas assertivas ao contexto do trabalho na questão de enxergar uma triade de transformação de dados em informação e depois de informação para conhecimento esse trabalho parte do pressuposto que organizações de ensino à distância ou organizações de EAD elas podem melhorar seus processos decisórios com a utilização de tecnologias da ciência de dados.

Nesse sentido, esse trabalho se justifica pela seguinte questão as organizações EAD atualmente enfrentam um sério problema de evasão estudantil só para se ter uma idéia a taxa de evasão estudantil dessas instituições chegou aos índices de 25% dos alunos matriculados no ano de 2014 e essa também é a realidade imposta ao loco desta pesquisa ou seja, o núcleo de educação a distância da Universidade Estadual do Centro-Oeste têm uma taxa de evasão estudantil em torno de 54% dos seus alunos em educação a distância.

Para diminuir um pouco esse índice de evasão estudantil alguns autores recomendam a construção de modelos preditivos, esses modelos baseados em dados históricos geralmente podem auxiliar os tomadores de decisão a identificar a probabilidade de outro aluno evadir por exemplo ou de extrair informações relevantes que dêem suporte ao processo decisório a mudança de uma conjuntura interna nas organizações isso tudo consequentemente tentando aumentar os índices de retenção estudantil.

Trazendo essas ponderações ao contexto do núcleo de educação a distância da INICENTRO encontra-se justificativa plausível utilizar tecnologias assim citados para construir modelos aperitivos para tratar um pouco dessa evasão estudantil por isso em junho 2018 um projeto de extensão foi criado circunscrito a um estudo da evasão estudantil mediada por tecnologias das ciências de dados.

O objetivo deste trabalho é relatar os resultados parciais deste projeto institucionalizado o projeto é institucionalizado os dados primários advém da plataforma moodle o ambiente que oportuniza o aprendizado a qualquer momento e em qualquer lugar ao utilizar a internet como plataforma de comunicação entre os atores e os objetos de aprendizagem.

Na sua versão mais recente o moodle armazena os dados da interação entre atores e objetos de aprendizagem em mais de 300 tabelas de dados no contexto da EAD da Unicentro cabe ressaltar que o moodle a plataforma moodle ela mantém o registo de cinco mil setecentos e oitenta e cinco alunos de EAD entre formandos desistentes informamos por isso da utilização desta base de dados.

Por ser uma pesquisa aplicada como procedimento metodológico adota-se o ciclo de vida de ciência de dados proposto por Bugnion; Manivannan e Nicolas (2017).

Nesse ciclo de vida da ciência de dados é composto por sete passos: inicialmente tem-se ao texto de dados das fontes primárias, após isso faça a ingestão dos dados capturados dessas fontes e uma base de dados centralizada a qual permite a exploração inicial destes dados e compreensão dos modelos da semântica inerente aos dados ali armazenados.

Caso a gente necessite trabalhar com algum modelo de aprendizagem de máquina o próximo passo é definição dos parâmetros do algoritmo a ser utilizado. Após isso implementa-se o modelo de acordo com um algoritmo e seus parâmetros para permitir a utilização de uma aplicação computacional essa aplicação computacional é voltada então para a tomada de decisão de seus gestores ou de seus usuários e como suporte tecnológico para implementação das aplicações computacionais adota-se a linguagem de programação python e algumas das suas bibliotecas como por exemplo Pandas, Psycopg, Matplotlib, Seaborn, NLTK, Vader e Scikit-learn.

Bem, lembrando que essa apresentação é decorrente de um projeto de pesquisa em andamento não só tem uns resultados preliminares a destacar.

Primeiramente a gente destaca que a o estágio atual do projeto está nas fases de ingestão de dados e exploração de dados na gestão nós estamos ainda preocupados em entender o modelo de dados do moodle existem cerca de 300 tabelas altamente relacionadas para a manipular dados a respeito da interação do usuário para os objetos de aprendizagem à medida que a gente vai evoluindo nesse entendimento a gente vai explorando alguns dados e criando algumas constituídas ou alguns cenários iniciais como podem ser percebidos na figura ao lado deste slide.

Por isso nesse instante a gente só tem algumas considerações parciais a relatar primeiramente em relação aos resultados preliminares o primeiro passo que nós temos é a definição do wokflow padrão para desenvolvimento de cenários de exploração e visualização de dados e informação para com os gestores do núcleo de educação a distância da Unicentro.

Esse workflow pode ser percebido na figura ao lado e é constituído de quatro passos essenciais primeiro passo diz respeito à ingestão dos dados da plataforma moodle de lá se abstrai os dados primários esses dados primários são pré processados e validados por consultas transcritas em sql e o resultado desse pré processamento é armazenado centralizadamente em vários arquivos csv os quais no terceiro passo são explorados por escrito em python e esses inscritos e por sua vez transforma esses dados em informação e essa informação então ela é visualizada através de gráficos e tabelas ou relatórios afins.

O segundo resultado parcial que nós temos diz respeito ao passo 2.9 do nosso workflow que a concepção de uma camada independente para a atenção e gestão de dados isso para mitigar os efeitos indesejados neste momento do modelo de dados do moodle, só para constar quando começamos a trabalhar com a base do moodle ela estava na sua versão 2.9 love e atualmente está na versão 3.3 que é muito diferente da versão 2.9 e o último resultado alcançado a relatar diz respeito à formalização de um meio de comunicação para com gestores do núcleo de educação a distância do Unicentro por vez que eles nunca utilizaram o moodle como a ferramenta de apoio à decisão.

Como trabalhos futuros a esse projeto visa desenvolver modelos baseados em aprendizagem de máquina para suporte a tomada de decisão uma vez que estes ainda não foram contemplados no presente estágio da pesquisa. Aqui estão as referências utilizadas nesta apresentação, por fim gostaríamos de agradecer foi a Fundação Araucária pelo apoio financeiro e ao Unicentro pela disponibilidade do ambiente de execução desta pesquisa deixamos aqui também os contatos para eventuais dúvidas a respeito do projeto e sugestões para continuidade do mesmo boa tarde a todos e tem um bom WIDAT.


Support

Federal University of Paraíba (UFPB)São Paulo State University (UNESP)Federal University of Santa Catarina (UFSC)Electronic Journal Digital Skills for Family Farming (RECoDAF)National Council for Scientific and Technological Development (CNPq)