Informação, Dados e Tecnologia
Guilherme Ataíde Dias
Universidade Federal da Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429
Graduado em Ciência da Computação pela Universidade Federal da Paraíba – UFPB Campus II (1990), Bacharel em Direito pelo Centro Universitário de João Pessoa – UNIPE (2010), Mestre em Organization & Management pela Central Connecticut State University – CCSU (1995), Doutor em Ciência da Informação (Ciências da Comunicação) pela Universidade de São Paulo – USP (2003) e Pós-Doutor pela UNESP (2011). Atualmente é professor Associado III na Universidade Federal da Paraíba, lotado no Departamento de Ciência da Informação. Está envolvido com a Pós-Graduação através do Programa de Pós-Graduação em Ciência da Informação e Programa de Pós-Graduação em Administração, ambos da UFPB. Tem interesse de pesquisa nas seguintes temáticas: Representação do Conhecimento; Arquitetura da Informação; Segurança da Informação; Tecnologias da Informação e Comunicação; Informação em Saúde; Redes Sociais; Software Livre; Direito, Ética e Propriedade Intelectual no Ciberespaço; Gestão de Dados Científicos; Informação Jurídica; Atualmente é Bolsista de Produtividade em Pesquisa (PQ) do CNPq.
Moisés Lima Dutra
Universidade Federal de Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034
Professor Adjunto da Universidade Federal de Santa Catarina, Departamento de Ciência da Informação. Doutor em Computação pela Universidade de Lyon 1, França (2009). Mestre em Engenharia Elétrica, subárea Automação e Sistemas (2005) e Bacharel em Computação (1998) pela Universidade Federal de Santa Catarina. Suas atuais linhas de pesquisa estão relacionadas a Inteligência Artificial Aplicada (Machine Learning, Deep Learning, Web Semântica, Linked Data) e a Data Science (Text Mining, Big Data, IoT). Está vinculado ao grupo de pesquisa ITI-RG (Inteligência, Tecnologia e Informação - Research Group).
Fábio Mosso Moreira
Universidade Estadual Paulista (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021
Graduado em Administração de Empresas pela Faculdade de Ciências e Engenharia (UNESP/Tupã). Mestrado concluído em Ciência da Informação - Faculdade de Filosofia e Ciências (UNESP/Marília). Doutorado em andamento Programa de Pós-Graduação em Ciência da Informação - Faculdade de Filosofia e Ciências (UNESP/Marília). Atua como membro do Grupo de Pesquisa Novas Tecnologias em Informação - GPNTI (UNESP/Marília) e Grupo de Pesquisa Tecnologia de Acesso a Dados -GPTAD (UNESP / Tupã). Editor de Conteúdo da Revista Eletrônica Competências Digitais para Agricultura Familiar (RECoDAF). Possui Habilidade Profissional Técnica em Informática pela ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Tem experiência profissional na área de Sistemas de Informação ERP para Operações de Logística. Atualmente realiza pesquisas com foco na investigação de temas ligados à utilização de recursos digitais para a disponibilização e acesso a dados governamentais de Políticas Públicas no âmbito dos pequenos produtores.
Fernando de Assis Rodrigues
Universidade Federal do Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582
Professor Adjunto no Instituto de Ciências Sociais Aplicadas, lotado na Faculdade de Arquivologia da Universidade Federal do Pará. Doutor e Mestre em Ciência da Informação pela UNESP - Universidade Estadual Paulista. Especialista em Sistemas para Internet pela UNIVEM - Centro Universitário Eurípides de Marília. Bacharel em Sistemas de Informação pela USC - Universidade do Sagrado Coração. Membro dos grupos de pesquisa GPNTI - Novas Tecnologias em Informação e GPTAD - Tecnologias de Acesso a Dados (UNESP), GPIDT - Informação, Dados e Tecnologia (USP) e GPDM - Dados e Metadados (UFSCar). Editor do periódico RECoDAF - Revista Eletrônica Competências Digitas para a Agricultura Familiar. Atua nas áreas da Ciência da Informação e da Ciência da Computação, com ênfase em Engenharia de Software, Bancos de Dados, Tecnologia de Informação e Comunicação e Ambientes Informacionais Digitais, focado principalmente nos seguintes temas: Coleta de Dados, Dados, Acesso a Dados, Serviços de Redes Sociais Online, Linked Data, Linked Open Data, Metadados, Internet Applications, Linguagens de Programação, Banco de Dados e Bases de Dados, Privacidade, Governo eletrônico, Open Government Data e Transparência Pública.
Ricardo César Gonçalves Sant'Ana
Universidade Estadual Paulista (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320
Professor Associado da Universidade Estadual Paulista - UNESP, Faculdade de Ciências e Engenharias - FCE, Campus de Tupã, em regime de dedicação exclusiva, onde é Presidente da Comissão de Acompanhamento e Avaliação dos cursos de Graduação - CAACG, Coordenador Local do Centro de Estudos e Práticas Pedagógicas - CENEPP e Ouvidor Local. Professor do Programa de Pós-Graduação em Ciência da Informação da Universidade Estadual Paulista, Campus de Marília. Graduado em Matemática e Pedagogia, Mestrado em Ciência da Informação (2002), Doutorado em Ciência da Informação (2008) e Livre-Docente em Sistemas de Informações Gerenciais pela UNESP (2017). Possui especializações em Orientação à Objetos (1996) e Gestão de Sistemas de Informação (1998). Parecerista ad hoc de periódicos e de agências de fomento. Lider do Grupo de Pesquisa - Tecnologias de Acesso a Dados (GPTAD) e membro do Grupo de Pesquisa - Novas Tecnologias em Informação GPNTI. Tem experiência na área de Ciência da Computação, atualmente realiza pesquisas com foco em: ciência da informação e tecnologia da informação, investigando temas ligados ao Ciclo de Vida dos Dados, Transparência e ao Fluxo Informacional em Cadeias Produtivas. Atuou como professor na Faccat Faculdade de Ciências Contábeis e Administração de Tupã, onde coordenou curso de Administração com Habilitação em Análise de Sistemas por dez anos e o curso de Licenciatura em Computação. Atuou no setor privado como consultor, integrador e pesquisador de novas tecnologias informacionais de 1988 a 2004.
Organizadores
Guilherme Ataíde Dias
Universidade Federal da Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429
Graduado em Ciência da Computação pela Universidade Federal da Paraíba – UFPB Campus II (1990), Bacharel em Direito pelo Centro Universitário de João Pessoa – UNIPE (2010), Mestre em Organization & Management pela Central Connecticut State University – CCSU (1995), Doutor em Ciência da Informação (Ciências da Comunicação) pela Universidade de São Paulo – USP (2003) e Pós-Doutor pela UNESP (2011). Atualmente é professor Associado III na Universidade Federal da Paraíba, lotado no Departamento de Ciência da Informação. Está envolvido com a Pós-Graduação através do Programa de Pós-Graduação em Ciência da Informação e Programa de Pós-Graduação em Administração, ambos da UFPB. Tem interesse de pesquisa nas seguintes temáticas: Representação do Conhecimento; Arquitetura da Informação; Segurança da Informação; Tecnologias da Informação e Comunicação; Informação em Saúde; Redes Sociais; Software Livre; Direito, Ética e Propriedade Intelectual no Ciberespaço; Gestão de Dados Científicos; Informação Jurídica; Atualmente é Bolsista de Produtividade em Pesquisa (PQ) do CNPq.
Moisés Lima Dutra
Universidade Federal de Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034
Professor Adjunto da Universidade Federal de Santa Catarina, Departamento de Ciência da Informação. Doutor em Computação pela Universidade de Lyon 1, França (2009). Mestre em Engenharia Elétrica, subárea Automação e Sistemas (2005) e Bacharel em Computação (1998) pela Universidade Federal de Santa Catarina. Suas atuais linhas de pesquisa estão relacionadas a Inteligência Artificial Aplicada (Machine Learning, Deep Learning, Web Semântica, Linked Data) e a Data Science (Text Mining, Big Data, IoT). Está vinculado ao grupo de pesquisa ITI-RG (Inteligência, Tecnologia e Informação - Research Group).
Fábio Mosso Moreira
Universidade Estadual Paulista (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021
Graduado em Administração de Empresas pela Faculdade de Ciências e Engenharia (UNESP/Tupã). Mestrado concluído em Ciência da Informação - Faculdade de Filosofia e Ciências (UNESP/Marília). Doutorado em andamento Programa de Pós-Graduação em Ciência da Informação - Faculdade de Filosofia e Ciências (UNESP/Marília). Atua como membro do Grupo de Pesquisa Novas Tecnologias em Informação - GPNTI (UNESP/Marília) e Grupo de Pesquisa Tecnologia de Acesso a Dados -GPTAD (UNESP / Tupã). Editor de Conteúdo da Revista Eletrônica Competências Digitais para Agricultura Familiar (RECoDAF). Possui Habilidade Profissional Técnica em Informática pela ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Tem experiência profissional na área de Sistemas de Informação ERP para Operações de Logística. Atualmente realiza pesquisas com foco na investigação de temas ligados à utilização de recursos digitais para a disponibilização e acesso a dados governamentais de Políticas Públicas no âmbito dos pequenos produtores.
Fernando de Assis Rodrigues
Universidade Federal do Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582
Professor Adjunto no Instituto de Ciências Sociais Aplicadas, lotado na Faculdade de Arquivologia da Universidade Federal do Pará. Doutor e Mestre em Ciência da Informação pela UNESP - Universidade Estadual Paulista. Especialista em Sistemas para Internet pela UNIVEM - Centro Universitário Eurípides de Marília. Bacharel em Sistemas de Informação pela USC - Universidade do Sagrado Coração. Membro dos grupos de pesquisa GPNTI - Novas Tecnologias em Informação e GPTAD - Tecnologias de Acesso a Dados (UNESP), GPIDT - Informação, Dados e Tecnologia (USP) e GPDM - Dados e Metadados (UFSCar). Editor do periódico RECoDAF - Revista Eletrônica Competências Digitas para a Agricultura Familiar. Atua nas áreas da Ciência da Informação e da Ciência da Computação, com ênfase em Engenharia de Software, Bancos de Dados, Tecnologia de Informação e Comunicação e Ambientes Informacionais Digitais, focado principalmente nos seguintes temas: Coleta de Dados, Dados, Acesso a Dados, Serviços de Redes Sociais Online, Linked Data, Linked Open Data, Metadados, Internet Applications, Linguagens de Programação, Banco de Dados e Bases de Dados, Privacidade, Governo eletrônico, Open Government Data e Transparência Pública.
Ricardo César Gonçalves Sant'Ana
Universidade Estadual Paulista (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320
Professor Associado da Universidade Estadual Paulista - UNESP, Faculdade de Ciências e Engenharias - FCE, Campus de Tupã, em regime de dedicação exclusiva, onde é Presidente da Comissão de Acompanhamento e Avaliação dos cursos de Graduação - CAACG, Coordenador Local do Centro de Estudos e Práticas Pedagógicas - CENEPP e Ouvidor Local. Professor do Programa de Pós-Graduação em Ciência da Informação da Universidade Estadual Paulista, Campus de Marília. Graduado em Matemática e Pedagogia, Mestrado em Ciência da Informação (2002), Doutorado em Ciência da Informação (2008) e Livre-Docente em Sistemas de Informações Gerenciais pela UNESP (2017). Possui especializações em Orientação à Objetos (1996) e Gestão de Sistemas de Informação (1998). Parecerista ad hoc de periódicos e de agências de fomento. Lider do Grupo de Pesquisa - Tecnologias de Acesso a Dados (GPTAD) e membro do Grupo de Pesquisa - Novas Tecnologias em Informação GPNTI. Tem experiência na área de Ciência da Computação, atualmente realiza pesquisas com foco em: ciência da informação e tecnologia da informação, investigando temas ligados ao Ciclo de Vida dos Dados, Transparência e ao Fluxo Informacional em Cadeias Produtivas. Atuou como professor na Faccat Faculdade de Ciências Contábeis e Administração de Tupã, onde coordenou curso de Administração com Habilitação em Análise de Sistemas por dez anos e o curso de Licenciatura em Computação. Atuou no setor privado como consultor, integrador e pesquisador de novas tecnologias informacionais de 1988 a 2004.
Evasão Estudantil e Ciência de Dados: primeiros passos de uma pesquisa aplicada no contexto da Educação a Distância da Universidade Estadual do Centro-Oeste
Páginas: 409 - 423
Autores
Sandro Rautenberg
Universidade Estadual do Centro-Oeste (UNICENTRO) | sandro.rautenberg@gmail.com | https://orcid.org/0000-0002-2375-9365 | https://lattes.cnpq.br/1550342830820869
Bacharel em Ciências da Computação pela Fundação Universidade Regional de Blumenau (1996), mestre em Engenharia de Produção pela Universidade Federal de Santa Catarina (1998) e doutor em Engenharia do Conhecimento pela Universidade Federal de Santa Catarina (2009). Realizou seu estágio pós-doutoral na Universidade de Leipzig - Alemanha, com ênfase no desenvolvimento Ontologias para Linked Open Data (Projeto de pesquisa com apoio da CAPES - Processo BEX no 18228/12-7). É professor não-titular da Universidade Estadual do Centro-Oeste (UNICENTRO) do Bacharelado em Ciência da Computação e do Mestrado Profissional em Administração (PPGADM). Tem experiência nas áreas da Ciência da Computação e da Ciência da Informação, atuando principalmente nos seguintes temas: Engenharia e Gestão do Conhecimento, Machine Learning, Ontologias, Linked Open Data e Cientometria.
Alan H. Costa
Universidade Estadual do Centro-Oeste (UNICENTRO) | alanhenschel2@gmail.com | https://lattes.cnpq.br/5036418154205354
Estagio pela Universidade Estadual do Centro-Oeste
Paulo R. V. do Carmo
Universidade Estadual do Centro-Oeste (UNICENTRO) | pauloviviurka4@gmail.com |
Renan Augusto Mattos Nutse
Universidade Estadual do Centro-Oeste (UNICENTRO) | renanmnutse@gmail.com | https://lattes.cnpq.br/6322152109754016
Estudante de graduação do Curso de Ciência da Computação da Universidade Estadual do Centro-Oeste, Unicentro. O ensino médio foi realizado no Colégio Lobo do Paraná, em Guarapuava.
Maria Aparecida Crissi Knuppel
Universidade Estadual do Centro-Oeste (UNICENTRO) | knuppelc@gmail.com | https://lattes.cnpq.br/2901507472605831
Professora Adjunta da Universidade Estadual do Centro-Oeste, UNICENTRO. Graduação em Letras Português Inglês pela Universidade Estadual do Centro-Oeste (1982), Mestrado em Educação pela Universidade Estadual de Campinas (1999) e Doutorado em Educação pela Universidade Estadual de Maringá (2013). Experiência na área de Educação, com ênfase em Educação, atuando principalmente nos seguintes temas: história da educação, história cultural, história dos manuais escolares, história das disciplinas escolares, história da leitura, educação a distância e tecnologias da educação. Coordenadora do Núcleo de Educação a Distância da Unicentro e Coordenadora UAB da Unicentro
Marta Clediane Rodrigues Anciutti
Universidade Estadual do Centro-Oeste (UNICENTRO) | martanciutti@gmail.com | https://orcid.org/0000-0003-3852-032X | https://lattes.cnpq.br/8331126599019568
Possui graduação em Pedagogia pela Faculdade Estadual de Filosofia, Ciências e Letras de Guarapuava (1992). Especialização em Psicopedagogia Institucional e Clínica. Mestre em Educação pela Universidade Federal do Paraná. Atualmente é Quadro Próprio do Magistério - Secretaria de Estado da Educação do Paraná. professora colaboradora no DEPED/Unicentro e Assessora Pedagógica na Núcleo de Educação a Distância da Universidade Estadual do Centro-Oeste - NEAD/UAB/Guarapuava. Tem experiência na área de Educação, com ênfase em Gestão Educacional.
Transcrição do Vídeo
Olá meu nome é Sandro Rautenberg e no WIDAT 2018 vamos apresentar o trabalho evasão estudantil e ciência de dados: os primeiros passos de uma pesquisa aplicada no contexto da educação a distância da Universidade Estadual do Centro-Oeste.
Essa apresentação segue o seguinte roteiro: uma introdução à abordagem dos materiais e métodos apresentação de resultados preliminares visto que é um trabalho em andamento as considerações parciais as referências utilizadas na apresentação seguidos pelos agradecimentos e os contatos dos autores.
Bem, para contextualizar o trabalho vamos a algumas assertivas. Primeiramente é sabido que dados atualmente são produzidos em larga escala e amplamente disponibilizados nas plataformas digitais, nesse sentido alguns estudiosos afirma que dados são como o petróleo do futuro é uma matéria prima a ser refinada para tomada de decisão e para refinar dados atualmente recorre a ciência de dados.
A ciência de dados é caracterizada como a união de métodos e tecnologias para extração de informação útil a partir de complexas e dinâmicas bases de dados, trazendo essas assertivas ao contexto do trabalho na questão de enxergar uma triade de transformação de dados em informação e depois de informação para conhecimento esse trabalho parte do pressuposto que organizações de ensino à distância ou organizações de EAD elas podem melhorar seus processos decisórios com a utilização de tecnologias da ciência de dados.
Nesse sentido, esse trabalho se justifica pela seguinte questão as organizações EAD atualmente enfrentam um sério problema de evasão estudantil só para se ter uma idéia a taxa de evasão estudantil dessas instituições chegou aos índices de 25% dos alunos matriculados no ano de 2014 e essa também é a realidade imposta ao loco desta pesquisa ou seja, o núcleo de educação a distância da Universidade Estadual do Centro-Oeste têm uma taxa de evasão estudantil em torno de 54% dos seus alunos em educação a distância.
Para diminuir um pouco esse índice de evasão estudantil alguns autores recomendam a construção de modelos preditivos, esses modelos baseados em dados históricos geralmente podem auxiliar os tomadores de decisão a identificar a probabilidade de outro aluno evadir por exemplo ou de extrair informações relevantes que dêem suporte ao processo decisório a mudança de uma conjuntura interna nas organizações isso tudo consequentemente tentando aumentar os índices de retenção estudantil.
Trazendo essas ponderações ao contexto do núcleo de educação a distância da INICENTRO encontra-se justificativa plausível utilizar tecnologias assim citados para construir modelos aperitivos para tratar um pouco dessa evasão estudantil por isso em junho 2018 um projeto de extensão foi criado circunscrito a um estudo da evasão estudantil mediada por tecnologias das ciências de dados.
O objetivo deste trabalho é relatar os resultados parciais deste projeto institucionalizado o projeto é institucionalizado os dados primários advém da plataforma moodle o ambiente que oportuniza o aprendizado a qualquer momento e em qualquer lugar ao utilizar a internet como plataforma de comunicação entre os atores e os objetos de aprendizagem.
Na sua versão mais recente o moodle armazena os dados da interação entre atores e objetos de aprendizagem em mais de 300 tabelas de dados no contexto da EAD da Unicentro cabe ressaltar que o moodle a plataforma moodle ela mantém o registo de cinco mil setecentos e oitenta e cinco alunos de EAD entre formandos desistentes informamos por isso da utilização desta base de dados.
Por ser uma pesquisa aplicada como procedimento metodológico adota-se o ciclo de vida de ciência de dados proposto por Bugnion; Manivannan e Nicolas (2017).
Nesse ciclo de vida da ciência de dados é composto por sete passos: inicialmente tem-se ao texto de dados das fontes primárias, após isso faça a ingestão dos dados capturados dessas fontes e uma base de dados centralizada a qual permite a exploração inicial destes dados e compreensão dos modelos da semântica inerente aos dados ali armazenados.
Caso a gente necessite trabalhar com algum modelo de aprendizagem de máquina o próximo passo é definição dos parâmetros do algoritmo a ser utilizado. Após isso implementa-se o modelo de acordo com um algoritmo e seus parâmetros para permitir a utilização de uma aplicação computacional essa aplicação computacional é voltada então para a tomada de decisão de seus gestores ou de seus usuários e como suporte tecnológico para implementação das aplicações computacionais adota-se a linguagem de programação python e algumas das suas bibliotecas como por exemplo Pandas, Psycopg, Matplotlib, Seaborn, NLTK, Vader e Scikit-learn.
Bem, lembrando que essa apresentação é decorrente de um projeto de pesquisa em andamento não só tem uns resultados preliminares a destacar.
Primeiramente a gente destaca que a o estágio atual do projeto está nas fases de ingestão de dados e exploração de dados na gestão nós estamos ainda preocupados em entender o modelo de dados do moodle existem cerca de 300 tabelas altamente relacionadas para a manipular dados a respeito da interação do usuário para os objetos de aprendizagem à medida que a gente vai evoluindo nesse entendimento a gente vai explorando alguns dados e criando algumas constituídas ou alguns cenários iniciais como podem ser percebidos na figura ao lado deste slide.
Por isso nesse instante a gente só tem algumas considerações parciais a relatar primeiramente em relação aos resultados preliminares o primeiro passo que nós temos é a definição do wokflow padrão para desenvolvimento de cenários de exploração e visualização de dados e informação para com os gestores do núcleo de educação a distância da Unicentro.
Esse workflow pode ser percebido na figura ao lado e é constituído de quatro passos essenciais primeiro passo diz respeito à ingestão dos dados da plataforma moodle de lá se abstrai os dados primários esses dados primários são pré processados e validados por consultas transcritas em sql e o resultado desse pré processamento é armazenado centralizadamente em vários arquivos csv os quais no terceiro passo são explorados por escrito em python e esses inscritos e por sua vez transforma esses dados em informação e essa informação então ela é visualizada através de gráficos e tabelas ou relatórios afins.
O segundo resultado parcial que nós temos diz respeito ao passo 2.9 do nosso workflow que a concepção de uma camada independente para a atenção e gestão de dados isso para mitigar os efeitos indesejados neste momento do modelo de dados do moodle, só para constar quando começamos a trabalhar com a base do moodle ela estava na sua versão 2.9 love e atualmente está na versão 3.3 que é muito diferente da versão 2.9 e o último resultado alcançado a relatar diz respeito à formalização de um meio de comunicação para com gestores do núcleo de educação a distância do Unicentro por vez que eles nunca utilizaram o moodle como a ferramenta de apoio à decisão.
Como trabalhos futuros a esse projeto visa desenvolver modelos baseados em aprendizagem de máquina para suporte a tomada de decisão uma vez que estes ainda não foram contemplados no presente estágio da pesquisa. Aqui estão as referências utilizadas nesta apresentação, por fim gostaríamos de agradecer foi a Fundação Araucária pelo apoio financeiro e ao Unicentro pela disponibilidade do ambiente de execução desta pesquisa deixamos aqui também os contatos para eventuais dúvidas a respeito do projeto e sugestões para continuidade do mesmo boa tarde a todos e tem um bom WIDAT.