Information, Data and Technology

Guilherme Ataíde Dias

Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.

Moisés Lima Dutra

Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).

Fábio Mosso Moreira

São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.

Fernando de Assis Rodrigues

Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.

Ricardo César Gonçalves Sant'Ana

São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.


Organizators

Guilherme Ataíde Dias

Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.

Moisés Lima Dutra

Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).

Fábio Mosso Moreira

São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.

Fernando de Assis Rodrigues

Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.

Ricardo César Gonçalves Sant'Ana

São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.


Absence Forecast in Specialized Care in Public Health Units of Florianópolis

Pages: 159 - 174

Authors

Milena Maredmi Correa Teixeira

Federal University of Santa Catarina (UFSC) | milena.correira@grad.ufsc.br | https://orcid.org/0000-0002-4469-5006 | https://lattes.cnpq.br/4117308933497698

Graduation in Library from the Federal University of Santa Catarina (2013). She is currently a Master's degree in Knowledge Engineering and holds a degree in Information Science from the Federal University of Santa Catarina. Researcher, Member of the Research Group on Innovation and Entrepreneurship Habitat VIA Knowledge Station at the Federal University of Santa Catarina

Leandro Pereira Garcia

University of Southern Santa Catarina (USSC) | lpgarcia18@gmail.com | https://orcid.org/0000-0002-8601-7166 | https://lattes.cnpq.br/0573692306138917

Graduation in Medicine from the University of Brasília, he did Medical Residency in Pediatrics, MBA in Business Management, MBA in Project Management and Master in Administration. Currently, he studied Doctorate in Health Sciences. He developed his dissertation in the line of Public Management and Co-production of the Public Good, proposing a model of Public Governance that aims to promote the emancipation of people in community: Governance for Emancipation. He has experience in Public Administration, having worked as a Health Center Coordinator, Project and Program Manager, as well as having served in Strategic Planning and as Director of Health Surveillance Officer of the Municipality of Florianópolis, a sector with more than 300 servers and responsible for Epidemiological Surveillance, Sanitary Surveillance, Worker Health Surveillance, Environmental Health Surveillance, Health Promotion and Municipal Laboratory. Currently, he coordinates the Department of Data Analysis of the Municipal Health Department of Florianópolis.

Ingo Ramos

Federal University of Santa Catarina (UFSC) | ingoramos12@gmail.com | https://lattes.cnpq.br/5051204071216974

Undergraduate from the course of Information Science at the Federal University of Santa Catarina

Lucas Alexandre Pedebôs

Florianópolis Municipal Secretary of Health | geinfo.sms@gmail.com | https://lattes.cnpq.br/6221635704169567

Graduation in Nursing from the Federal University of Santa Catarina (2008) and a Master's degree in Public Health from the Federal University of Santa Catarina (2010). He currently holds a PhD in Collective Health from UFSC and is a nurse at Florianopolis City Hall, acting as Intelligence and Information Manager at the Municipal Health Secretariat. Previously, he worked as a temporary professor at the Federal University of Santa Catarina and as coordinator of basic health Unit. Has experience in Primary Health Care and use of health indicators and data.

Douglas Dyllon Jeronimo de Macedo

Federal University of Santa Catarina (UFSC) | douglas.macedo@ufsc.br | https://orcid.org/0000-0002-3237-4168 | https://lattes.cnpq.br/0149028226656519

Professor of the Department of Information Science (CIN), Federal University of Santa Catarina (UFSC). He holds a PhD from the Knowledge Engineering Post-Graduation Program (PPGEGC), Department of Knowledge Engineering (dEGC), Federal University of Santa Catarina (UFSC). During his Ph.D., he was a visiting researcher at The University of Western Ontario (UWO) in London, Ontario, Canada. He works as an associate researcher at the National Digital Convergence Institute (INCoD), working in the Telemedicine Laboratory (LabTelemed) and the Distributed Systems Research Laboratory (LaPeSD) at UFSC. He also serves as a Permanent Member of the Graduate Program in Computer Science (PPGCC / UFSC) and the Post-Graduate Program in Information Science (PGCIN / UFSC). In the past, he served as Adjunct Professor of the Department of Computing (DCOMP) of the Federal University of Sergipe (UFS), where he also served as Coordinator of the Telemedicine and Telehealth Development Center of UFS. Still in the past, he was an effective professor at the Federal Institute of Santa Catarina (IFSC), where he worked at Campus Garopaba. He has experience in the area of ​​Computer Science, with emphasis on Computer Networks, Non-Conventional Data Banks, Distributed Systems and Medical Informatics

Gustavo Medeiros de Araujo

Federal University of Santa Catarina (UFSC) | gustavo.araujo@ufsc.br | https://orcid.org/0000-0003-0572-6997 | https://lattes.cnpq.br/2609254559240670

Doctor in Automation and Systems Engineering at UFSC (2013) and Master in Computer Science at UFSC (2007). He has experience in Computer Science and Automation, with emphasis on Data Science, Machine and Deep Learning and Cyber-Physical System. It has two lines of research: i) Applications with Data Science, Machine and Deep Learning and ii) Wireless Sensor Networks (WSNs) and MANTEs protocols. In addition to his academic background, he has experience in the software industry by developing information systems for the federal government and systems for the automation industry. He is currently associate professor A2 at the Federal University of Santa Catarina, member of the Laboratory of Software and Hardware Integration (LISHA) and member of the Laboratory of Engineering and Data Science (LECID).

Video Transcription

Olá pessoal, sou aluno da UFSC, e esse trabalho aqui é um trabalho de comunicação do nosso grupo de engenharia e ciência de dados em Florianópolis.

Aqui é mais um overview o que eu vou passar para vocês porque o trabalho está em andamento, então são os nossos preliminary results e eu vou mostrar aqui o que a gente construiu um modelo de previsão de faltas em atendimentos especializados em Unidades de Saúde de Florianópolis, que é um problema lá real.

O Sistema Único de Saúde (SUS) tem convivido com bastante problema de financiamento e gerenciamento, além dos problemas de gerenciar os recursos, isso vem dando uma dor de cabeça bastante grande tanto para a gestão quanto para o estado, e isso traz prejuízos de recursos financeiros mal administrados.

Apesar do impasse do recurso financeiro ideal nós estamos no caminho do desenvolvimento. O Brasil está um pouco pior comparado com alguns países em questão de repasse do PIB para saúde mas está melhor do que alguns outros em desenvolvimento como Chile e México.

Nessa época que a gente tem escassez de recursos e a gente não sabe se vai piorar ou não, a gente tem duas frentes para se trabalhar: ou pega mais dinheiro ou trabalha bem com o que tem. A ideia do trabalho surgiu dessa cooperação para tentar mitigar alguns dos problemas de gerenciamento de recursos que é justamente essa questão de faltas.

No caso o grande problema em termos de eficiência lá no SUS e em Florianópolis, é o desperdício causado por faltas em consultas médicas e odontológicas, ou seja, a pessoa marca a consulta e não vai. Existem diversos fatores, esses fatores a gente vem analisando diretamente com a agência de inteligência do SUS, a gente tem os dados e a gente verifica o que está acontecendo.

Em Florianópolis por exemplo tem um índice médio de faltas de 3% em consultas médicas e 12% em consultas odontológicas, então é um percentual bastante grande principalmente com relação às consultas odontológicas e isso gera perda de recurso financeiro, além de atrasar a fila.

Como objetivo que a gente identificou, analisar características que levam a ausência nas consultas de atendimento de complexidade mais alta no SUS em Florianópolis e construir um modelo que possa identificar os pacientes com grande probabilidade de faltas em consultas especializadas. A gente mapeou isso como um problema de classificação binária, se o cara vai faltar ou não vai faltar.

A gente pegou os dados de consultas agendadas, 18.503 consultas, no tempo de 1º de janeiro de 2016 até 30 de junho de 2018, para dois centros de especialização odontológico, com várias especialidades, então a gente pegou um pequeno recorte para poder trazer aqui no WIDAT. Então a gente analisou especialidades odontológicas para esse trabalho, a radiologia com 10.612 consultas, periodontia com 2.531, e endodontia com 5.360 consultas, no período de mais ou menos 1 ano e meio.

Algumas características que a gente analisou, que são as nossas features para começar a trabalhar, algumas delas a qualidade no cadastro, porque o SUS de Florianópolis tem um protocolo de atendimento que é todo digital, de uns 2 anos para cá nós temos uma base que a gente consegue trabalhar com todos os dados daquelas consultas, e um desses dados a escolaridade, dias da semana que acontecem as faltas quando são agendadas as consultas, o período que na verdade esse período foi um trabalho de data cleaning porque a gente transformou um horário em período porque senão ficaria muito a quantidade de variáveis a ser analisada então a gente acabou binarizando ali e fazendo manha e tarde, sexo, dentro outras variáveis.

Vou apresentar algumas que a gente analisou que é bem interessante de mostrar. A gente fez a aplicação de alguns algoritmos de machine learning, a gente pegou um set de algoritmo para poder verificar essa previsão, e a gente analisou a acurácia e a sensibilidade, que é bastante importante nesse caso para prever as faltas.

A sensibilidade que é a proporção de verdadeiros positivos, que é a capacidade do sistema predizer corretamente a condição para casos que realmente tem a condição de verdadeiro, ou seja, são os acertos positivos sobre o total de positivos, os verdadeiros positivos e os falsos negativos. Falsos negativos é que seriam faltas mas foram classificados como não.

Primeiro a gente faz segundo aquele rito de data science, faz um data cleaning, faz um data analytics, e a gente fez uma análise de dados com relação às especialidades de consultas em odontologia e viu ainda que a radiologia tem uma quantidade bastante de faltas, a periodontia também e a endodontia, entre outras especialidades.

Um exemplo simples aqui, a gente tem faltas por dia na semana em radiologia, a gente tem que de segunda a sexta essa distribuição de faltas, a gente percebeu que de sexta-feira é quando tem mais faltas, quando o pessoal mais falta em consultas especializadas. Lembrando que essas consultas especializadas muitas vezes são pagas pelo estado, são consultas que o SUS para ali 300 reais dependendo do tipo da consulta, e o cidadão falta na sexta-feira por exemplo, na segunda é quando menos falta.

Um outro dado interessante de odontologia e radiologia no caso é o nível de escolaridade. A gente vê aqui que o pessoal com mais escolaridade possível como mestrado e doutorado faltam menos mas a gente vê que isso vai crescendo, o superior incompleto falta mais, e o pessoal que tem o fundamental completo ou incompleto.

A gente tem uma distribuição aqui dos tipos de escolaridade com relação às faltas em consultas, então tem uma relação, quanto maior a escolaridade mas só que aqui fura um pouco no superior completo, mas quanto mais alta a escolaridade menor a probabilidade de faltar. Teria que cruzar com outros tipos de dados do IBGE para poder encontrar uma razão para isso daí.

Um outro tipo de variável foi o sexo, então há uma diferença pequena mas nessa análise os homens faltam um pouco mais que às mulheres nas consultas.

Mais uma análise, por período, então o período da tarde a gente verificou que há uma quantidade de faltas maior para a odontologia do que na manhã. Teria que verificar e cruzar com outros dados para verificar a razão disso daí. Inicialmente é uma análise mais crua daquele dado que está disponibilizado pelo SUS.

A partir dessas análises de dados, temos outras variáveis e outras análises que a gente fez, a gente parte para poder fazer aquele procedimento para escolher as características que mais são importantes e representam aquele modelo de predição de faltas. A gente pegou alguns algoritmos de machine learning, os mais usados e os principais, como: o modelo linear para tentar ver se os dados seguem uma linearidade; o Random Forest que é bastante importante em diversas análises de machine learning para grandes quantidade de dados; Rede Neural, pegamos uma rede simples; e os Boosts com três configurações (Gradiente Boosting, Stochastic Gradient Boosting e o AdaBoost).

Desses resultados que nós tivemos iniciais, nós tivemos ali na nossa matriz de confusão que nos dá ali a sensibilidade como um dado importante e como a acurácia. A gente não teve uma acurácia muito boa dessas features, mas a gente teve uma sensibilidade até aceitável.

Para a radiologia nós tivemos uma acurácia não muito boa mas a sensibilidade até um pouco melhor do que a acurácia. A precisão, uma boa precisão. E para a periodontia nós tivemos ali resultados chegando até 70% de acurácia e precisão quase 80%, e sensibilidade 80%.

A gente percebeu que melhora a acurácia a precisão também aumenta, nós fizemos diversos, porque quando nós começamos ter um underfit modelo a gente tem três coisas que agente pode fazer: uma ou a gente mexe nos parâmetros, a gente fez; usamos um boot search para poder varrer aquela quantidade de parâmetros possíveis que o modelo precisava e fizemos isso, então comprimos o rito. Outra coisa que a gente pode fazer é justamente melhorar a engineers, escolher novas features que representam melhor o modelo, só que a gente tinha todas as features naquele momento.

Nesse caso a gente percebeu que varremos todos os parâmetros possíveis e máximo de resultado que a gente teve foi esse que eu apresentei para vocês, quanto mais de 70% acurácia e 80% de sensibilidade em relação ao modelo.

A gente agora, inclusive essa semana, o pessoal está conseguindo coletar mais duas variáveis, uma de chuva, se teve chuva naquele momento, e ver se o cara faltasse, essa variável a gente consegue no instituto de meteorologia, é bem simples o acesso ao site, você cadastra e eles te dão um dataset que você quiser e você escolhe o tema, eles te dão os MLs de chuva, umidade, várias características que precisa.

E uma variável que a gente acho bastante importante é o tempo de espera, que é um pouco óbvio, porque tem consulta que demoram 7 meses ou 1 ano, a gente não sabe nem se o cara vai estar vivo até lá por exemplo. Então essa é uma variável bastante importante que estamos trabalhando e incluindo no modelo para ver se a gente melhora esse modelo de predição para chegar até no entorno de 90% ou 95%, já seria ideal para que o SUS possa utilizar esse modelo. Ou seja, a ideia é, o cara vai fazer o cadastro da consulta, o sistema vai alertar uma probabilidade muito alta do cara faltar, então para o SUS isso é muito interessante para que o SUS possa ligar algum tempo antes, para saber e alertar que tem consulta, de repente o cara não vai também porque morreu por exemplo, ou a pessoa conseguiu juntar dinheiro no tempo e fez a consulta no particular.

Isso para o SUS ele vai gastar 1 real de ligação e vai economizar 299 reais da consulta, além de reescalonar a fila, então esse é um trabalho bastante importante para a saúde. É nessa parceria que a gente está tentando melhorar o uso desses recursos, aqui às referências do trabalho e é isso.


Support

Federal University of Paraíba (UFPB)São Paulo State University (UNESP)Federal University of Santa Catarina (UFSC)Electronic Journal Digital Skills for Family Farming (RECoDAF)National Council for Scientific and Technological Development (CNPq)