Informação, Dados e Tecnologia
Guilherme Ataíde Dias
Universidade Federal da Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429
Graduado em Ciência da Computação pela Universidade Federal da Paraíba – UFPB Campus II (1990), Bacharel em Direito pelo Centro Universitário de João Pessoa – UNIPE (2010), Mestre em Organization & Management pela Central Connecticut State University – CCSU (1995), Doutor em Ciência da Informação (Ciências da Comunicação) pela Universidade de São Paulo – USP (2003) e Pós-Doutor pela UNESP (2011). Atualmente é professor Associado III na Universidade Federal da Paraíba, lotado no Departamento de Ciência da Informação. Está envolvido com a Pós-Graduação através do Programa de Pós-Graduação em Ciência da Informação e Programa de Pós-Graduação em Administração, ambos da UFPB. Tem interesse de pesquisa nas seguintes temáticas: Representação do Conhecimento; Arquitetura da Informação; Segurança da Informação; Tecnologias da Informação e Comunicação; Informação em Saúde; Redes Sociais; Software Livre; Direito, Ética e Propriedade Intelectual no Ciberespaço; Gestão de Dados Científicos; Informação Jurídica; Atualmente é Bolsista de Produtividade em Pesquisa (PQ) do CNPq.
Moisés Lima Dutra
Universidade Federal de Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034
Professor Adjunto da Universidade Federal de Santa Catarina, Departamento de Ciência da Informação. Doutor em Computação pela Universidade de Lyon 1, França (2009). Mestre em Engenharia Elétrica, subárea Automação e Sistemas (2005) e Bacharel em Computação (1998) pela Universidade Federal de Santa Catarina. Suas atuais linhas de pesquisa estão relacionadas a Inteligência Artificial Aplicada (Machine Learning, Deep Learning, Web Semântica, Linked Data) e a Data Science (Text Mining, Big Data, IoT). Está vinculado ao grupo de pesquisa ITI-RG (Inteligência, Tecnologia e Informação - Research Group).
Fábio Mosso Moreira
Universidade Estadual Paulista (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021
Graduado em Administração de Empresas pela Faculdade de Ciências e Engenharia (UNESP/Tupã). Mestrado concluído em Ciência da Informação - Faculdade de Filosofia e Ciências (UNESP/Marília). Doutorado em andamento Programa de Pós-Graduação em Ciência da Informação - Faculdade de Filosofia e Ciências (UNESP/Marília). Atua como membro do Grupo de Pesquisa Novas Tecnologias em Informação - GPNTI (UNESP/Marília) e Grupo de Pesquisa Tecnologia de Acesso a Dados -GPTAD (UNESP / Tupã). Editor de Conteúdo da Revista Eletrônica Competências Digitais para Agricultura Familiar (RECoDAF). Possui Habilidade Profissional Técnica em Informática pela ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Tem experiência profissional na área de Sistemas de Informação ERP para Operações de Logística. Atualmente realiza pesquisas com foco na investigação de temas ligados à utilização de recursos digitais para a disponibilização e acesso a dados governamentais de Políticas Públicas no âmbito dos pequenos produtores.
Fernando de Assis Rodrigues
Universidade Federal do Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582
Professor Adjunto no Instituto de Ciências Sociais Aplicadas, lotado na Faculdade de Arquivologia da Universidade Federal do Pará. Doutor e Mestre em Ciência da Informação pela UNESP - Universidade Estadual Paulista. Especialista em Sistemas para Internet pela UNIVEM - Centro Universitário Eurípides de Marília. Bacharel em Sistemas de Informação pela USC - Universidade do Sagrado Coração. Membro dos grupos de pesquisa GPNTI - Novas Tecnologias em Informação e GPTAD - Tecnologias de Acesso a Dados (UNESP), GPIDT - Informação, Dados e Tecnologia (USP) e GPDM - Dados e Metadados (UFSCar). Editor do periódico RECoDAF - Revista Eletrônica Competências Digitas para a Agricultura Familiar. Atua nas áreas da Ciência da Informação e da Ciência da Computação, com ênfase em Engenharia de Software, Bancos de Dados, Tecnologia de Informação e Comunicação e Ambientes Informacionais Digitais, focado principalmente nos seguintes temas: Coleta de Dados, Dados, Acesso a Dados, Serviços de Redes Sociais Online, Linked Data, Linked Open Data, Metadados, Internet Applications, Linguagens de Programação, Banco de Dados e Bases de Dados, Privacidade, Governo eletrônico, Open Government Data e Transparência Pública.
Ricardo César Gonçalves Sant'Ana
Universidade Estadual Paulista (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320
Professor Associado da Universidade Estadual Paulista - UNESP, Faculdade de Ciências e Engenharias - FCE, Campus de Tupã, em regime de dedicação exclusiva, onde é Presidente da Comissão de Acompanhamento e Avaliação dos cursos de Graduação - CAACG, Coordenador Local do Centro de Estudos e Práticas Pedagógicas - CENEPP e Ouvidor Local. Professor do Programa de Pós-Graduação em Ciência da Informação da Universidade Estadual Paulista, Campus de Marília. Graduado em Matemática e Pedagogia, Mestrado em Ciência da Informação (2002), Doutorado em Ciência da Informação (2008) e Livre-Docente em Sistemas de Informações Gerenciais pela UNESP (2017). Possui especializações em Orientação à Objetos (1996) e Gestão de Sistemas de Informação (1998). Parecerista ad hoc de periódicos e de agências de fomento. Lider do Grupo de Pesquisa - Tecnologias de Acesso a Dados (GPTAD) e membro do Grupo de Pesquisa - Novas Tecnologias em Informação GPNTI. Tem experiência na área de Ciência da Computação, atualmente realiza pesquisas com foco em: ciência da informação e tecnologia da informação, investigando temas ligados ao Ciclo de Vida dos Dados, Transparência e ao Fluxo Informacional em Cadeias Produtivas. Atuou como professor na Faccat Faculdade de Ciências Contábeis e Administração de Tupã, onde coordenou curso de Administração com Habilitação em Análise de Sistemas por dez anos e o curso de Licenciatura em Computação. Atuou no setor privado como consultor, integrador e pesquisador de novas tecnologias informacionais de 1988 a 2004.
Organizadores
Guilherme Ataíde Dias
Universidade Federal da Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429
Graduado em Ciência da Computação pela Universidade Federal da Paraíba – UFPB Campus II (1990), Bacharel em Direito pelo Centro Universitário de João Pessoa – UNIPE (2010), Mestre em Organization & Management pela Central Connecticut State University – CCSU (1995), Doutor em Ciência da Informação (Ciências da Comunicação) pela Universidade de São Paulo – USP (2003) e Pós-Doutor pela UNESP (2011). Atualmente é professor Associado III na Universidade Federal da Paraíba, lotado no Departamento de Ciência da Informação. Está envolvido com a Pós-Graduação através do Programa de Pós-Graduação em Ciência da Informação e Programa de Pós-Graduação em Administração, ambos da UFPB. Tem interesse de pesquisa nas seguintes temáticas: Representação do Conhecimento; Arquitetura da Informação; Segurança da Informação; Tecnologias da Informação e Comunicação; Informação em Saúde; Redes Sociais; Software Livre; Direito, Ética e Propriedade Intelectual no Ciberespaço; Gestão de Dados Científicos; Informação Jurídica; Atualmente é Bolsista de Produtividade em Pesquisa (PQ) do CNPq.
Moisés Lima Dutra
Universidade Federal de Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034
Professor Adjunto da Universidade Federal de Santa Catarina, Departamento de Ciência da Informação. Doutor em Computação pela Universidade de Lyon 1, França (2009). Mestre em Engenharia Elétrica, subárea Automação e Sistemas (2005) e Bacharel em Computação (1998) pela Universidade Federal de Santa Catarina. Suas atuais linhas de pesquisa estão relacionadas a Inteligência Artificial Aplicada (Machine Learning, Deep Learning, Web Semântica, Linked Data) e a Data Science (Text Mining, Big Data, IoT). Está vinculado ao grupo de pesquisa ITI-RG (Inteligência, Tecnologia e Informação - Research Group).
Fábio Mosso Moreira
Universidade Estadual Paulista (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021
Graduado em Administração de Empresas pela Faculdade de Ciências e Engenharia (UNESP/Tupã). Mestrado concluído em Ciência da Informação - Faculdade de Filosofia e Ciências (UNESP/Marília). Doutorado em andamento Programa de Pós-Graduação em Ciência da Informação - Faculdade de Filosofia e Ciências (UNESP/Marília). Atua como membro do Grupo de Pesquisa Novas Tecnologias em Informação - GPNTI (UNESP/Marília) e Grupo de Pesquisa Tecnologia de Acesso a Dados -GPTAD (UNESP / Tupã). Editor de Conteúdo da Revista Eletrônica Competências Digitais para Agricultura Familiar (RECoDAF). Possui Habilidade Profissional Técnica em Informática pela ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Tem experiência profissional na área de Sistemas de Informação ERP para Operações de Logística. Atualmente realiza pesquisas com foco na investigação de temas ligados à utilização de recursos digitais para a disponibilização e acesso a dados governamentais de Políticas Públicas no âmbito dos pequenos produtores.
Fernando de Assis Rodrigues
Universidade Federal do Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582
Professor Adjunto no Instituto de Ciências Sociais Aplicadas, lotado na Faculdade de Arquivologia da Universidade Federal do Pará. Doutor e Mestre em Ciência da Informação pela UNESP - Universidade Estadual Paulista. Especialista em Sistemas para Internet pela UNIVEM - Centro Universitário Eurípides de Marília. Bacharel em Sistemas de Informação pela USC - Universidade do Sagrado Coração. Membro dos grupos de pesquisa GPNTI - Novas Tecnologias em Informação e GPTAD - Tecnologias de Acesso a Dados (UNESP), GPIDT - Informação, Dados e Tecnologia (USP) e GPDM - Dados e Metadados (UFSCar). Editor do periódico RECoDAF - Revista Eletrônica Competências Digitas para a Agricultura Familiar. Atua nas áreas da Ciência da Informação e da Ciência da Computação, com ênfase em Engenharia de Software, Bancos de Dados, Tecnologia de Informação e Comunicação e Ambientes Informacionais Digitais, focado principalmente nos seguintes temas: Coleta de Dados, Dados, Acesso a Dados, Serviços de Redes Sociais Online, Linked Data, Linked Open Data, Metadados, Internet Applications, Linguagens de Programação, Banco de Dados e Bases de Dados, Privacidade, Governo eletrônico, Open Government Data e Transparência Pública.
Ricardo César Gonçalves Sant'Ana
Universidade Estadual Paulista (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320
Professor Associado da Universidade Estadual Paulista - UNESP, Faculdade de Ciências e Engenharias - FCE, Campus de Tupã, em regime de dedicação exclusiva, onde é Presidente da Comissão de Acompanhamento e Avaliação dos cursos de Graduação - CAACG, Coordenador Local do Centro de Estudos e Práticas Pedagógicas - CENEPP e Ouvidor Local. Professor do Programa de Pós-Graduação em Ciência da Informação da Universidade Estadual Paulista, Campus de Marília. Graduado em Matemática e Pedagogia, Mestrado em Ciência da Informação (2002), Doutorado em Ciência da Informação (2008) e Livre-Docente em Sistemas de Informações Gerenciais pela UNESP (2017). Possui especializações em Orientação à Objetos (1996) e Gestão de Sistemas de Informação (1998). Parecerista ad hoc de periódicos e de agências de fomento. Lider do Grupo de Pesquisa - Tecnologias de Acesso a Dados (GPTAD) e membro do Grupo de Pesquisa - Novas Tecnologias em Informação GPNTI. Tem experiência na área de Ciência da Computação, atualmente realiza pesquisas com foco em: ciência da informação e tecnologia da informação, investigando temas ligados ao Ciclo de Vida dos Dados, Transparência e ao Fluxo Informacional em Cadeias Produtivas. Atuou como professor na Faccat Faculdade de Ciências Contábeis e Administração de Tupã, onde coordenou curso de Administração com Habilitação em Análise de Sistemas por dez anos e o curso de Licenciatura em Computação. Atuou no setor privado como consultor, integrador e pesquisador de novas tecnologias informacionais de 1988 a 2004.
Previsões de ausência em cuidados especializados em Unidades de Saúde Pública de Florianópolis
Páginas: 159 - 174
Autores
Milena Maredmi Correa Teixeira
Universidade Federal de Santa Catarina (UFSC) | milena.correira@grad.ufsc.br | https://orcid.org/0000-0002-4469-5006 | https://lattes.cnpq.br/4117308933497698
Possui graduação em Biblioteconomia pela Universidade Federal de Santa Catarina (2013). Atualmente é Mestranda em engenharia do Conhecimento e graduanda em Ciência da Informação pela Universidade Federal de Santa Catarina. Pesquisadora, Integrante do Grupo de Pesquisa em Habitats de Inovação e Empreendedorismo VIA Estação Conhecimento na Universidade Federal de Santa Catarina
Leandro Pereira Garcia
Universidade do Sul de Santa Catarina (USSC) | lpgarcia18@gmail.com | https://orcid.org/0000-0002-8601-7166 | https://lattes.cnpq.br/0573692306138917
Graduado em Medicina pela Universidade de Brasília, fez Residência Médica em Pediatria, MBA em Gestão Empresarial, MBA em Gestão de Projetos e Mestrado em Administração, Atualmente, cursando Doutorado em Ciências da Saúde. Desenvolveu sua dissertação, na linha de pesquisa Gestão Pública e Coprodução do Bem Público, propondo um modelo de Governança Pública que visa a promover a emancipação solidária de pessoas em comunidade: a Governança para a Emancipação. Tem experiência em Administração Pública, tendo atuado como Coordenador de Centro de Saúde, Gestor de Projetos e de Programas, além de de ter atuado no Planejamento Estratégico e como Diretor de Diretor de Vigilância em Saúde do Município de Florianópolis, setor com mais de 300 servidores e responsável pela Vigilância Epidemiológica, Vigilância Sanitária, Vigilância em Saúde do Trabalhador, Vigilância em Saúde Ambiental, Promoção da Saúde e Laboratório Municipal. Atualmente, coordena o Departamento de Análise de Dados da Secretaria Municipal de Saúde de Florianópolis.
Ingo Ramos
Universidade Federal de Santa Catarina (UFSC) | ingoramos12@gmail.com | https://lattes.cnpq.br/5051204071216974
Graduando do curso de Ciência da Informação na Universidade Federal de Santa Catarina
Lucas Alexandre Pedebôs
Secretaria Municipal de Saúde de Florianópolis | geinfo.sms@gmail.com | https://lattes.cnpq.br/6221635704169567
Possui graduação em Enfermagem pela Universidade Federal de Santa Catarina (2008) e mestrado em Saúde Pública pela Universidade Federal de Santa Catarina (2010). Atualmente cursa o doutorado em Saúde Coletiva pela UFSC e é enfermeiro da Prefeitura Municipal de Florianópolis, atuando Gerente de Inteligência e Informação na Secretaria Municipal de Saúde. Atuou, anteriormente, como professor em caráter temporário da Universidade Federal de Santa Catarina, e como coordenador de unidade básica de saúde. Tem experiência em Atenção Primária em Saúde e uso de indicadores e dados em saúde.
Douglas Dyllon Jeronimo de Macedo
Universidade Federal de Santa Catarina (UFSC) | douglas.macedo@ufsc.br | https://orcid.org/0000-0002-3237-4168 | https://lattes.cnpq.br/0149028226656519
Douglas Macedo é Professor Adjunto do Departamento de Ciência da Informação (CIN), da Universidade Federal de Santa Catarina (UFSC). Possui doutorado pelo Programa de Pós-Graduação em Engenharia de Conhecimento (PPGEGC), do Departamento de Engenharia do Conhecimento (dEGC) da Universidade Federal de Santa Catarina (UFSC). Durante o período do doutorado, esteve atuando como pesquisador visitante na The University of Western Ontario (UWO), em London - Ontario, no Canadá. Atua como pesquisador associado do Instituto Nacional de Convergência Digital (INCoD), atuando no Laboratório de Telemedicina (LabTelemed) e no Laboratório de Pesquisas em Sistemas Distribuídos (LaPeSD) da UFSC. Também atua como Membro Permanente do Programa de Pós-Graduação em Ciência da Computação (PPGCC/UFSC) e do Programa de Pós-Graduação em Ciência da Informação (PGCIN/UFSC). No passado, atuou como Professor Adjunto do Departamento de Computação (DCOMP) da Universidade Federal de Sergipe (UFS), onde também desempenhou papel de Coordenador do Núcleo de Desenvolvimento de Telemedicina e Telessaúde da UFS. Ainda no passado, foi professor efetivo do Instituto Federal de Santa Catarina (IFSC), onde atuou no Campus Garopaba. Tem experiência na área de Ciência da Computação, com ênfase em Redes de Computadores, Bancos de Dados Não-Convencionais, Sistemas Distribuídos e Informática Médica.
Gustavo Medeiros de Araujo
Universidade Federal de Santa Catarina (UFSC) | gustavo.araujo@ufsc.br | https://orcid.org/0000-0003-0572-6997 | https://lattes.cnpq.br/2609254559240670
Doutor em Engenharia de Automação e Sistemas pela UFSC (2013) e mestre em Ciência da Computação pela UFSC (2007). Tem experiência na área de Ciência da Computação e Automação, com ênfase em Data Science, Machine e Deep Learning e Cyber-Physical System. Possui duas linhas de pesquisa: i) Aplicações com Data Science, Machine e Deep Learning e ii) Protocolos de Redes de Sensores Sem Fio (RSSF) e MANTEs. Além da formação acadêmica, possui experiência na indústria de software desenvolvendo sistemas de informação para o governo federal e sistemas para a indústria de automação. Atualmente, é professor Adjunto A2 da Universidade Federal de Santa Catarina, membro do Laboratório de Integração Software e Hardware (LISHA) e membro do Laboratório de Engenharia e Ciência de Dados (LECID).
Transcrição do Vídeo
Olá pessoal, sou aluno da UFSC, e esse trabalho aqui é um trabalho de comunicação do nosso grupo de engenharia e ciência de dados em Florianópolis.
Aqui é mais um overview o que eu vou passar para vocês porque o trabalho está em andamento, então são os nossos preliminary results e eu vou mostrar aqui o que a gente construiu um modelo de previsão de faltas em atendimentos especializados em Unidades de Saúde de Florianópolis, que é um problema lá real.
O Sistema Único de Saúde (SUS) tem convivido com bastante problema de financiamento e gerenciamento, além dos problemas de gerenciar os recursos, isso vem dando uma dor de cabeça bastante grande tanto para a gestão quanto para o estado, e isso traz prejuízos de recursos financeiros mal administrados.
Apesar do impasse do recurso financeiro ideal nós estamos no caminho do desenvolvimento. O Brasil está um pouco pior comparado com alguns países em questão de repasse do PIB para saúde mas está melhor do que alguns outros em desenvolvimento como Chile e México.
Nessa época que a gente tem escassez de recursos e a gente não sabe se vai piorar ou não, a gente tem duas frentes para se trabalhar: ou pega mais dinheiro ou trabalha bem com o que tem. A ideia do trabalho surgiu dessa cooperação para tentar mitigar alguns dos problemas de gerenciamento de recursos que é justamente essa questão de faltas.
No caso o grande problema em termos de eficiência lá no SUS e em Florianópolis, é o desperdício causado por faltas em consultas médicas e odontológicas, ou seja, a pessoa marca a consulta e não vai. Existem diversos fatores, esses fatores a gente vem analisando diretamente com a agência de inteligência do SUS, a gente tem os dados e a gente verifica o que está acontecendo.
Em Florianópolis por exemplo tem um índice médio de faltas de 3% em consultas médicas e 12% em consultas odontológicas, então é um percentual bastante grande principalmente com relação às consultas odontológicas e isso gera perda de recurso financeiro, além de atrasar a fila.
Como objetivo que a gente identificou, analisar características que levam a ausência nas consultas de atendimento de complexidade mais alta no SUS em Florianópolis e construir um modelo que possa identificar os pacientes com grande probabilidade de faltas em consultas especializadas. A gente mapeou isso como um problema de classificação binária, se o cara vai faltar ou não vai faltar.
A gente pegou os dados de consultas agendadas, 18.503 consultas, no tempo de 1º de janeiro de 2016 até 30 de junho de 2018, para dois centros de especialização odontológico, com várias especialidades, então a gente pegou um pequeno recorte para poder trazer aqui no WIDAT. Então a gente analisou especialidades odontológicas para esse trabalho, a radiologia com 10.612 consultas, periodontia com 2.531, e endodontia com 5.360 consultas, no período de mais ou menos 1 ano e meio.
Algumas características que a gente analisou, que são as nossas features para começar a trabalhar, algumas delas a qualidade no cadastro, porque o SUS de Florianópolis tem um protocolo de atendimento que é todo digital, de uns 2 anos para cá nós temos uma base que a gente consegue trabalhar com todos os dados daquelas consultas, e um desses dados a escolaridade, dias da semana que acontecem as faltas quando são agendadas as consultas, o período que na verdade esse período foi um trabalho de data cleaning porque a gente transformou um horário em período porque senão ficaria muito a quantidade de variáveis a ser analisada então a gente acabou binarizando ali e fazendo manha e tarde, sexo, dentro outras variáveis.
Vou apresentar algumas que a gente analisou que é bem interessante de mostrar. A gente fez a aplicação de alguns algoritmos de machine learning, a gente pegou um set de algoritmo para poder verificar essa previsão, e a gente analisou a acurácia e a sensibilidade, que é bastante importante nesse caso para prever as faltas.
A sensibilidade que é a proporção de verdadeiros positivos, que é a capacidade do sistema predizer corretamente a condição para casos que realmente tem a condição de verdadeiro, ou seja, são os acertos positivos sobre o total de positivos, os verdadeiros positivos e os falsos negativos. Falsos negativos é que seriam faltas mas foram classificados como não.
Primeiro a gente faz segundo aquele rito de data science, faz um data cleaning, faz um data analytics, e a gente fez uma análise de dados com relação às especialidades de consultas em odontologia e viu ainda que a radiologia tem uma quantidade bastante de faltas, a periodontia também e a endodontia, entre outras especialidades.
Um exemplo simples aqui, a gente tem faltas por dia na semana em radiologia, a gente tem que de segunda a sexta essa distribuição de faltas, a gente percebeu que de sexta-feira é quando tem mais faltas, quando o pessoal mais falta em consultas especializadas. Lembrando que essas consultas especializadas muitas vezes são pagas pelo estado, são consultas que o SUS para ali 300 reais dependendo do tipo da consulta, e o cidadão falta na sexta-feira por exemplo, na segunda é quando menos falta.
Um outro dado interessante de odontologia e radiologia no caso é o nível de escolaridade. A gente vê aqui que o pessoal com mais escolaridade possível como mestrado e doutorado faltam menos mas a gente vê que isso vai crescendo, o superior incompleto falta mais, e o pessoal que tem o fundamental completo ou incompleto.
A gente tem uma distribuição aqui dos tipos de escolaridade com relação às faltas em consultas, então tem uma relação, quanto maior a escolaridade mas só que aqui fura um pouco no superior completo, mas quanto mais alta a escolaridade menor a probabilidade de faltar. Teria que cruzar com outros tipos de dados do IBGE para poder encontrar uma razão para isso daí.
Um outro tipo de variável foi o sexo, então há uma diferença pequena mas nessa análise os homens faltam um pouco mais que às mulheres nas consultas.
Mais uma análise, por período, então o período da tarde a gente verificou que há uma quantidade de faltas maior para a odontologia do que na manhã. Teria que verificar e cruzar com outros dados para verificar a razão disso daí. Inicialmente é uma análise mais crua daquele dado que está disponibilizado pelo SUS.
A partir dessas análises de dados, temos outras variáveis e outras análises que a gente fez, a gente parte para poder fazer aquele procedimento para escolher as características que mais são importantes e representam aquele modelo de predição de faltas. A gente pegou alguns algoritmos de machine learning, os mais usados e os principais, como: o modelo linear para tentar ver se os dados seguem uma linearidade; o Random Forest que é bastante importante em diversas análises de machine learning para grandes quantidade de dados; Rede Neural, pegamos uma rede simples; e os Boosts com três configurações (Gradiente Boosting, Stochastic Gradient Boosting e o AdaBoost).
Desses resultados que nós tivemos iniciais, nós tivemos ali na nossa matriz de confusão que nos dá ali a sensibilidade como um dado importante e como a acurácia. A gente não teve uma acurácia muito boa dessas features, mas a gente teve uma sensibilidade até aceitável.
Para a radiologia nós tivemos uma acurácia não muito boa mas a sensibilidade até um pouco melhor do que a acurácia. A precisão, uma boa precisão. E para a periodontia nós tivemos ali resultados chegando até 70% de acurácia e precisão quase 80%, e sensibilidade 80%.
A gente percebeu que melhora a acurácia a precisão também aumenta, nós fizemos diversos, porque quando nós começamos ter um underfit modelo a gente tem três coisas que agente pode fazer: uma ou a gente mexe nos parâmetros, a gente fez; usamos um boot search para poder varrer aquela quantidade de parâmetros possíveis que o modelo precisava e fizemos isso, então comprimos o rito. Outra coisa que a gente pode fazer é justamente melhorar a engineers, escolher novas features que representam melhor o modelo, só que a gente tinha todas as features naquele momento.
Nesse caso a gente percebeu que varremos todos os parâmetros possíveis e máximo de resultado que a gente teve foi esse que eu apresentei para vocês, quanto mais de 70% acurácia e 80% de sensibilidade em relação ao modelo.
A gente agora, inclusive essa semana, o pessoal está conseguindo coletar mais duas variáveis, uma de chuva, se teve chuva naquele momento, e ver se o cara faltasse, essa variável a gente consegue no instituto de meteorologia, é bem simples o acesso ao site, você cadastra e eles te dão um dataset que você quiser e você escolhe o tema, eles te dão os MLs de chuva, umidade, várias características que precisa.
E uma variável que a gente acho bastante importante é o tempo de espera, que é um pouco óbvio, porque tem consulta que demoram 7 meses ou 1 ano, a gente não sabe nem se o cara vai estar vivo até lá por exemplo. Então essa é uma variável bastante importante que estamos trabalhando e incluindo no modelo para ver se a gente melhora esse modelo de predição para chegar até no entorno de 90% ou 95%, já seria ideal para que o SUS possa utilizar esse modelo. Ou seja, a ideia é, o cara vai fazer o cadastro da consulta, o sistema vai alertar uma probabilidade muito alta do cara faltar, então para o SUS isso é muito interessante para que o SUS possa ligar algum tempo antes, para saber e alertar que tem consulta, de repente o cara não vai também porque morreu por exemplo, ou a pessoa conseguiu juntar dinheiro no tempo e fez a consulta no particular.
Isso para o SUS ele vai gastar 1 real de ligação e vai economizar 299 reais da consulta, além de reescalonar a fila, então esse é um trabalho bastante importante para a saúde. É nessa parceria que a gente está tentando melhorar o uso desses recursos, aqui às referências do trabalho e é isso.