Informação, Dados e Tecnologia

Guilherme Ataíde Dias

Universidade Federal da Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Graduado em Ciência da Computação pela Universidade Federal da Paraíba – UFPB Campus II (1990), Bacharel em Direito pelo Centro Universitário de João Pessoa – UNIPE (2010), Mestre em Organization & Management pela Central Connecticut State University – CCSU (1995), Doutor em Ciência da Informação (Ciências da Comunicação) pela Universidade de São Paulo – USP (2003) e Pós-Doutor pela UNESP (2011). Atualmente é professor Associado III na Universidade Federal da Paraíba, lotado no Departamento de Ciência da Informação. Está envolvido com a Pós-Graduação através do Programa de Pós-Graduação em Ciência da Informação e Programa de Pós-Graduação em Administração, ambos da UFPB. Tem interesse de pesquisa nas seguintes temáticas: Representação do Conhecimento; Arquitetura da Informação; Segurança da Informação; Tecnologias da Informação e Comunicação; Informação em Saúde; Redes Sociais; Software Livre; Direito, Ética e Propriedade Intelectual no Ciberespaço; Gestão de Dados Científicos; Informação Jurídica; Atualmente é Bolsista de Produtividade em Pesquisa (PQ) do CNPq.

Moisés Lima Dutra

Universidade Federal de Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor Adjunto da Universidade Federal de Santa Catarina, Departamento de Ciência da Informação. Doutor em Computação pela Universidade de Lyon 1, França (2009). Mestre em Engenharia Elétrica, subárea Automação e Sistemas (2005) e Bacharel em Computação (1998) pela Universidade Federal de Santa Catarina. Suas atuais linhas de pesquisa estão relacionadas a Inteligência Artificial Aplicada (Machine Learning, Deep Learning, Web Semântica, Linked Data) e a Data Science (Text Mining, Big Data, IoT). Está vinculado ao grupo de pesquisa ITI-RG (Inteligência, Tecnologia e Informação - Research Group).

Fábio Mosso Moreira

Universidade Estadual Paulista (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Graduado em Administração de Empresas pela Faculdade de Ciências e Engenharia (UNESP/Tupã). Mestrado concluído em Ciência da Informação - Faculdade de Filosofia e Ciências (UNESP/Marília). Doutorado em andamento Programa de Pós-Graduação em Ciência da Informação - Faculdade de Filosofia e Ciências (UNESP/Marília). Atua como membro do Grupo de Pesquisa Novas Tecnologias em Informação - GPNTI (UNESP/Marília) e Grupo de Pesquisa Tecnologia de Acesso a Dados -GPTAD (UNESP / Tupã). Editor de Conteúdo da Revista Eletrônica Competências Digitais para Agricultura Familiar (RECoDAF). Possui Habilidade Profissional Técnica em Informática pela ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Tem experiência profissional na área de Sistemas de Informação ERP para Operações de Logística. Atualmente realiza pesquisas com foco na investigação de temas ligados à utilização de recursos digitais para a disponibilização e acesso a dados governamentais de Políticas Públicas no âmbito dos pequenos produtores.

Fernando de Assis Rodrigues

Universidade Federal do Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor Adjunto no Instituto de Ciências Sociais Aplicadas, lotado na Faculdade de Arquivologia da Universidade Federal do Pará. Doutor e Mestre em Ciência da Informação pela UNESP - Universidade Estadual Paulista. Especialista em Sistemas para Internet pela UNIVEM - Centro Universitário Eurípides de Marília. Bacharel em Sistemas de Informação pela USC - Universidade do Sagrado Coração. Membro dos grupos de pesquisa GPNTI - Novas Tecnologias em Informação e GPTAD - Tecnologias de Acesso a Dados (UNESP), GPIDT - Informação, Dados e Tecnologia (USP) e GPDM - Dados e Metadados (UFSCar). Editor do periódico RECoDAF - Revista Eletrônica Competências Digitas para a Agricultura Familiar. Atua nas áreas da Ciência da Informação e da Ciência da Computação, com ênfase em Engenharia de Software, Bancos de Dados, Tecnologia de Informação e Comunicação e Ambientes Informacionais Digitais, focado principalmente nos seguintes temas: Coleta de Dados, Dados, Acesso a Dados, Serviços de Redes Sociais Online, Linked Data, Linked Open Data, Metadados, Internet Applications, Linguagens de Programação, Banco de Dados e Bases de Dados, Privacidade, Governo eletrônico, Open Government Data e Transparência Pública.

Ricardo César Gonçalves Sant'Ana

Universidade Estadual Paulista (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Professor Associado da Universidade Estadual Paulista - UNESP, Faculdade de Ciências e Engenharias - FCE, Campus de Tupã, em regime de dedicação exclusiva, onde é Presidente da Comissão de Acompanhamento e Avaliação dos cursos de Graduação - CAACG, Coordenador Local do Centro de Estudos e Práticas Pedagógicas - CENEPP e Ouvidor Local. Professor do Programa de Pós-Graduação em Ciência da Informação da Universidade Estadual Paulista, Campus de Marília. Graduado em Matemática e Pedagogia, Mestrado em Ciência da Informação (2002), Doutorado em Ciência da Informação (2008) e Livre-Docente em Sistemas de Informações Gerenciais pela UNESP (2017). Possui especializações em Orientação à Objetos (1996) e Gestão de Sistemas de Informação (1998). Parecerista ad hoc de periódicos e de agências de fomento. Lider do Grupo de Pesquisa - Tecnologias de Acesso a Dados (GPTAD) e membro do Grupo de Pesquisa - Novas Tecnologias em Informação GPNTI. Tem experiência na área de Ciência da Computação, atualmente realiza pesquisas com foco em: ciência da informação e tecnologia da informação, investigando temas ligados ao Ciclo de Vida dos Dados, Transparência e ao Fluxo Informacional em Cadeias Produtivas. Atuou como professor na Faccat Faculdade de Ciências Contábeis e Administração de Tupã, onde coordenou curso de Administração com Habilitação em Análise de Sistemas por dez anos e o curso de Licenciatura em Computação. Atuou no setor privado como consultor, integrador e pesquisador de novas tecnologias informacionais de 1988 a 2004.


Organizadores

Guilherme Ataíde Dias

Universidade Federal da Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Graduado em Ciência da Computação pela Universidade Federal da Paraíba – UFPB Campus II (1990), Bacharel em Direito pelo Centro Universitário de João Pessoa – UNIPE (2010), Mestre em Organization & Management pela Central Connecticut State University – CCSU (1995), Doutor em Ciência da Informação (Ciências da Comunicação) pela Universidade de São Paulo – USP (2003) e Pós-Doutor pela UNESP (2011). Atualmente é professor Associado III na Universidade Federal da Paraíba, lotado no Departamento de Ciência da Informação. Está envolvido com a Pós-Graduação através do Programa de Pós-Graduação em Ciência da Informação e Programa de Pós-Graduação em Administração, ambos da UFPB. Tem interesse de pesquisa nas seguintes temáticas: Representação do Conhecimento; Arquitetura da Informação; Segurança da Informação; Tecnologias da Informação e Comunicação; Informação em Saúde; Redes Sociais; Software Livre; Direito, Ética e Propriedade Intelectual no Ciberespaço; Gestão de Dados Científicos; Informação Jurídica; Atualmente é Bolsista de Produtividade em Pesquisa (PQ) do CNPq.

Moisés Lima Dutra

Universidade Federal de Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor Adjunto da Universidade Federal de Santa Catarina, Departamento de Ciência da Informação. Doutor em Computação pela Universidade de Lyon 1, França (2009). Mestre em Engenharia Elétrica, subárea Automação e Sistemas (2005) e Bacharel em Computação (1998) pela Universidade Federal de Santa Catarina. Suas atuais linhas de pesquisa estão relacionadas a Inteligência Artificial Aplicada (Machine Learning, Deep Learning, Web Semântica, Linked Data) e a Data Science (Text Mining, Big Data, IoT). Está vinculado ao grupo de pesquisa ITI-RG (Inteligência, Tecnologia e Informação - Research Group).

Fábio Mosso Moreira

Universidade Estadual Paulista (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Graduado em Administração de Empresas pela Faculdade de Ciências e Engenharia (UNESP/Tupã). Mestrado concluído em Ciência da Informação - Faculdade de Filosofia e Ciências (UNESP/Marília). Doutorado em andamento Programa de Pós-Graduação em Ciência da Informação - Faculdade de Filosofia e Ciências (UNESP/Marília). Atua como membro do Grupo de Pesquisa Novas Tecnologias em Informação - GPNTI (UNESP/Marília) e Grupo de Pesquisa Tecnologia de Acesso a Dados -GPTAD (UNESP / Tupã). Editor de Conteúdo da Revista Eletrônica Competências Digitais para Agricultura Familiar (RECoDAF). Possui Habilidade Profissional Técnica em Informática pela ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Tem experiência profissional na área de Sistemas de Informação ERP para Operações de Logística. Atualmente realiza pesquisas com foco na investigação de temas ligados à utilização de recursos digitais para a disponibilização e acesso a dados governamentais de Políticas Públicas no âmbito dos pequenos produtores.

Fernando de Assis Rodrigues

Universidade Federal do Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor Adjunto no Instituto de Ciências Sociais Aplicadas, lotado na Faculdade de Arquivologia da Universidade Federal do Pará. Doutor e Mestre em Ciência da Informação pela UNESP - Universidade Estadual Paulista. Especialista em Sistemas para Internet pela UNIVEM - Centro Universitário Eurípides de Marília. Bacharel em Sistemas de Informação pela USC - Universidade do Sagrado Coração. Membro dos grupos de pesquisa GPNTI - Novas Tecnologias em Informação e GPTAD - Tecnologias de Acesso a Dados (UNESP), GPIDT - Informação, Dados e Tecnologia (USP) e GPDM - Dados e Metadados (UFSCar). Editor do periódico RECoDAF - Revista Eletrônica Competências Digitas para a Agricultura Familiar. Atua nas áreas da Ciência da Informação e da Ciência da Computação, com ênfase em Engenharia de Software, Bancos de Dados, Tecnologia de Informação e Comunicação e Ambientes Informacionais Digitais, focado principalmente nos seguintes temas: Coleta de Dados, Dados, Acesso a Dados, Serviços de Redes Sociais Online, Linked Data, Linked Open Data, Metadados, Internet Applications, Linguagens de Programação, Banco de Dados e Bases de Dados, Privacidade, Governo eletrônico, Open Government Data e Transparência Pública.

Ricardo César Gonçalves Sant'Ana

Universidade Estadual Paulista (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Professor Associado da Universidade Estadual Paulista - UNESP, Faculdade de Ciências e Engenharias - FCE, Campus de Tupã, em regime de dedicação exclusiva, onde é Presidente da Comissão de Acompanhamento e Avaliação dos cursos de Graduação - CAACG, Coordenador Local do Centro de Estudos e Práticas Pedagógicas - CENEPP e Ouvidor Local. Professor do Programa de Pós-Graduação em Ciência da Informação da Universidade Estadual Paulista, Campus de Marília. Graduado em Matemática e Pedagogia, Mestrado em Ciência da Informação (2002), Doutorado em Ciência da Informação (2008) e Livre-Docente em Sistemas de Informações Gerenciais pela UNESP (2017). Possui especializações em Orientação à Objetos (1996) e Gestão de Sistemas de Informação (1998). Parecerista ad hoc de periódicos e de agências de fomento. Lider do Grupo de Pesquisa - Tecnologias de Acesso a Dados (GPTAD) e membro do Grupo de Pesquisa - Novas Tecnologias em Informação GPNTI. Tem experiência na área de Ciência da Computação, atualmente realiza pesquisas com foco em: ciência da informação e tecnologia da informação, investigando temas ligados ao Ciclo de Vida dos Dados, Transparência e ao Fluxo Informacional em Cadeias Produtivas. Atuou como professor na Faccat Faculdade de Ciências Contábeis e Administração de Tupã, onde coordenou curso de Administração com Habilitação em Análise de Sistemas por dez anos e o curso de Licenciatura em Computação. Atuou no setor privado como consultor, integrador e pesquisador de novas tecnologias informacionais de 1988 a 2004.


Identificação de Entidades Destaque para a Melhoria da Análise de Vínculos

Páginas: 363 - 380

Autores

Roberto Zaina

Federal University of Santa Catarina (UFSC) | rzaina@gmail.com | https://orcid.org/0000-0002-1887-5951 | https://lattes.cnpq.br/2044312005144633

É Bacharel em Direito pela Pontifícia Universidade Católica do Paraná (2003) e Especialista em Business Intelligence pela Universidade Positivo (2017). Foi Oficial do Exército Brasileiro de 2001 a 2007. É Agente de Polícia Federal desde 2007. Tem experiência profissional nas áreas de Direito Penal, Processual Penal, Tecnologia da Informação e Análise de Dados. É professor em cursos da Academia Nacional de Polícia (Polícia Federal), da Secretaria Nacional de Segurança Pública e do Departamento de Recuperação de Ativos e Cooperação Jurídica Internacional.

Vinicius Faria Culmant Ramos

Universidade Federal de Santa Catarina (UFSC) | v.ramos@ufsc.br | https://orcid.org/0000-0002-8319-743X | https://lattes.cnpq.br/0442142220296336

Professor Adjunto da Universidade Federal de Santa Catarina (UFSC) campus Araranguá. Possui graduação em Bacharelado em Ciência da Computação pela UFRJ, Mestrado em Engenharia de Sistemas e Computação pela COPPE/UFRJ e Doutorado em Engenharia de Sistemas e Computação com acordo de co-tutela entre a COPPE/UFRJ e a Universidade Tecnlógica de Eindhoven (HOL). Atualmente, trabalha com pesquisa e desenvolvimento de metodologias e ferramentas tecnológicas para o tratamento e análise de grande quantidade de dados (Big Data) em redes sociais. Suas pesquisas também são voltadas para o ensino de programação de computadores e o desenvolvimento de ambientes construtivistas de aprendizagem presenciais e a distância com o uso de novas tecnologias digitais da informação e comunicação. Atua principalmente nos seguintes temas: tecnologia educacional, educação a distância, novas tecnologias da Web, sistemas adaptativos, avaliação de sistemas adaptativos, ensino de programação e tratamento e análise de big data.

Gustavo Medeiros de Araujo

Universidade Federal de Santa Catarina (UFSC) | gustavo.araujo@ufsc.br | https://orcid.org/0000-0003-0572-6997 | https://lattes.cnpq.br/2609254559240670

Doutor em Engenharia de Automação e Sistemas pela UFSC (2013) e mestre em Ciência da Computação pela UFSC (2007). Tem experiência na área de Ciência da Computação e Automação, com ênfase em Data Science, Machine e Deep Learning e Cyber-Physical System. Possui duas linhas de pesquisa: i) Aplicações com Data Science, Machine e Deep Learning e ii) Protocolos de Redes de Sensores Sem Fio (RSSF) e MANTEs. Além da formação acadêmica, possui experiência na indústria de software desenvolvendo sistemas de informação para o governo federal e sistemas para a indústria de automação. Atualmente, é professor Adjunto A2 da Universidade Federal de Santa Catarina, membro do Laboratório de Integração Software e Hardware (LISHA) e membro do Laboratório de Engenharia e Ciência de Dados (LECID).

Transcrição do Vídeo

Esse trabalho é a identificação de entidades destaques para a melhoria da análise de vínculos, o qual foi realizado na Universidade Federal de Santa Catarina pelo mestrando Roberto Zaína, sob orientação dos professores Professor Dr. Gustavo Medeiros de Araújo e Professor Dr. Vinícius Faria Ramos Culmant.

Esse trabalho foi aceito no WIDAT 2018 no 2º workshop de informação, dados e tecnologia.

Bom esse trabalho está sobre a motivação de lavagem de dinheiro e análise de relatórios de inteligência financeira que são relatórios produzidos pela COAF.

De forma resumida existe algumas operações financeiras que são identificadas como suspeitas, essas operações financeiras identificados como suspeitos pelas entidades financeiras são comunicadas a COAF, onde avalia essa atividade suspeita e gera um relatório chamado relatório de inteligência financeira e esse relatório é enviado pelas autoridades, no caso, por exemplo a polícia federal.

Bom, há alguns problemas em relação à geração desses relatórios entre as informações analisadas e investigação de lavagem de dinheiro. Essas informações são descritas no relatório de inteligência financeira e comumente tem centenas de registros de operações financeiras envolvendo dezenas de pessoas e empresas.

Há um grande volume de dados para se investigar e fazer análise no relatório de inteligência financeira. Há um número grande de dados e uma complexidade de informações e de conexões entre entidades bastante grande.

Então o pessoal desenvolveu uma metodologia para poder fazer a identificação desses dados. O pessoal viabilizou a implementação das ferramentas de análise para fazer a busca, a coleta e o tratamento dos dados. No relatório de inteligência financeira a pessoa faz a seleção de um RIF modelo depois a estruturação das operações suspeitas no RIF uma seleção de alguns cnpj, a consulta do quadro societário das empresas e posterior estruturação dessa a planilha, seleção de cpf's bem societário, consulta de vínculos trabalhistas entre sócios de um posterior estruturação da planilha, a normalização dos dados originais, porque as informações são sigilosas e é necessário que os dados estejam normalizados.

Como resultado do uso de ferramentas de análise de vínculo em operações RIF, toma um fluxo resumido da metodologia esse RIF ele é tabulado, ou seja, as informações tabuladas em um relatório texto são analisadas manualmente e são transformadas em tabelas, essas tabelas são diagramadas pela ferramenta de análise de grafo. É possível realizar consultas de cnpj e fazer a importação e tabulação dessas consultas e cnpj e agregar mais informações a esses grafos.

Inicialmente a gente teria na primeira diagramação um diagrama desse tipo com as informações retiradas do RIF e cada informação é possível fazer cruzamento com outras bases de dados e aumentar essa rede de informações.

Então, essa rede de informação é aumentada realizado consultas pelo cpf, cnpj das empresas aumentando aí o tamanho do grafo, ou seja, essas linhas em verde são as linhas do RIF original e as outras linhas em vermelho, azul e preto são informações de outras bases de dados, como a Receita Federal por exemplo.

Dessa forma, é um grafo bastante grande e dependendo do tamanho do RIF esse grafo pode aumentar muito mais se essa complexidade de informação que o agente tem que trabalhar e tentar identificar os principais suspeitos e é aqui um trabalho para tentar fazer uma identificação e criar um modelo para identificar quais são as entidades destaque.

Nesse caso a partir de um modelo na COAF de operações financeiras suspeitas em operações financeiras, por exemplo, se há sócios entre empresas que foram empregados de uma empresa e dona de uma outra empresa e as transacções financeiras entre essas empresas, isso é considerado pela COAF como modelo de suspeita.

Então, a gente pegou esse modelo como suspeita, aí realizamos junto com uma ferramenta de BI uma relação dessas entidades e depois essa relação um carregamento na ferramenta de análise de vinculo.

Nós usamos a Business Intelligence para poder melhorar nessa questão da visualização das entidades destaque. A ferramenta que foi utilizado foi a QlikView que é uma ferramenta de BI comum e traz todas as informações relevantes de uma ferramenta de Business Intelligence e também a gente consegue incluir scripts específicos no qual a gente realizou esses scripts seguindo modelos de operações suspeitas da COAF a gente criou esses scripts para poder é levantar quais que são um suspeito seguindo aquele modelo da COAF.

Então, a metodologia seguindo o modelo da COAF é feita uma tabulação do modelo RIF com as operações, essas operações são carregadas por um script específicos para aquele tipo de modelo da COAF, no caso a métrica utilizada sócios e empregadas esse resultado dessas métricas são tabulados é feito uma consulta de históricos trabalhistas em outras bases. É feito um ajuste de métricas para poder pegar principalmente quem é o sócio da empresa e empregado em outra empresa a e esses caras. O resultado desses scripts são levados para a ferramenta de BI para identificar o que chama de prováveis interpostas pessoas.

Esses modelos de dados foram utilizados da primeira carga, modelo de dados da segunda carga de operações do RIF de societários e esse modelo é usado pra poder fazer aquela identificação da interposta das pessoas destaques as entidades destaques depois de feito essa consulta com script a gente tira de algumas pessoas que são as pessoas importantes mais importantes ali dentro de todo aquele grafo que apresentamos no começo.

Do grafo inicial que a gente tem a partir das informações do RIF cruzada com outras informações de outras bases como base da receita federal, então a gente pega as informações do livro como se fosse da receita federal faz uma análise de bussines inteligente guiada pelo modelo da COAF e assim conseguimos destacar as principais pessoas dentro desse grafo, ou seja, isso aqui é realmente um resultado que facilita o agente a identificar aquelas pessoas suspeitas e iniciar uma investigação.

Como conclusão a análise de vinculos é uma metodologia importante e bastante eficiente para detecção de processos envolvidos em operações financeiras ilícitas.

Entretanto, grafo é muito grande e dependendo da quantidade de bases agregada dificulta bastante a visualização, então para melhorar a identificação, direto no coração as pessoas que são os mais responsáveis dentro dessa rede criada é desenvolver um método baseado no modelo da COAF para poder identificar os principais atuantes os principais modus dentro daquele modelo para fazer a identificação. Qualquer pergunta contactar.


Apoio

Universidade Federal da Paraíba (UFPB)Universidade Estadual Paulista (UNESP)Universidade Federal de Santa Catarina (UFSC)Revista Eletrônica Competências Digitais para Agricultura Familiar (RECoDAF)Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)