Information, Data and Technology

Guilherme Ataíde Dias

Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.

Moisés Lima Dutra

Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).

Fábio Mosso Moreira

São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.

Fernando de Assis Rodrigues

Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.

Ricardo César Gonçalves Sant'Ana

São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.


Organizators

Guilherme Ataíde Dias

Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.

Moisés Lima Dutra

Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).

Fábio Mosso Moreira

São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.

Fernando de Assis Rodrigues

Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.

Ricardo César Gonçalves Sant'Ana

São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.


Featured entity identification to improve the Link Analysis

Pages: 363 - 380

Authors

Roberto Zaina

Federal University of Santa Catarina (UFSC) | rzaina@gmail.com | https://orcid.org/0000-0002-1887-5951 | https://lattes.cnpq.br/2044312005144633

Graduation in Law from Pontifical Catholic University of Paraná (2003) and Specialist in Business Intelligence from Universidade Positivo (2017). He has been a Brazilian Army Officer from 2001 to 2007. He has been a Federal Police Officer since 2007. He has professional experience in the areas of Criminal Law, Criminal Procedure, Information Technology and Data Analysis. He teaches courses at the National Police Academy (Federal Police), the National Secretariat of Public Security and the Department of Asset Recovery and International Legal Cooperation.

Vinicius Faria Culmant Ramos

Federal University of Santa Catarina (UFSC) | v.ramos@ufsc.br | https://orcid.org/0000-0002-8319-743X | https://lattes.cnpq.br/0442142220296336

Professor of the Federal University of Santa Catarina (UFSC) Araranguá campus. He holds a Bachelor's degree in Computer Science from UFRJ, a Master's Degree in Systems and Computer Engineering from COPPE / UFRJ and a Doctorate in Systems and Computer Engineering with a co-tutelary agreement between COPPE / UFRJ and the Eindhoven University of Technology (HOL) . Currently, he works with research and development of methodologies and technological tools for the treatment and analysis of large amounts of data (Big Data) in social networks. His researches are also focused on the teaching of computer programming and the development of constructivist learning environments in presence and distance with the use of new digital technologies of information and communication. It mainly works in the following subjects: educational technology, distance education, new Web technologies, adaptive systems, evaluation of adaptive systems, programming and treatment teaching and big data analysis.

Gustavo Medeiros de Araujo

Federal University of Santa Catarina (UFSC) | gustavo.araujo@ufsc.br | https://orcid.org/0000-0003-0572-6997 | https://lattes.cnpq.br/2609254559240670

PhD in Automation and Systems Engineering at UFSC (2013) and Master in Computer Science at UFSC (2007). He has experience in Computer Science and Automation, with emphasis on Data Science, Machine and Deep Learning and Cyber-Physical System. It has two lines of research: i) Applications with Data Science, Machine and Deep Learning and ii) Wireless Sensor Networks (WSNs) and MANTEs protocols. In addition to his academic background, he has experience in the software industry by developing information systems for the federal government and systems for the automation industry. He is currently associate professor A2 at the Federal University of Santa Catarina, member of the Laboratory of Software and Hardware Integration (LISHA) and member of the Laboratory of Engineering and Data Science (LECID).

Video Transcription

Esse trabalho é a identificação de entidades destaques para a melhoria da análise de vínculos, o qual foi realizado na Universidade Federal de Santa Catarina pelo mestrando Roberto Zaína, sob orientação dos professores Professor Dr. Gustavo Medeiros de Araújo e Professor Dr. Vinícius Faria Ramos Culmant.

Esse trabalho foi aceito no WIDAT 2018 no 2º workshop de informação, dados e tecnologia.

Bom esse trabalho está sobre a motivação de lavagem de dinheiro e análise de relatórios de inteligência financeira que são relatórios produzidos pela COAF.

De forma resumida existe algumas operações financeiras que são identificadas como suspeitas, essas operações financeiras identificados como suspeitos pelas entidades financeiras são comunicadas a COAF, onde avalia essa atividade suspeita e gera um relatório chamado relatório de inteligência financeira e esse relatório é enviado pelas autoridades, no caso, por exemplo a polícia federal.

Bom, há alguns problemas em relação à geração desses relatórios entre as informações analisadas e investigação de lavagem de dinheiro. Essas informações são descritas no relatório de inteligência financeira e comumente tem centenas de registros de operações financeiras envolvendo dezenas de pessoas e empresas.

Há um grande volume de dados para se investigar e fazer análise no relatório de inteligência financeira. Há um número grande de dados e uma complexidade de informações e de conexões entre entidades bastante grande.

Então o pessoal desenvolveu uma metodologia para poder fazer a identificação desses dados. O pessoal viabilizou a implementação das ferramentas de análise para fazer a busca, a coleta e o tratamento dos dados. No relatório de inteligência financeira a pessoa faz a seleção de um RIF modelo depois a estruturação das operações suspeitas no RIF uma seleção de alguns cnpj, a consulta do quadro societário das empresas e posterior estruturação dessa a planilha, seleção de cpf's bem societário, consulta de vínculos trabalhistas entre sócios de um posterior estruturação da planilha, a normalização dos dados originais, porque as informações são sigilosas e é necessário que os dados estejam normalizados.

Como resultado do uso de ferramentas de análise de vínculo em operações RIF, toma um fluxo resumido da metodologia esse RIF ele é tabulado, ou seja, as informações tabuladas em um relatório texto são analisadas manualmente e são transformadas em tabelas, essas tabelas são diagramadas pela ferramenta de análise de grafo. É possível realizar consultas de cnpj e fazer a importação e tabulação dessas consultas e cnpj e agregar mais informações a esses grafos.

Inicialmente a gente teria na primeira diagramação um diagrama desse tipo com as informações retiradas do RIF e cada informação é possível fazer cruzamento com outras bases de dados e aumentar essa rede de informações.

Então, essa rede de informação é aumentada realizado consultas pelo cpf, cnpj das empresas aumentando aí o tamanho do grafo, ou seja, essas linhas em verde são as linhas do RIF original e as outras linhas em vermelho, azul e preto são informações de outras bases de dados, como a Receita Federal por exemplo.

Dessa forma, é um grafo bastante grande e dependendo do tamanho do RIF esse grafo pode aumentar muito mais se essa complexidade de informação que o agente tem que trabalhar e tentar identificar os principais suspeitos e é aqui um trabalho para tentar fazer uma identificação e criar um modelo para identificar quais são as entidades destaque.

Nesse caso a partir de um modelo na COAF de operações financeiras suspeitas em operações financeiras, por exemplo, se há sócios entre empresas que foram empregados de uma empresa e dona de uma outra empresa e as transacções financeiras entre essas empresas, isso é considerado pela COAF como modelo de suspeita.

Então, a gente pegou esse modelo como suspeita, aí realizamos junto com uma ferramenta de BI uma relação dessas entidades e depois essa relação um carregamento na ferramenta de análise de vinculo.

Nós usamos a Business Intelligence para poder melhorar nessa questão da visualização das entidades destaque. A ferramenta que foi utilizado foi a QlikView que é uma ferramenta de BI comum e traz todas as informações relevantes de uma ferramenta de Business Intelligence e também a gente consegue incluir scripts específicos no qual a gente realizou esses scripts seguindo modelos de operações suspeitas da COAF a gente criou esses scripts para poder é levantar quais que são um suspeito seguindo aquele modelo da COAF.

Então, a metodologia seguindo o modelo da COAF é feita uma tabulação do modelo RIF com as operações, essas operações são carregadas por um script específicos para aquele tipo de modelo da COAF, no caso a métrica utilizada sócios e empregadas esse resultado dessas métricas são tabulados é feito uma consulta de históricos trabalhistas em outras bases. É feito um ajuste de métricas para poder pegar principalmente quem é o sócio da empresa e empregado em outra empresa a e esses caras. O resultado desses scripts são levados para a ferramenta de BI para identificar o que chama de prováveis interpostas pessoas.

Esses modelos de dados foram utilizados da primeira carga, modelo de dados da segunda carga de operações do RIF de societários e esse modelo é usado pra poder fazer aquela identificação da interposta das pessoas destaques as entidades destaques depois de feito essa consulta com script a gente tira de algumas pessoas que são as pessoas importantes mais importantes ali dentro de todo aquele grafo que apresentamos no começo.

Do grafo inicial que a gente tem a partir das informações do RIF cruzada com outras informações de outras bases como base da receita federal, então a gente pega as informações do livro como se fosse da receita federal faz uma análise de bussines inteligente guiada pelo modelo da COAF e assim conseguimos destacar as principais pessoas dentro desse grafo, ou seja, isso aqui é realmente um resultado que facilita o agente a identificar aquelas pessoas suspeitas e iniciar uma investigação.

Como conclusão a análise de vinculos é uma metodologia importante e bastante eficiente para detecção de processos envolvidos em operações financeiras ilícitas.

Entretanto, grafo é muito grande e dependendo da quantidade de bases agregada dificulta bastante a visualização, então para melhorar a identificação, direto no coração as pessoas que são os mais responsáveis dentro dessa rede criada é desenvolver um método baseado no modelo da COAF para poder identificar os principais atuantes os principais modus dentro daquele modelo para fazer a identificação. Qualquer pergunta contactar.


Support

Federal University of Paraíba (UFPB)São Paulo State University (UNESP)Federal University of Santa Catarina (UFSC)Electronic Journal Digital Skills for Family Farming (RECoDAF)National Council for Scientific and Technological Development (CNPq)