Information, Data and Technology

Guilherme Ataíde Dias

Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.

Moisés Lima Dutra

Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).

Fábio Mosso Moreira

São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.

Fernando de Assis Rodrigues

Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.

Ricardo César Gonçalves Sant'Ana

São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.


Organizators

Guilherme Ataíde Dias

Federal University of Paraíba (UFPB) | guilhermeataide@ccsa.ufpb.br | https://orcid.org/0000-0001-6576-0017 | https://lattes.cnpq.br/9553707435669429

Undergraduate in Computer Science from the Federal University of Paraíba UFPB Campus II (1990), Bachelor in Law by the University Center of João Pessoa UNIPE (2010), Master in Organization & Management by Central Connecticut State University? CCSU (1995), PhD in Information Science (Communication Sciences) at the University of São Paulo? USP (2003) and Post-Doctor by UNESP (2011). He is currently Associate Professor III at the Federal University of Paraíba, where he holds a degree in Information Science. He is involved with Post-Graduation through the Post-Graduate Program in Information Science and Postgraduate Program in Administration, both of UFPB. Has research interest in the following themes: Knowledge Representation; Information Architecture; Information security; Information and Communication Technologies; Health Information; Social networks; Free software; Law, Ethics and Intellectual Property in Cyberspace; Scientific Data Management; Legal Information; He is currently Research Productivity Scholar (PQ) at CNPq.

Moisés Lima Dutra

Federal University of Santa Catarina (UFSC) | moises.dutra@ufsc.br | https://orcid.org/0000-0003-1000-5553 | https://lattes.cnpq.br/1973469817655034

Professor, Federal University of Santa Catarina, Department of Information Science. PhD in Computing from the University of Lyon 1, France (2009). Master in Electrical Engineering, subarea Automação e Sistemas (2005) and Bachelor in Computing (1998) from the Federal University of Santa Catarina. His current lines of research are related to Applied Artificial Intelligence (Machine Learning, Deep Learning, Semantic Web, Linked Data) and Data Science (Big Data, IoT). It is linked to the research group ITI-RG (Intelligence, Technology and Information - Research Group).

Fábio Mosso Moreira

São Paulo State University (UNESP) | fabio.moreira@unesp.br | https://orcid.org/0000-0002-9582-4218 | https://lattes.cnpq.br/1614493890723021

Undergraduate degree in Business Administration from the Faculty of Sciences and Engineering (UNESP / Tupã). Master degree in Information Science - (UNESP / Marília). PhD student in the Graduate Program in Information Science (UNESP / Marília). Member of the Research Group - GPNTI (UNESP / Marília) and GPTAD (UNESP / Tupã). Collaborator of the Project Digital Skills for Family Farming (CoDAF). Content editor of the Electronic Journal Digital Skills for Family Farming (RECoDAF). Professional Technical Skill in Informatics from ETEC Massuyuki Kawano - Centro Paula Souza de Tupã. Professional experience in the ERP Information Systems for Logistics Operations. Works with research in Information Science, studying the use of digital resources for access to government data of Public Policies in the context of the small farmer.

Fernando de Assis Rodrigues

Federal University of Pará (UFPA) | fernando@rodrigues.pro.br | https://orcid.org/0000-0001-9634-1202 | https://lattes.cnpq.br/5556499513805582

Professor at Federal University of Pará. Ph.D. and M.S. in Information Science, Post-bachelor in Internet Systems and Bachelor of Science in Information Systems. Most of his experience is based on works developed as a Full Stack Developer and Database administrator, especially with Python, Java and PHP programming languages, as well as MySQL, MariaDB, SQLite3 and PostgreSQL databases. Also, he lectured classes related to the context of Computer Science to undergraduate and graduate students at UNESP. Currently, He workd as a postdoc researcher at UNESP labs, working in data studies.

Ricardo César Gonçalves Sant'Ana

São Paulo State University (UNESP) | ricardo.santana@unesp.br | https://orcid.org/0000-0003-1387-4519 | https://lattes.cnpq.br/1022660730972320

Associate Professor at the Paulista State University - UNESP, Faculty of Sciences and Engineering - FCE, Campus de Tupã, on an exclusive dedication, where he is Chairman of the Monitoring and Evaluation Committee of the Graduate Courses - CAACG, Local Coordinator of the Center for Studies and Pedagogical Practices - CENEPP and Local Ombudsman. Professor of the Post-Graduate Program in Information Science of the Paulista State University, Marília Campus. Graduated in Mathematics and Pedagogy, Master in Information Science (2002), Doctorate in Information Science (2008) and Freelance in Management Information Systems by UNESP (2017). He has specialized in Object Orientation (1996) and Management of Information Systems (1998). Ad hoc advisor of periodicals and development agencies. Member of the Research Group - New Technologies in Information GPNTI-UNESP. Has experience in the area of ??Computer Science, currently conducts research focused on: information science and information technology, investigating issues related to the Data Life Cycle, Transparency and Information Flow in Productive Chains. He worked as a professor at Faccat Faculdade de Ciências Contábeis e Administração de Tupã, where he coordinated a course of Administration with Qualification in Systems Analysis for ten years and the course of Licenciatura in Computing. He worked in the private sector as a consultant, integrator and researcher of new information technologies from 1988 to 2004.


Biodiversity data management: applying the Darwin Core metadata standard

Pages: 397 - 408

Authors

Filipi Miranda Soares

Federal University of Minas Gerais (UFMG) | filipivgp2011@gmail.com | https://orcid.org/0000-0002-0674-7960 | https://lattes.cnpq.br/1290270601346793

Master in Management and Organization of Knowledge PPGGOC-UFMG, Bachelor in Librarianship by ECI-UFMG, academic exchange in the Science and Technology of Documentation and Information course by Instituto Superior de Contabilidade e Administração do Porto, Portugal, ISCAP (2016-2017). He has extensive experience as a consultant in technical standardization of scientific texts. He is interested in topics related to thesaurus, taxonomies, ontologies, binomial taxonomy of Linnaeus, Darwin Core metadata, classification theories, species classification, systematic zoology, organization of knowledge and information, normalization of academic documents, etc.

Raíssa Yuri Hamanaka

Federal University of Minas Gerais (UFMG) | raissa0201@gmail.com | https://orcid.org/0000-0001-9516-5825 | https://lattes.cnpq.br/7188479615806578

Master studente in Management and Organization of Knowledge PPGGOC-UFMG (2018-), Bachelor in Librarianship by ECI-UFMG (2014-2017), Technician in Informatics by Vital Brasil Technical School (2011-2013). He is interested in topics related to knowledge organization and information, process modeling, process mapping, Knowledge Organization Systems (SOCs).

Benildes Coura Moreira dos Santos Maculan

Federal University of Minas Gerais (UFMG) | benildes@gmail.com | https://orcid.org/0000-0003-4303-9071 | https://lattes.cnpq.br/5336218259257800

PhD and Master in Information Science by the Post-Graduate Program in Information Science, at the School of Information Science (ECI) of the Federal University of Minas Gerais (UFMG), and form a Librarian at the same University. Currently, Assistant Professor in the Department of Organization and Treatment of Information, at ECI / UFMG. Researcher at the MHTX Research Group - Conceptual Modeling for Hypertextual Organization of Documents and in the Research Group RECRI - Representation of Knowledge and Information Retrieval and in the Graduate Program in Management & Organization of Knowledge (PPGGOC / ECI / UFMG). Interests in the line of Architecture and Organization of Knowledge, with emphasis on theoretical and methodological issues of development of Knowledge Organization Systems (classification systems, taxonomies, thesaurus and semantic networks) and indexing languages; modeling and conceptual architectures (actors and scenarios); indexing processes; informational behavior; retrieval of information: physical access of the document and access to its informational content (in traditional libraries, digital, hypertexts and archives), in different contexts of use; Linked Data representation, data integration, language compatibility and semantics; (Statistics, Information and Communication Technology, Computing, Software Engineering, Logic, Linguistics, Terminology, Semantics, Communication, among others).

Video Transcription

Esse trabalho é a identificação de entidades destaques para a melhoria da análise de vínculos, o qual foi realizado na Universidade Federal de Santa Catarina pelo mestrando Roberto Zaína, sob orientação dos professores Professor Dr. Gustavo Medeiros de Araújo e Professor Dr. Vinícius Faria Ramos Culmant.

Esse trabalho foi aceito no WIDAT 2018 no 2º workshop de informação, dados e tecnologia.

Bom esse trabalho está sobre a motivação de lavagem de dinheiro e análise de relatórios de inteligência financeira que são relatórios produzidos pela COAF.

De forma resumida existe algumas operações financeiras que são identificadas como suspeitas, essas operações financeiras identificados como suspeitos pelas entidades financeiras são comunicadas a COAF, onde avalia essa atividade suspeita e gera um relatório chamado relatório de inteligência financeira e esse relatório é enviado pelas autoridades, no caso, por exemplo a polícia federal.

Bom, há alguns problemas em relação à geração desses relatórios entre as informações analisadas e investigação de lavagem de dinheiro. Essas informações são descritas no relatório de inteligência financeira e comumente tem centenas de registros de operações financeiras envolvendo dezenas de pessoas e empresas.

Há um grande volume de dados para se investigar e fazer análise no relatório de inteligência financeira. Há um número grande de dados e uma complexidade de informações e de conexões entre entidades bastante grande.

Então o pessoal desenvolveu uma metodologia para poder fazer a identificação desses dados. O pessoal viabilizou a implementação das ferramentas de análise para fazer a busca, a coleta e o tratamento dos dados. No relatório de inteligência financeira a pessoa faz a seleção de um RIF modelo depois a estruturação das operações suspeitas no RIF uma seleção de alguns cnpj, a consulta do quadro societário das empresas e posterior estruturação dessa a planilha, seleção de cpf's bem societário, consulta de vínculos trabalhistas entre sócios de um posterior estruturação da planilha, a normalização dos dados originais, porque as informações são sigilosas e é necessário que os dados estejam normalizados.

Como resultado do uso de ferramentas de análise de vínculo em operações RIF, toma um fluxo resumido da metodologia esse RIF ele é tabulado, ou seja, as informações tabuladas em um relatório texto são analisadas manualmente e são transformadas em tabelas, essas tabelas são diagramadas pela ferramenta de análise de grafo. É possível realizar consultas de cnpj e fazer a importação e tabulação dessas consultas e cnpj e agregar mais informações a esses grafos.

Inicialmente a gente teria na primeira diagramação um diagrama desse tipo com as informações retiradas do RIF e cada informação é possível fazer cruzamento com outras bases de dados e aumentar essa rede de informações.

Então, essa rede de informação é aumentada realizado consultas pelo cpf, cnpj das empresas aumentando aí o tamanho do grafo, ou seja, essas linhas em verde são as linhas do RIF original e as outras linhas em vermelho, azul e preto são informações de outras bases de dados, como a Receita Federal por exemplo.

Dessa forma, é um grafo bastante grande e dependendo do tamanho do RIF esse grafo pode aumentar muito mais se essa complexidade de informação que o agente tem que trabalhar e tentar identificar os principais suspeitos e é aqui um trabalho para tentar fazer uma identificação e criar um modelo para identificar quais são as entidades destaque.

Nesse caso a partir de um modelo na COAF de operações financeiras suspeitas em operações financeiras, por exemplo, se há sócios entre empresas que foram empregados de uma empresa e dona de uma outra empresa e as transacções financeiras entre essas empresas, isso é considerado pela COAF como modelo de suspeita.

Então, a gente pegou esse modelo como suspeita, aí realizamos junto com uma ferramenta de BI uma relação dessas entidades e depois essa relação um carregamento na ferramenta de análise de vinculo.

Nós usamos a Business Intelligence para poder melhorar nessa questão da visualização das entidades destaque. A ferramenta que foi utilizado foi a QlikView que é uma ferramenta de BI comum e traz todas as informações relevantes de uma ferramenta de Business Intelligence e também a gente consegue incluir scripts específicos no qual a gente realizou esses scripts seguindo modelos de operações suspeitas da COAF a gente criou esses scripts para poder é levantar quais que são um suspeito seguindo aquele modelo da COAF.

Então, a metodologia seguindo o modelo da COAF é feita uma tabulação do modelo RIF com as operações, essas operações são carregadas por um script específicos para aquele tipo de modelo da COAF, no caso a métrica utilizada sócios e empregadas esse resultado dessas métricas são tabulados é feito uma consulta de históricos trabalhistas em outras bases. É feito um ajuste de métricas para poder pegar principalmente quem é o sócio da empresa e empregado em outra empresa a e esses caras. O resultado desses scripts são levados para a ferramenta de BI para identificar o que chama de prováveis interpostas pessoas.

Esses modelos de dados foram utilizados da primeira carga, modelo de dados da segunda carga de operações do RIF de societários e esse modelo é usado pra poder fazer aquela identificação da interposta das pessoas destaques as entidades destaques depois de feito essa consulta com script a gente tira de algumas pessoas que são as pessoas importantes mais importantes ali dentro de todo aquele grafo que apresentamos no começo.

Do grafo inicial que a gente tem a partir das informações do RIF cruzada com outras informações de outras bases como base da receita federal, então a gente pega as informações do livro como se fosse da receita federal faz uma análise de bussines inteligente guiada pelo modelo da COAF e assim conseguimos destacar as principais pessoas dentro desse grafo, ou seja, isso aqui é realmente um resultado que facilita o agente a identificar aquelas pessoas suspeitas e iniciar uma investigação.

Como conclusão a análise de vinculos é uma metodologia importante e bastante eficiente para detecção de processos envolvidos em operações financeiras ilícitas.

Entretanto, grafo é muito grande e dependendo da quantidade de bases agregada dificulta bastante a visualização, então para melhorar a identificação, direto no coração as pessoas que são os mais responsáveis dentro dessa rede criada é desenvolver um método baseado no modelo da COAF para poder identificar os principais atuantes os principais modus dentro daquele modelo para fazer a identificação. Qualquer pergunta contactar.


Support

Federal University of Paraíba (UFPB)São Paulo State University (UNESP)Federal University of Santa Catarina (UFSC)Electronic Journal Digital Skills for Family Farming (RECoDAF)National Council for Scientific and Technological Development (CNPq)