Defcon: data science global terrorist database

Defcon: data science global terrorist database

Tiempo de lectura estimado: 7 minutos


Esta conferencia magistral pertenece al Módulo 16 "Ciberseguridad y Data Science" de C1b3rWall Academy 2021/2022. El objetivo de la misma es, a modo de juego a través de la Global Terrorist Database, tratar de predecir variables en relación a una acción terrorista y su planificación.

Introducción y herramientas

Las acciones a predecir como parte del juego que propone la ponencia son las siguientes:

  • Si la acción la comete un lobo solitario o un grupo terrorista.
  • Si la planificación de la acción es internacional o no.
  • Si se trata de una acción única o es múltiple.
  • Si se trata de una acción suicida.
  • Cuáles son la motivación y la matriz ideológica de la acción.

Para realizar el juego se utilizan dataset gratuitos como son la Global Terrorist Database y Big, Allied and Dangerous (BAAD). También se utilizan una serie de librerías de python como Sklearn y Pandas.

Global Terrorist Database: ¿Qué es?

Se trata de un dataset compuesto por 136 columnas que incluye todos los atentados terroristas a nivel mundial desde 1970 hasta 2020, con distintos datos marcados en forma de variables geográficas (por ejemplo, el lugar donde se produjo), de criterio (finalidad e intención) o de planificación. 

Hay otras variables que se denominan agregadas y son las que, principalmente, permiten que el juego se lleve a cabo. La idea planteada en el juego es que se acaba de cometer una acción terrorista y el usuario tiene un conocimiento previo: sabe el día, mes y año en el que está, el tipo de ataque (asesinato, toma de rehenes, explosión...), el objetivo contra el que se comete, el tipo de arma utilizado, etc. Esas variables ya conocidas se introducen en el database

¿Qué es una acción múltiple?

Se trata de un ataque en varias fases, utilizando la primera para propiciar y facilitar la segunda (por ejemplo, cometer una primera acción en un lugar determinado para que los dispositivos de seguridad se desplacen hasta allí y tener vía más libre para llevar a cabo la segunda).

Matriz ideológica: grupos

Se incluye el dataset de la BAAD con la finalidad de construir una matriz idegológica que se pueda incorporar en la Global Terrorist Database. Consiste en una serie de columnas que representan ideologías, por ejemplo: ¿Es yihadista? 0 = no; 1= sí. Así, se puede crear una matriz en torno a un determinado grupo terrorista, tal y como aparece en la siguiente imagen:

Matriz ideológica: lobos solitarios

Para este juego, a prior, se estaban incluyendo solo nombres de grupos terroristas, por lo que habría multitud de espacios en blanco dedicados a los que actúan como lobos solitarios o ataques de índole individual. Teniendo esto en cuenta, y con los datos que proporciona la database, se puede convertir la matriz ideológica de lobos solitarios.

Uso de árboles de decisión y random forest

Un árbol de decisión consiste en que, dado un conjunto de datos, se fabrican diagramas de construcciones lógicas, que son muy similares a los sistemas de predicción basados en reglas. Esto sirve para representar y categorizar una serie de condiciones que ocurren de forma sucesiva.

El random forest es un método que combina una cantidad grande de árboles de decisión independientes probados sobre conjuntos de datos aleatorios con igual distribución.

Apartado práctico de exploración

A partir de este punto, en la ponencia, se utilizan distintas herramientas como KNIME para, de forma práctica, realizar la exploración de datos, analizar la correlación de variables, usar árboles de decisión, etc. Por ello, se recomienda el visionado de la misma en la plataforma e4you para obtener un conocimiento más profundo en la materia.


¿Todavía no formas parte de C1b3rWall Academy? El contenido es gratuito, únete a otras 30.000 personas desde este enlace.

                   

Si te interesa este tema, puedes consultar la información y cursar el Máster en Ciberseguridad o ver la oferta de másteres desde aquí.


Ponente: Carlos Loureiro 

Carlos es licenciado en Ciencias Políticas y Criminología. Es miembro de Mundo Hacker Team, de la comunidad HackMadrid%27 y profesor de diversos másteres universitarios en ciberseguridad, ciberdelincuencia y ciberinteligencia. Además, es formador de FFCCSS Cybersecurity Summer BootCamp INCIBE y ha sido ponente en distintos eventos relacionados con la ciberseguridad.