El termino Big Data hace referencia a conjuntos de datos tan grandes y complejos que precisan de aplicaciones informáticas no tradicionales de procesamiento para tratarlos adecuadamente. La minería de datos, la elaboración de información a través de algoritmos matemáticos para obtener correlaciones, es una evolución imparable e inminente; con implicaciones sociales, culturales y tecnológicas tremendas. La capacidad del Big Data para aprovechar la información, predecir, prevenir y controlar situaciones dañinas para la sociedad puede resultar altamente beneficiosa. Sin embargo, como toda herramienta potente, su uso determinará si se trata de un prodigio o de un peligro. El valor del Big Data no consiste en analizar individualmente a un usuario sino, más bien en explorar una colectividad. Ha surgido un ecosistema digital global donde una red de proveedores recopila, organiza e intercambia datos, con el fin de obtener valor de la información acumulada, a esto se le denomina “Data Economy”. Con los aproximadamente 7 mil millones de personas presentes en el planeta; hoy, tenemos por lo menos 50 mil millones de dispositivos conectados a Internet que generan nuevos datos cada minuto. El Big Data puede llegar a convertirse en un nuevo modelo político y económico en sí mismo.

Antes de iniciar, debo confesar que tenía la falsa creencia de concebir los macrodatos o la “Big Data” como una nueva parcela de la ciencia estadística; sin demasiadas pretensiones más allá de las decisiones que pudiesen tomarse a través del análisis de esos datos. Así, en mi esquema mental, la Big Data significaba “Más Datos”, con el apoyo de la tecnología y los algoritmos para su análisis. ¿Qué podría estar mal? ¡Bienvenida la tecnología! Sin embargo, todo tiene un lado oscuro: Los efectos indeseados de la situación y la Big Data es un asunto mucho más complejo de lo que se puede imaginar.

Comencemos por lo siguiente, el volumen de datos disponibles en el mundo es gigantesco, para tener una idea de ello, se puede tomar como referencia los cálculos realizados por Cisco Global Cloud Index1, donde se indica que el tráfico global alcanzaría los 19,5 zettabytes anuales en 2021. Si todos estos datos, se pusieran en libros convirtiendo las imágenes, videos, etc. a su equivalente en letras, se podría hacer 17100 pilas de libros que equivalen a la distancia, para ir desde la tierra al sol tres veces.

El termino Big Data hace
referencia a conjuntos de
datos tan grandes y
complejos que precisan de
aplicaciones informáticas
no tradicionales de
procesamiento para
tratarlos adecuadamente.

El termino Big Data hace referencia a conjuntos de datos tan grandes y complejos que precisan de aplicaciones informáticas no tradicionales de procesamiento para tratarlos adecuadamente [2]. La primera referencia del uso de este término conduce a un artículo científico del año 1997 donde los investigadores de la NASA Michael Cox y David Ellsworth afirmaban que el gran aumento de datos generados se estaba convirtiendo en un problema para los sistemas informáticos actuales. Esto se dió conocer como el “Problema del Big Data” [3].

Una referencia mucho más reciente que popularizó el concepto es el ensayo del 2013 “Big Data La Revolución de los Datos Masivos”, [4] de Viktor Mayer-Schönberger, profesor de regulación y gestión de Internet en la Universidad de Oxford y miembro del Consejo Digital de Alemania que ha asesorando a Angela Merkel y su gabinete; en coautoría con Kenneth Cukier, editor de datos de la revista The Economist.

Su libro muestra como las empresas tecnológicas a través del Big Data están en grado de interpretar la realidad mucho más rápidamente y de manera más precisa que cualquier observatorio de datos u oficina de estadísticas.

La minería de datos, la elaboración de información a través de algoritmos matemáticos para obtener correlaciones entre los datos a larga escala, es una evolución imparable e inminente; con implicaciones sociales, culturales y tecnológicas tremendas. La causa y efecto es desplazada por la correlacionalidad y la creatividad del actor social (el individuo) queda totalmente opacada por el comportamiento de la colectividad.

Como ejemplo de ello, el profesor Mayer abre su ensayo relatando una situación que hoy resulta muy cercana. El brote del virus H1N1 que en pocas semanas amenazaba con convertirse en una pandemia, similar en escala a la gripe española de 1918 que afectó a 500 millones de personas causando decenas de millones de muertes.

Las autoridades sanitarias públicas necesitaban ralentizar su propagación y para ello era importante saber donde el virus ya se había manifestado. Sin embargo, así como ocurre todavía hoy, la información que los médicos y entes de salud pasaban a los Centers for Disease Control and Prevention, (CDC), tenían un desfase de dos semanas, debido a temas logísticos y de procesamiento de datos ya que, muchas personas acudían al médico varios días después de presentar los primeros síntomas.

Paralelamente se cita una publicación que había pasado relativamente desapercibida, unas semanas antes en la revista Nature, donde ingenieros de Google publicaron un artículo en el que afirmaban que a través de las búsquedas de las personas en su plataforma, Google podía “predecir” la propagación de la gripe invernal en los Estados Unidos por regiones específicas.

Google procesa más de tres mil millones de búsquedas todos los días. Estos datos se almacenan y se procesan a través de la minería de datos. Google Flu Trends tomó los cincuenta millones de términos de búsqueda más comunes de los estadounidenses, y los comparó con los datos de los CDC sobre la propagación de la gripe estacional entre 2003 y 2008, con la intención de identificar a los afectados de gripe a través de sus búsquedas en internet. El software consiguió 45 términos de búsqueda que al usarse conjuntamente en un modelo matemático, presentaba una fuerte correlación entre su “predicción” y las cifras oficiales del virus a lo largo del país.

Así pues en 2009, durante la crisis del virus H1N1, el sistema Google Flu Trends resultó ser un indicador más útil y oportuno que las estadísticas gubernamentales con su normal desfase de tiempo. Esta herramienta resultó de gran valor para la los funcionarios públicos sanitarios que no necesitaban distribuir bastoncitos para hisopados faríngeo-nasales, ni esperar que los pacientes llamaran a su médico para establecer un pronóstico del andamiento del virus.

Con la pandemia COVID-19, Google Flu Trends no pasó desapercibida. Muchos científicos y epidemiólogos tomaron la información disponible para analizar, comparando los Índices de Volúmenes de Búsqueda Relativa (RSV por sus siglas en inglés) con el número de casos de COVID-19 reportados por el Centro Europeo para el Control de Enfermedades (ECDC) utilizando un análisis de correlación de retardo de tiempo.

De este modo, el interés público en las búsquedas en Google relacionadas al Coronavirus, indicado por el Índices de RSV, ayudó a monitorear la progresión de la pandemia. Este RSV de las búsquedas resultó en promedio más alto 11,5 días antes del pico de casos oficiales reportados en cada zona. El patrón fue consistente en todos los países europeos y también resultó válido para Estados Unidos, mientras que en Brasil y Australia se observaron correlaciones más altas con un lapso de tiempo de -7 días.[5]

Google Flu Trend Coronavirus 2019-2020

Google Flu Trend Coronavirus 2019-2020

La capacidad del Big Data para aprovechar la información, predecir, prevenir y controlar situaciones dañinas para la sociedad puede resultar altamente beneficiosa. Sin embargo, como toda herramienta potente, su uso determinará si se trata de un prodigio o un peligro.

El Caso Cambridge Analytica.

Cambrige Analytica y el Big Data

Cambrige Analytica

El uso bidireccional de estos algoritmos que no solo “extraen” información, también intervienen para modificar los patrones de comportamiento de  las personas.

Lo ocurrido con Cambridge Analytica mostró la otra cara de la moneda. El uso bidireccional de estos algoritmos que no solo “extraen” información, también intervienen para modificar las tendencias de comportamiento de las personas.

A través del Big Data, la minería de datos, la microsegmentación, la psicología del comportamiento, el microtargeting y el marketing estratégico; la consultora Cambridge Analytica estableció métodos para influir en elecciones políticas de distintos países, utilizando datos de los perfiles de Facebook de millones de personas.

El uso indebido de la información personal de aproximadamente 50 millones de usuarios de Facebook por parte de Cambridge Analytica en Reino Unido, fue revelado por Christopher Wylie, un ex empleado de la empresa actuando bajo la protección del sistema Whistleblowing.

Wylie, experto en informática, reveló que la consultora había creado una maquinaria para manipular las decisiones de los votantes. En sus declaraciones, explicó el funcionamiento del sistema diciendo: «Explotamos Facebook para acceder a millones de perfiles de usuarios. Y  construimos modelos para explotar lo que sabíamos de ellos y apuntar a sus demonios internos. Esa era la base sobre la cual la compañía se fundó».[6]

La consultora Cambridge Analytica, estuvo implicada en 44 campañas políticas estadounidenses incluida la campaña del Ex presidente Donald Trump; así como la campaña por el Brexit en Reino Unido. Además, se estima que participó en aproximadamente 200 elecciones alrededor del mundo, incluidas las de Nigeria, Kenia, la República Checa, India y Argentina.

Tras el escándalo, diferentes comisiones se dieron a la tarea de investigar lo ocurrido con el propósito de individuar a los responsables y aplicar las sanciones a que hubiera lugar.

Mark Zuckerberg debió someterse a una audiencia pública ante el Congreso de Estados en 2018 y luego, ante una Comisión Parlamentaria Británica por uso indebido de datos de 87 millones de usuarios estadounidenses de Facebook, por parte de Cambdrige Analytica durante la campaña presidencial de D. Trump en 2016; y el uso ilegítimo de datos personales de ciudadanos británicos para la campaña del Brexit, respectivamente.

El modo en que este caso fue atendido, demostró cuan desarticulada y des-armonizada está la regulación en materia de protección de datos personales en el mundo, así como los enormes vacíos legales en materia de Big Data.

En el Reino Unido, la situación fue abordada por el regulador británico de la información (Information Commissioner’s Office, ICO), quien emitió un mandato para acceder y auditar in sito los servidores de Cambdrige Analytica, ordenando a Facebook que suspendiera su propia auditoría y más adelante con apoyo policial y bajo orden judicial, allanaron las oficinas de la compañía en Londres.

En los Estados Unidos, la Comisión Federal de Comercio (FTC), inició un proceso confidencial para investigar el rol de Facebook en el escándalo y tratar de esclarecer si la compañía violó los términos del acuerdo que le exige contar con el consentimiento de los usuarios para hacer el uso y la transmisión a terceros, de sus datos personales.

El marco legal aplicado para atender el caso de Cambdrige Analytica combinaba normas relativas a la protección de datos personales, confidencialidad o privacy y normas que regulan la publicidad comercial y publicidad engañosa. Sin embargo, esto  deja por fuera el núcleo de la acción que debería ser tipificada, pues lo ocurrido no solo vulnera el derecho a la protección de los datos personales y el derecho a la publicidad, menoscaba el derecho a la información y a la autodeterminación, atentando directamente contra las estructuras Democráticas del Estado.

La regulación en materia publicitaria de las campañas políticas es escasa. Las normas actuales que regulan la publicidad no van mucho más allá que servir de marco normativo para los contenidos y medios de difusión, mensajes, imágenes, spot de radio y televisión, etc… Los Fake News difundidos en las redes sociales, los “Influencer”, el marketing que se sirve de algoritmos, inteligencia artificial y mensajes individualizados o microtargeting diseñados para el explotar los aspectos psicológicos y persuadir (manipular) la toma de decisiones de las personas, todo esto sigue en un limbo jurídico que está dando gran ventaja a mal intencionados, descuidando los derechos humanos fundamentales que quedan completamente vulnerables.

Desde luego, regular los anuncios políticos en línea contribuiría a una mayor integridad, así lo indica Transparency International en el reporte publicado en marzo de 2021 con el título: “Pagar por las Opiniones: Resolver los Riesgos de Transparencia y Rendición de Cuentas en la Publicidad Política OnLine”, [7] donde se recomienda a los gobiernos actualizar las leyes electorales para garantizar que la publicidad política en línea sea legítima, que su financiamiento sea transparente y que la microtargeting se mantenga al mínimo, además de responsabilizar a las plataformas.

En cuanto, a la regulación en materia Privacy, en lo especifico el Reglamento Europeo de Protección de Datos Personales (GDPR, por sus siglas en inglés), aunque pueda considerarse vanguardista, y si se quiere en algunos aspectos, es un reglamento avanzado; puede “contentarse” (evito conscientemente referirme a términos como cumplimiento/compliance), con la anonimización, seudonimización y encriptación de la información para reducir o limitar la trazabilidad de los datos que identifican a la persona física. Empero, esto es solo la punta del iceberg. El valor del Big Data no consiste en analizar individualmente a un usuario, sino más bien a explorar una colectividad.

Business Strategy

Business Strategy

Los Datos del Rebaño.

 

Con el Big Data la abundancia de información eclipsa al individuo, su nombre no importa, lo que importa son las preferencias, gustos y tendencias, etc., de sus pares, por ejemplo de sus redes de contactos. Es decir, no importa si a Juan Pérez le gusta consumir porno, sino en qué barrio se consume más porno y de qué tipo. Esto ha sido denominado por algunos estudiosos como la “Datificación del Ser Humano”. [8]

Con el Big Data ha surgido un ecosistema digital global donde una red de proveedores recopila, organiza e intercambia datos con el fin de obtener valor de la información acumulada. Esto es conocido como “Data Economy” o Economía de Datos e incluye las entradas de datos recogidos por una gran variedad de actores.

La información vale. Y no estamos hablando en sentido figurado, con el Big Data ha surgido un ecosistema digital global donde una red de proveedores recopila, organiza e intercambia datos con el fin de obtener valor de la información acumulada. Esto es conocido como “Data Economy” o Economía de Datos, e incluye las entradas de datos recogidos por una gran variedad de actores, incluyendo los motores de búsqueda como Google, redes sociales, sitios web, tiendas Online, pasarelas de pago, software de servicios (SaaS), aplicaciones (App), dispositivos ioT (Internet de las cosas, como Alexa, Amazon Echo y otros similares), y un número creciente de empresas que despliegan distintos dispositivos conectados a Internet.

El tamaño de la Economía de Datos de la Unión Europea se estimó en más de 285000 millones de euros en 2015, lo que representa más del 1,94% del PIB de toda la Unión. [9]

Se estima que a nivel global, con los aproximadamente 7 mil millones de personas presentes en el planeta hoy, tenemos por lo menos 50 mil millones de dispositivos conectados a Internet que generan nuevos datos cada minuto.

Big Data

Fuente: Go-Globe.com

Esto podría crecer a muy corto plazo debido a la aceleración de la digitalización que hemos vivido en los últimos dos años, como consecuencia del confinamiento por la pandemia del COVID-19 y de otros avances que ya se venían gestando; entre ellos, la Industria 4.0, popularizada como “la cuarta revolución industrial”, que consiste en interconectar todas las partes de una empresa dando lugar a una automatización efectiva y una empresa más inteligente que además, comparte los datos adquiridos a través de su proceso industrial digitalizado, con los otros actores de su red de interacción (proveedores, socios, clientes, reguladores, etc.)

Los gigantes de la tecnología o Big Tech se están perfilando en un rol cada vez más protagónico en la economía actual.

Los gigantes de la tecnología o Big Tech se están perfilando en un rol cada vez más protagónico en la economía actual. Está claro, que con su incorporación al mundo de las finanzas a través de la emisión de sus Criptomonedas como la Stablecoin de Facebook, Diem suman nuevo valor al ya acumulado, por la marea de datos de los que disponen. Las Big Tech están comenzando a sustituir a las organizaciones financieras, como actores centrales en la dinámica económica post pandemia.

La principal limitación para comprender la complejidad del Big Data y el asedio de esta tecnología sobre los Derechos Humanos Fundamentales, es conseguir los conceptos adecuados para definir todos los aspectos del juego con un nuevo paradigma.

La Teoría del Juego Social del Carlos Matus [10] estableció una formula de la cual nos hemos apoderado en la Criminología Económica: Lo determinante es lo Político y el eje estratégico u ordenador es Lo Económico. Con el Big Data el centro de gravedad es el poder de los datos sobre la persona con los riesgos intrínsecos que conlleva el tratamiento de estos datos. Estamos ante un escenario de crimino génesis de nuevas formas delictivas, que superan en dimensión, magnitud y peso a conceptos viejos como “tratamiento ilícito de datos”, e incluso otros tan complejos como “delincuencia organizada transnacional”.

El Big Data puede llegar a convertirse en un nuevo modelo político y económico en sí mismo.

El Big Data puede llegar a convertirse en un nuevo modelo político y económico en sí mismo. Es difícil tomar consciencia que esto se trata de un asunto de enorme transcendencia donde, como señalaba Matus, hay un intercambio de problemas entre distintos tipos de juegos. [11]

Se trata de un escenario de especial complejidad, con juegos terminales o de consumo, que satisfacen necesidades (por ejemplo Google Flu Trends); juegos de capital o de acumulación que crean conocimiento, valores o activos, (por ejemplo con el comercio de datos en la data economy) y juegos de presión entre los gobiernos y las Big Tech, entre otros actores. Por consiguiente, si se suprimen los juegos de capital (la acumulación) en beneficio de las necesidades, llegará un momento en el que habrá que sacrificar las necesidades a causa del deterioro del capital. El intercambio entre problemas y necesidades debe satisfacer un balance en el legítimo interés colectivo.

Es importante reflexionar sobre este tema. Estamos todos dentro de experimento sociotecnológico donde aquello que se decide medir afecta la capacidad del actor para la toma de decisiones futuras. Entonces, ¿Quién decide, qué medir y cómo hacerlo? ¿Quién decide, que uso dar al Big Data? ¿Cuáles son los límites, para el intervencionismo de los algoritmos matemáticos en los perfiles de los usuarios? ¿Es legítimo dejar en manos de algoritmos y la inteligencia artificial, etiquetar que es “verdad” y que es “falso”, filtrando la información disponible? ¿Existe alguna pizca de Ética en la interacción entre las personas y la tecnología?

La regulación existente no es adecuada, ni pertinente frente al tsunami tecnológico que representa el Big Data y además carece de las eventuales instancias de resolución de controversias internacionales, a nivel supranacional. Todo esto, deja espacio para que surjan figuras ambiguas como el Oversigth de Facebook, un ente privado cuyas funciones terminan convirtiéndola en la mayor corte internacional de apelaciones sobre la libertad de expresión y del que ya hemos hablado en un artículo anterior. [12]

Es urgente, fijar un enfoque armonizado ante este problema. Nuestra propuesta partiendo de la Criminología Económica como ciencia trasversal, como un nuevo paradigma ante una nueva dimensión de prevención y control de la criminalidad, incluye un profundo análisis no solo, del ¿Por qué del delito?, sino del ¿Cómo del delito? y de las conductas predelictivas (antes llamadas conductas desviadas). Allí, donde todavía no existen los tipos penales correspondientes a la acción de daño. De este modo, el Derecho podría adaptarse a la realidad social derivada de esta tecnología para estar al ritmo de los tiempos.

[1] https://www.ituser.es/cloud/2018/02/eltrafico-cloud-global-alcanzara-los-195-zettabytes anuales-en-2021

[2] https://es.wikipedia.org/wiki/Macrodatos

[3] https://ideasparatuempresa.vodafone.es/big-data-desde-los-inicios-hoy/

[4] https://www.amazon.com/-/es/Viktor-Mayer-Sch%C3%B6nberger/dp/8415832109

[5] https://www.sciencedirect.com/science/article/pii/S1201971220302496

[6]https://es.wikipedia.org/wiki/Cambridge_Analytica#:~:text=Cambridge%20Analytica%20(CA)%20fue%20una,participar%20en%20la%20pol%C3%ADtica%20estadounidense.

[7] https://images.transparencycdn.org/images/2021_Report_PayingForViews-OnlinePoliticalAdvertising_English.pdf

[8] https://www.harvard-deusto.com/la-datificacion-de-la-sociedad-es-un-hecho-imparable

[9]https://en.wikipedia.org/wiki/Data_economy

[10] Matus Carlos, 2000: Teoría del Juego Social. Fondo Editorial Altadir.

[11] Idem 10

[12] https://ethicalentis.com/el-oversight-board-de-facebook-inc/

 

Pin It on Pinterest