La revolución (o dictadura) de los datos 'big data'

Cada clic en Internet, cada comentario en una red social, cada archivo que se sube o descarga y hasta un error ortográfico genera una catarata de información sobre nosotros. Por Fernando Goitia y André Petry

Empresas, instituciones y gobiernos procesan esta apabullante cantidad de datos para vendernos productos, mejorar nuestra salud, facilitarnos servicios, buscar nuestro voto Para bien y para mal hemos entrado en la era del ‘big data’. Y esto es solo el principio.

En 15 minutos generamos tres veces más datos que todo el archivo de la mayor biblioteca del planeta

¿Cómo identificar a una mujer embarazada antes que nadie? Target, una cadena de grandes almacenes de los EE.UU., se propuso este objetivo hace unos años. La concepción marca un antes y un después en los hábitos de consumo de una pareja. Fidelizar a esas clientas sería, por consiguiente, un chollo para una empresa como Target.

Pues bien, un día un hombre entró en una tienda de la franquicia hecho una furia. «Mi hija ha recibido esto por correo -se quejó, mostrando un fajo de cupones de productos para bebés-. Todavía está en el instituto. ¿Quieren incitarla a tener hijos?». Los almacenes habían detectado que el ordenador de la chica entraba en webs relacionadas con bebés. El gerente se disculpó. Días más tarde, inquieto ante la posibilidad de perder un cliente, llamó al señor. Al otro lado de la línea, este se mostró mucho más calmado. «Verá, he hablado con mi hija. Soy yo quien le debe una disculpa. Está embarazada».

Este episodio, narrado en el libro El poder de los hábitos (Ediciones Urano), sobre cómo algunas empresas predicen y manipulan hábitos de consumo, es un ejemplo clásico de big data, la vasta acumulación de datos digitales y su transformación en valor económico, que está revolucionando el mundo.

Target analizó los datos de millones de clientes hasta encontrar una correlación entre los hábitos de compra y un probable embarazo. La marca incluso estima la fecha de parto con un estrecho margen de error y ofrece así los productos más adecuados a cada fase de la gestación.

El término big data, acuñado en los noventa por ciencias como la astronomía y la genética, pioneras en acumulación masiva de datos, se extiende por todas las áreas de actividad en una época en que la humanidad genera en 15 minutos tres veces el acervo de la Biblioteca del Congreso de los EE.UU., la mayor del planeta. La gran revolución, sin embargo, no estriba en esa apabullante generación de datos, que también; el gran cambio es que somos capaces de almacenarlos hace dos décadas, guardar un gigabyte costaba 1000 dólares; hoy, 6 centavos y extraer ‘petróleo’ de ellos.

Big data es cada clic en Internet, cada comentario en una red social, cada archivo que se sube o se descarga, cada vídeo, canción o texto que ejecutamos, cada e-mail que enviamos o recibimos... Pero, ¡ojo!, también cada llamada telefónica grabada por razones de seguridad», cada dato que proporciona nuestro móvil; sensores, cámaras, radares y demás repartidos por medio mundo. Por resumir. cada dato que cedemos o recogen empresas, instituciones y gobiernos.

Estudiando las búsquedas de usuarios se puede predecir la propagación de la gripe en tiempo real.

«Cuando cruzamos todos esos datos, aparecen grandes descubrimientos», reflexiona Peter Norvig, director de investigación de Google, la mayor empresa privada en términos de acumulación digital. Google, sin ir más lejos, es capaz de predecir desde 2008 la propagación de una epidemia de gripe estudiando las búsquedas de sus usuarios; más de 3000 millones de consultas diarias, archivadas todas ellas en sus servidores. Para conseguirlo, sus algoritmos procesaron 450 millones de modelos matemáticos diferentes hasta hallar una combinación de 45 palabras que presentaban una fuerte correlación con la posibilidad de que un usuario padeciera gripe. Semanas más tarde, cuando se conocieron las cifras recogidas por médicos de todos los EE.UU., estas coincidían con las de Google. Pero, a diferencia de la estadística oficial, la del buscador estaba disponible en tiempo real. Fue el nacimiento de Google Flu Trends, una herramienta hoy indispensable para evitar la propagación del virus.

A partir del análisis masivo de electrocardiogramas de pacientes fallecidos por infarto, John Guttag y Collin Stultz han creado un modelo informático que permitirá reducir el riesgo de sufrir un ataque al corazón.

La sanidad es, de hecho, un campo con gran potencial, como ha demostrado Stephan Fihn, coordinador del sistema de datos de la red sanitaria que atiende a 25 millones de veteranos de guerra de los EE.UU., con 6000 millones de análisis de laboratorio, 3000 millones de manuscritos médicos, nueve millones de internamientos… Cruzando todo eso, Fihn realiza previsiones semanales sobre la salud de los pacientes: ¿Qué probabilidad hay de que uno sea internado en 30 días? ¿Cuál es el riesgo de que sufra un infarto o fallezca? Estudios como este revolucionarán la prevención, pero también el mundo de los seguros, ya que las compañías podrán discriminar a sus clientes en función del riesgo.

Los algoritmos ya conducen coches por su cuenta.

La segunda clave del big data, tras la ya mencionada capacidad de almacenamiento, son los algoritmos, la herramienta definitiva para sacar partido a toda esa caótica montaña de datos sin aparente utilidad. En la definición clásica, ‘algoritmo’ es la secuencia de instrucciones para llegar a una conclusión sobre qué acción tomar. En el big data, los algoritmos separan el polvo de la paja, relacionan datos con acciones concretas, llegan a conclusiones y toman decisiones. Gracias a ellos, Amazon, Netflix y otras empresas recomiendan libros al gusto de sus clientes. Los algoritmos ya conducen coches por su cuenta, y sin exceder el límite de velocidad, en Florida y Nevada donde la ley los autoriza a circular por sus carreteras.

Patel con su invento redujo su factura de la luz de forma drástica, patentó su invento, fundó una ‘startup’ y se la vendió a una multinacional.

El algoritmo, sin embargo, no nos lo cuenta todo. La búsqueda de la causa, el motivo por el cual algo sucede o existe, está dejando paso a la correlación. «Para un comerciante, el porqué ya carece de importancia -reflexionan Viktor Mayer-Schönberger y Kennet Cukier, autores de Big data. La revolución de los datos masivos (Editorial Turner)-. Es el qué lo que impulsa los clics. Con las correlaciones no hay certeza, solo probabilidad. Pero si una correlación es fuerte, la probabilidad de vínculo es muy elevada . Las correlaciones, en todo caso, al conectar las cosas, también fomentan búsquedas causales. Pueden orientar a los científicos, por ejemplo, hacia causas probables que investigar.

Shwetak Patel, ingeniero, inventor de un sistema para saber cuánto consume un aparato eléctrico. Ha descubierto que todos incluyen una firma digital única que facilita datos sobre el usuario a las eléctricas y ha creado sensores para detectarlas y controlar su consumo de energía aparato por aparato.

En la era del big data, el aforismo «la información es poder» , tiene estatus de mandamiento. Empresas como Acxiom, el gran gigante de las ‘correctoras de datos’ -compañías que recolectan, analizan y venden información-, ya son conocidas como ciberazzis (cibernética/paparazzi); término nada desencaminado, ya que, con 23.000 servidores que procesan 50 billones de datos anuales, Acxiom maneja 1500 detalles personales de origen digital de 500 millones de consumidores. Por no hablar de las compañías de telefonía, que manejan, con los datos de los móviles de sus usuarios, una colosal mina de oro. Ciertas empresas, por ejemplo, ya ganan dinero detectando atascos sin ver los coches: basta con comprobar la velocidad y el número de teléfonos que ‘van’ por una carretera. Este es, de hecho, el gran problema.

Con la expansión digital, nuestra privacidad se enfrenta a inéditas amenazas. Las firmas de todo tipo amasan informaciones que relacionan con otras sin nuestro conocimiento y las utilizan de maneras que ni siquiera podemos imaginar. Y no es ese el único peligro. En los EE.UU., la mayoría de juntas de libertad condicional deciden, a partir de análisis de datos, si excarcelan a presos o los mantienen entre rejas.

¿Acabaremos como imaginó Philip K. Dick en 1956, en su relato The minority report -adaptado por Spielberg al cine-, con los criminales siendo detenidos antes de cometer un delito? «La dictadura de los datos nos acecha -advierten Cukier y Mayer-Schönberger-, dependerá de nosotros dejarnos atrapar por ella cuando tengamos motivos razonables para sospechar de que algo está mal».

También te pueden interesar estos artículos

Palantir, la empresa más polémica del mundo

¿Es el ‘big data’ tan grande como parece?, por David Trueba

Big brother, big data, por Isabel Coixet

El nuevo XLSemanal

A partir de ahora consulta los nuevos contenidos en la web de tu periódico

Descúbrelos

La revolución (o dictadura) de los datos 'big data'

Cada clic en Internet, cada comentario en una red social, cada archivo que se sube o descarga y hasta un error ortográfico genera una catarata de información sobre nosotros. Por Fernando Goitia y André Petry

En 15 minutos generamos tres veces más datos que todo el archivo de la mayor biblioteca del planeta

Estudiando las búsquedas de usuarios se puede predecir la propagación de la gripe en tiempo real.

Los algoritmos ya conducen coches por su cuenta.

Patel con su invento redujo su factura de la luz de forma drástica, patentó su invento, fundó una ‘startup’ y se la vendió a una multinacional.

También te pueden interesar estos artículos

A partir de ahora consulta los nuevos contenidos en la web de tu periódico

Aldeas Infantiles SOS inaugura una exposición fotográfica que rinde homenaje a los hermanos en acogimiento

#XL2035 Tiempo de moverse

Alicia Koplowitz, Juan Luis Arsuaga, Alejandro Amenábar y Josep Maria Esquirol reciben el Premio XLSemanal

XLSemanal celebra su 35 aniversario

José Antonio Sayagués: «Me da mucho pudor hablar de eso… pero ligar, ligo. Tengo muchas amigas»

Jesús Cimarro: «Si la cultura no hubiera dado contenidos, tendríamos muchos más trastornos mentales»

María Garralón: «Me parece aberrante que hoy te den trabajo en función de tus seguidores en redes»

María Sánchez: «Al presentar un libro, han dicho de mí: ‘Muy de campo no será si lleva los labios pintados'»

Cada clic en Internet, cada comentario en una red social, cada archivo que se sube o descarga y hasta un error ortográfico genera una catarata de información sobre nosotros. Por Fernando Goitia y André Petry

En 15 minutos generamos tres veces más datos que todo el archivo de la mayor biblioteca del planeta

Estudiando las búsquedas de usuarios se puede predecir la propagación de la gripe en tiempo real.

Los algoritmos ya conducen coches por su cuenta.

Patel con su invento redujo su factura de la luz de forma drástica, patentó su invento, fundó una ‘startup’ y se la vendió a una multinacional.

También te pueden interesar estos artículos

A partir de ahora consulta los nuevos contenidos en la web de tu periódico

Noticias Relacionadas

Enlaces de Interés