¿Somos un saco de datos? A propósito del “Big Data”

Actualmente, estoy en medio de la construcción de un sistema Big Data. Si tenéis alguna relación con las tecnologías de la información, muy probablemente habréis oído ese término, que agrupa herramientas y procedimientos orientados a gestionar grandes masas de datos.

Big Data es la respuesta a la necesidad de extraer valor de la cantidad creciente de información que se genera y almacena en los innumerables sistemas informáticos que nos rodean. Desde nuestra cuenta Twitter hasta la cámara de seguridad de nuestra oficina, pasando por una tienda on-line o cualquiera de los blogs con los que colaboramos, vamos dejando nuestras huellas en la red, y esas huellas contienen partes de nosotros: opiniones, preferencias, aversiones…

Mi proyecto se basa en Cassandra, una parte de la gran familia Hadoop que lleva camino de convertirse, de la mano de Apache, en claro líder de esta disciplina. Cassandra está alcanzando un gran volumen de implantaciones dada su sencillez y rápida puesta en marcha. Sin más que unos conocimientos mínimos de bases de datos y sistemas operativos, en unas pocas horas puedes tener tu propio entorno Cassandra funcionando a la perfección y, si tienes claros tus objetivos, en pocos días estás obteniendo resultados concretos de una nube de datos que parecían intratables. No puedo negar que estoy entusiasmado con esta tecnología, entusiasmo que comparto con no pocos colegas. Pero… Sí, como suele ocurrir, hay un “pero”.

En este caso, también como suele ocurrir, el “pero” no está en el Big Data en sí (a fin de cuentas, se trata de una herramienta, y como tal difícilmente puede ser valorada desde la ética o la moral) sino de las expectativas que está despertando. Un par de párrafos atrás he escrito que vamos dejando nuestra huella en la red, y esa huella tiene algo de nosotros… pero ¿sólo somos esa huella?

Leo algunos libros y artículos sobre Big Data cuyos autores esperan llegar a conocernos mejor que nosotros mismos. Según este punto de vista, el volumen de información personal que existe es de tal magnitud que nos identifica por completo, algo así como si cada uno de nosotros fuese un “saco de datos” que se van desparramando por el mundo digital, y si Big Data es capaz de recopilarlos, lo sabrá todo de todos, y podrá utilizar ese conocimiento desde para vendernos la chocolatina más deliciosa que podamos imaginar, hasta para prevenir las enfermedades a las que somos propensos.

 La pregunta que queda abierta es: ¿somos realmente un “saco de datos”? La huella que dejamos en los sistemas de información, ¿es nuestra esencia, o apenas una sombra de quienes somos? En mi opinión, la máquina tecnológica está en marcha y no va a detenerse: los laboriosos sistema Big Data están ya recogiendo los datos que caen del saco y utilizándolos para dibujar nuestro boceto, y no son más que una avanzadilla de lo que se avecina. Tal vez en muy poco tiempo tendremos la oportunidad de responder a estas preguntas.

Dejar respuesta

Please enter your comment!
Please enter your name here