Cada día, los seres humanos producimos una gran cantidad de datos. Generamos datos ya desde que nos levantamos, al utilizar el móvil para ver nuestras redes sociales, o las noticias de un periódico, o simplemente al navegar por internet. Las famosas cookies que tenemos que aceptar si queremos seguir navegando no son más que datos que permitimos que recojan sobre nosotros. Esos datos se transformarán en información que «otros» utilizarán con fines muy distintos.

Desde los años 60 del pasado siglo, los estadísticos llevan intentando obtener información de todos los datos que generamos. Sin embargo, con la irrupción de los ordenadores, los cálculos se hicieron más grandes e hizo falta automatizar este proceso de obtención de información. Es ahí donde los informáticos han reemplazado a los estadísticos a la hora de buscar soluciones para saber qué hacer con esos datos. A este campo de estudio se le llama Minería de Datos o Data Mining. Así, la Minería de Datos se encarga de generar diversas técnicas que se aplicarán para dos cosas fundamentalmente: predecir automáticamente tendencias y comportamientos, y descubrir automáticamente modelos en los datos que anteriormente eran desconocidos o permanecían ocultos.

Sus aplicaciones son muchas. Quizás una de las que resulta más visible en los medios de comunicación es aquella en la que la medicina está implicada. Aquí en Córdoba, por ejemplo, el Instituto Maimónides de Investigación Biomédica de Córdoba, más conocido por el Imibic, colabora con el departamento de Informática y Análisis Numérico de la Universidad de Córdoba para extraer datos de las investigaciones que los médicos del Hospital Reina Sofía llevan a cabo. Los médicos tienen los datos, y los informáticos las herramientas para sacar de ellos la información. De esta manera es como aparecerán después los resultados de estas investigaciones en revistas de gran prestigio en medicina. Y gracias a ellos se podrán conocer nuevos aspectos como la reincidencia del cáncer en mujeres en edad de concebir, información de vital importancia para que las pacientes puedan decidir de manera más racional sobre los riesgos que conlleva para ellas y sus futuros hijos el quedarse embarazadas tras haber sufrido ya esta enfermedad.

Otra aplicación bastante conocida es la del análisis que lleva haciendo la Oficina Federal de Investigación (FBI) de los EEUU. Desde el año 2002, y a raíz del ataque terrorista a las Torres Gemelas de Nueva York, esta organización anunció que comenzaría a introducirse en las bases de datos comerciales referentes a hábitos y preferencias de compra de los estadounidenses (y personas de otras partes del mundo) con el fin de descubrir potenciales terroristas antes de que ejecuten alguna acción. Por otra parte, la Agencia Central de Inteligencia (CIA) utiliza un software específico para despejar y dar sentido a los datos que les llegan desde las agencias de espionaje de todo el mundo. Este software es así capaz de procesar información de los estadounidenses hasta niveles insospechados, información sobre su vida cotidiana, qué compran, hacia dónde viajan, qué estudian sus hijos, etc.

Finalmente, quizás el caso más conocido de aplicación de minería de datos es el referido a las ventas de un producto. Hace algunos años un famoso supermercado estadounidense se preguntó algo tan básico como qué productos se vendían con mayor frecuencia, y si había relaciones en las ventas de unos y otros artículos. Para responder a esta cuestión escarbaron en la base de datos y descubrieron un dato curioso: junto a los pañales se vendían con mucha frecuencia las cervezas. Analizando un poco más a fondo esos datos, se dieron cuenta que ambos productos se vendían principalmente los viernes por la tarde y eran comprados por hombres en edades comprendidas entre los 25 y 35 años de edad. Después de un tiempo pudieron saber la causa: parece que los paquetes de pañales, al ser muy voluminosos, se dejaban para que los comprasen los maridos estadounidenses, que aprovechaban el hecho de salir del trabajo los viernes para hacer también la compra de cervezas para el fin de semana. ¿Qué hizo el supermercado como consecuencia de esto? Pues situó en sus estantes las cervezas al lado de los pañales. El resultado fue todo un éxito, ya que los padres que llegaban compraban incluso más cerveza que antes, y los que no compraban anteriormente empezaron a hacerlo. Así se perfeccionó el Product Placement (posicionamiento de productos) que hoy en día es básico en cualquier superficie comercial. H

* Maestra de Inglés y alumna del Master de Inglés para la Cualificación Profesional (UCO)