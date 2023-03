Doctorada en Matemáticas por la Universidad de Sevilla, la cordobesa Cristina Molero, natural de Posadas, ha resultado ganadora del Distinguished Dissertation Award por su tesis doctoral: Enhancing Classification and Regression Tree-Based Models by Means of Mathematical Optimization. Un trabajo sobre optimización matemática a partir de los árboles de regresión. Actualmente, es investigadora postdoctoral en la École Polytechnique de Francia, donde aporta sus conocimientos al desarrollo de modelos predictivos con Inteligencia Artificial para solucionar problemas de la vida real.

¿A qué te estás dedicando ahora mismo en la École Polytechnique?

Estoy con un contrato postdoctoral en Palaiseau. Estoy en un grupo del laboratorio de Informática. Hay gente de todas las disciplinas: matemáticos, ingenieros, informáticos. Para lo que me han contratado aquí es para intentar usar técnicas de Inteligencia Artificial para resolver más rápidamente problemas del mundo real.

Lejos de las extragavancias de ChatGPT, puede verse que la IAha llegado también para ayudar en muchas labores, ¿no?

Exactamente. Imagínate que tienes un problema y que ya lo has resuelto. Esa información no la vamos a perder, la vamos a guardar. Es como intentar usar soluciones que ya tienes o intentar aprender cómo se ha llegado hasta esas soluciones para que, después, en el momento en que quieras resolver ese problema, se resuelva de manera más fácil. Esta gente trabajo mucho con una empresa de electricidad e intentan optimizar la producción de energía de las plantas hidráulicas. Estos problemas lo guay sería poder resolverlos a larga escala. Cuanta más información, mejor. La idea de integrar la Inteligencia Artificial en este tipo de problemas es acelerar la toma de decisión.

¿Agilizar?

La idea básica es que queremos resolver problemas de la vida real o problemas industriales a larga escala eficientemente. Y, para ello, lo que intentamos es introducir el aprendizaje automático, que es una parte de la Inteligencia Artificial, para aliviar un poco esta barrera computacional de estos problemas y que puedan ser resueltos en un tiempo razonable. Hay problemas reales, son muy difíciles de resolver porque son muy grandes, vamos a intentar utilizar la Inteligencia Artificial y, en particular, el aprendizaje automático para aliviar estos tiempos de cómputo.

¿En qué consiste ese aprendizaje automático?

El aprendizaje automático es una rama de la inteligencia artificial que tiene como objetivo aprender de la experiencia, es decir, tener una serie de datos históricos y extraer información que sea relevante para poder hacer futuras predicciones. Por ejemplo, imagínate que tu banco está usando un algoritmo para predecir si te concede o no un préstamo. El banco va a tener información de antiguos clientes que han solicitado un préstamos. Entonces, sabe su edad, su nivel de ingresos, el préstamo que ha solicitado, el tipo de interés en ese momento… pero lo más importante es que sabe si finalmente esos antiguos solicitantes han sido buenos pagadores o no. Si de acuerdo a las características que tenían, pagaron o no. La idea es intentar buscar un patrón de esos datos que relacione ser buen o mal pagador en función de estas características.

Va más allá de una simple base de datos.

Exactamente. De tus datos, tienes que extraer información que sea útil. Yo estuve trabajando en una empresa, sobre el cáncer de cólon. Querían intentar clasificar a la gente que tenía cáncer y a la gente que no tenía en función de unas características biológicas. Partían de una base de datos de antiguos pacientes y tenían sus características biológicas. De ahí, se intentaba sacar un patrón y la idea era que, en el futuro, cuando viniera un nuevo paciente, pudiera saber si iba a ser cáncer o no. Todo lo que estoy contando es clasificación, que, de hecho, es el nombre de la sociedad que me ha dado el premio.

¿Cuáles son las claves de su tesis premiada?

Mi tesis básicamente es sobre una técnica de aprendizaje supervisado, que son los árboles de clasificación y de regresión. Digamos que estoy entre el aprendizaje automático y la optimización matemática. La estructura que tiene es como un árbol dado la vuelta, tienes la raíz y empiezan a salir ramas hacia abajo. La guay de esta técnica es que es muy interpretable, se lo das a una persona que no tiene ni idea y va a saber interpretarlo, porque las decisiones son de esta manera. Imagínate que estamos hablando del ejemplo de conceder un préstamo. Imagina que tienes la edad de los solicitantes y el nivel de ingresos. Mi árbol va a ser: si la edad es igual o menor de 30, no le damos el préstamo; si la edad es mayor, no sé lo que voy a hacer todavía. Entonces, sigo ramificando. Este árbol está basado en reglas sencillas. Es un modelo de aprendizaje supervisado de los más interpretables que existe. La idea es que tienes un árbol y tienes reglas en cada uno de los nodos que te van redirigiendo a tu decisión.

¿Y esto se automatiza con IA?

Claro, digamos que tú fijas que esa va a ser tu estructura. Y, entonces, buscas las reglas que tienes que poner, de manera que optimices o selecciones, que consigas la mejor predicción posible dentro de la muestra que tengas. Como con los datos que tienes, tú sí que sabes el resultado final, puedes intentar obligar a tu árbol a que aprenda tan bien que sea capaz de predecir muy bien. Esta técnica existía desde 1984. Lo que pasa es que antes se hacía lo que se podía y, entonces, se conseguían árboles que no eran muy óptimos. Pero, ahora, el avance de toda la tecnología y, en particular, de la optimización matemática, que es el otro campo que yo estudio, ha hecho que ahora podamos volver a ese problema de construir un árbol pero de manera que los resultados sean mucho más precisos.

"Las cosas que había aprendido las estaba usando para resolver problemas reales"

La clave entonces es buscarle esa mejora.

Al final, es mejorar una técnica de aprendizaje supervisado que ya existía. Varios cosas que incluimos en nuestra metodología es que, por un lado, intentamos usar las menos variables posibles. Que me dé una buena predicción, pero no tenga que preguntarle al que venga al banco, por ejemplo, todos los detalles. Es intentar predecir lo mismo con menos información, básicamente. Otra cosa que está en auge es el tema de la justicia. El aprendizaje automático está usando datos del pasado. Entonces, si en el pasado hemos sido una sociedad machista, clasista, racista... eso al final va a estar en los datos. Puede ser que tu técnica esté sesgada. Uno podría pensar, elimino esa variable. No, eso no se puede hacer. Hay que considerarla e imponer que tu modelo, cuando se encuentre esa variable, sea capaz de predecir exactamente lo mismo.

¿Cuándo tomas la decisión de profundizar en este campo?

Donde más se ve es en el máster de Matemáticas. En el trabajo de fin de máster empecé a introducirme en el aprendizaje automático y salió, justamente cuando acabe, la posibilidad de trabajar en esta empresa sobre el cáncer de colon, que estaba asociada a la universidad, y empecé a ver un poco lo que era la investigación matemática y que las cosas que había estado aprendiendo todos esos años las estaba usando para resolver problemas reales. Vi realmente la utilidad directa.Ya me entusiasmé, empecé el doctorado y para adelante. [...] Durante el confinamiento estuvimos prediciendo el número de hospitalizados, de camas uci que se iban a necesitar en Andalucía. Es un proyecto que salió en toda España del Comité Español de Matemáticos.

¿Cómo recibes este premio?

Estoy muy contenta. Yo lo veo un reconocimiento a toda mi trayectoria. Durante estos años me he esforzado bastante para que saliera todo adelante y ver ahora que te estás viendo reconocida pues está guay. Y, basicamente, es un impulso para seguir adelante.

Encontraste una oportunidad en Francia, ¿se apuesta en España por talentos como el tuyo?

Ahora parece que está mejorando un poquito, pero ha habido un tiempo en el que no ha habido muchas oportunidades para nosotros. Entonces, la idea era que mientras más méritos tengas pues mejor. Y fuera de España hay muchas más oportunidades. La gente tiende a irse con la idea de que pueda volver y competir teniendo unos mejores méritos. Es complicado entrar en el sistema y sí que valoran mucho que hayas tenido una experiencia internacional. Pero vamos, que no he conocido a ningún español que no diga que se quiere volver después.