Nuevo Modelo Predictivo Acelera el Diseño de Fármacos y Reduce el Uso de Solventes Peligrosos
Un equipo de ingenieros químicos del MIT ha desarrollado un modelo computacional basado en aprendizaje automático capaz de predecir la solubilidad de moléculas en solventes orgánicos. Esta innovación promete optimizar la síntesis de fármacos y otras moléculas útiles, minimizando al mismo tiempo el uso de solventes peligrosos para el medio ambiente.
El Reto de la Solubilidad en la Química
La solubilidad, la capacidad de una sustancia (soluto) para disolverse en otra (solvente), es un factor crítico en la química. Predecir la solubilidad es fundamental en el desarrollo de nuevos fármacos y productos químicos. El modelo permite a los químicos elegir el solvente adecuado para cada reacción, optimizando el proceso de síntesis.
Lucas Attia, estudiante graduado del MIT y coautor del estudio, subraya que la predicción de la solubilidad es un cuello de botella en la planificación sintética y la fabricación de productos químicos, especialmente fármacos.
Un Modelo para Solventes Más Seguros
El modelo desarrollado por el MIT está disponible de forma gratuita y ya está siendo utilizado por empresas y laboratorios. Una de sus ventajas más destacadas es la capacidad de identificar solventes menos dañinos que los utilizados comúnmente en la industria.
Jackson Burns, también estudiante graduado del MIT y coautor del artículo, explica que algunos solventes son altamente efectivos para disolver sustancias, pero perjudiciales para el medio ambiente y la salud humana. El modelo ayuda a identificar alternativas menos nocivas, contribuyendo a prácticas más sostenibles.
Superando las Limitaciones de los Modelos Tradicionales
Históricamente, los químicos han utilizado el Modelo de Solvatación de Abraham para predecir la solubilidad, sumando las contribuciones de las estructuras químicas dentro de la molécula. Si bien útil, este método tiene limitaciones en su precisión.
En los últimos años, se ha explorado el aprendizaje automático para obtener predicciones más precisas. El equipo del MIT partió de un modelo previo desarrollado en 2022 en el laboratorio de William Green, conocido como SolProp. Sin embargo, SolProp presentaba dificultades para predecir la solubilidad de solutos desconocidos.
Imaginemos que SolProp fuera un chef que solo sabe cocinar con ingredientes que ya conoce. Si le presentas un ingrediente nuevo, tendrá problemas para crear una receta. El nuevo modelo busca superar esta limitación.
Aprendizaje Automático con Datos Masivos
Un factor clave para el desarrollo del nuevo modelo fue la disponibilidad de BigSolDB, una base de datos que compila información de casi 800 artículos científicos, incluyendo datos de solubilidad de aproximadamente 800 moléculas disueltas en más de 100 solventes orgánicos comunes.
El equipo entrenó dos tipos de modelos con esta información. Ambos modelos representan las estructuras químicas de las moléculas utilizando representaciones numéricas llamadas "embeddings", que incorporan información sobre la cantidad de átomos en una molécula y cómo están enlazados.
Uno de los modelos, FastProp, utiliza "embeddings estáticos", es decir, ya conoce la representación de cada molécula antes de comenzar el análisis. El otro modelo, ChemProp, aprende una representación para cada molécula durante el entrenamiento, asociando características con la solubilidad.
Resultados Sorprendentes y el Futuro del Modelo
Tras entrenar los modelos con más de 40,000 puntos de datos y probarlos con 1,000 solutos no incluidos en el entrenamiento, se descubrió que las predicciones eran de dos a tres veces más precisas que las de SolProp.
Sorprendentemente, FastProp y ChemProp mostraron un rendimiento similar. Esto sugiere que la principal limitación para mejorar la precisión de las predicciones es la calidad de los datos de entrenamiento.
Burns compara este hallazgo con la afinación de un instrumento musical. "Es como si intentáramos afinar una guitarra con un afinador muy preciso, pero las cuerdas de la guitarra estuvieran desafinadas. Por mucho que afinemos, no podremos obtener un sonido perfecto hasta que cambiemos las cuerdas".
El modelo FastSolv, basado en FastProp, se ha puesto a disposición del público debido a su velocidad y facilidad de adaptación. Ya se está utilizando en varias compañías farmacéuticas.
Implicaciones para la Industria y la Investigación
Este avance tiene un impacto significativo en la industria farmacéutica y la investigación química. La capacidad de predecir con mayor precisión la solubilidad de las moléculas permite:
- Acelerar el descubrimiento y desarrollo de nuevos fármacos.
- Optimizar los procesos de síntesis química.
- Reducir el uso de solventes peligrosos y promover prácticas más sostenibles.
- Explorar nuevas aplicaciones fuera del ámbito farmacéutico.
En resumen, el nuevo modelo predictivo del MIT representa un avance significativo en la química computacional, con el potencial de transformar la forma en que se diseñan y fabrican fármacos y otros productos químicos.
Referencias
- A new model predicts how molecules will dissolve in different solvents. https://news.mit.edu/2025/new-model-predicts-how-molecules-will-dissolve-in-different-solvents-0819