Computación de altas prestaciones para la resolución de problemas de optimización en bioinformática

2020 
El descubrimiento de farmacos es un proceso que consume mucho tiempo y recursos. Ademas, se convierte de especial interes cuando aparecen enfermedades nuevas con una alta letalidad, como ha ocurrido recientemente con el COVID-19. En esta tesis, se proponen un conjunto de nuevas herramientas y metodologias para reducir estos costes. Estas se han aplicado al cribado virtual, una de las etapas iniciales en el proceso de descubrimiento donde la cantidad de compuestos moleculares a analizar es enorme. Y es que, el cribado virtual consiste precisamente en obtener un subconjunto de moleculas con una alta probabilidad de actuacion contra una enfermedad, de entre todas las que se encuentran en una base de datos, que pueden llegar a ser millones. Ese subconjunto sera el que se analice en el laboratorio en fases posteriores del desarrollo. Las aportaciones de esta tesis se han centrado en el cribado virtual basado en ligandos donde se buscan aquellos compuestos con el mayor valor de similitud de forma y potencial electrostatico utilizando enfoques mono y multiobjetivo. La reduccion del espacio de busqueda mediante procedimientos dinamicos, la combinacion de algoritmos de optimizacion global con metodos de busqueda local y la ejecucion paralela son algunas de las tecnicas utilizadas para optimizar de forma eficaz y eficiente los problemas abordados. El conjunto de estas tecnicas ha permitido analizar bases de datos que contienen hasta millones de compuestos y ofrecer nuevas y diferentes predicciones respecto a las de la literatura. Asi pues, se han encontrado nuevos compuestos quimicos que de otra forma seguirian esperando ser encontrados. La primera contribucion de esta tesis ha sido el desarrollo de un nuevo algoritmo memetico evolutivo, denominado OptiPharm. Este se ha disenado para poder explorar todo el espacio de busqueda pero a su vez centrarse en las zonas mas prometedoras. Ademas, es independiente de la funcion objetivo siempre que esta este relacionada con la posicion 3D de los compuestos. Asimismo, dada la gran cantidad de compuestos diferentes, OptiPharm se puede configurar dependiendo del problema y las necesidades de este. En consecuencia, puede ejecutarse para obtener resultados rapidamente pero reduciendo ligeramente la calidad de las soluciones o, por el contrario, aplicar una configuracion mas robusta donde siempre encuentre el mejor resultado a expensas de necesitar mas tiempo de ejecucion. Igualmente, dados los diferentes tamanos de los compuestos, OptiPharm se adapta dinamicamente a cada pareja a evaluar de estos. Este algoritmo se ha aplicado a dos problemas: la optimizacion de la similitud de forma y la del potencial electrostatico. Para el primero, se ha comparado con WEGA, el software referente en la bibliografia, evaluando diferentes bases de datos conocidas como son la FDA, DUD, DUD-E y Maybridge. Los resultados han mostrado la capacidad de OptiPharm para encontrar soluciones de calidad similar a WEGA en menor tiempo o por el contrario, soluciones mucho mejores con un coste mayor de tiempo. Estas comparaciones se han hecho en igualdad de condiciones y para ello, no se han considerado los hidrogenos en OptiPharm pues WEGA, como el resto de los algoritmos de la bibliografia, los elimina. No obstante, hemos demostrado mediante un estudio realizado unicamente con nuestro algoritmo, que los hidrogenos influyen de manera importante en la similitud de forma y, por tanto, deben de ser considerados. El segundo problema que se ha abordado con OptiPharm es la similitud del potencial electrostatico. En este caso, se ha realizado una comparacion entre la actual metodologia de la literatura y una nueva que proponemos en esta tesis. La diferencia entre ambas reside en que si bien la metodologia de la literatura optimiza primero los compuestos en similitud de forma para despues evaluar un subconjunto de ellos en base al potencial electrostatico seleccionando el de mayor valor de esta ultima propiedad, nosotros proponemos una directa optimizacion del potencial electrostatico. Los resultados de los experimentos realizados sobre la base de datos FDA han reforzado nuestra hipotesis. Pero no solo eso, otro inconveniente de la metodologia tradicional es que al seleccionar solo un subconjunto, muchos compuestos prometedores no son evaluados electrostaticamente y por tanto se descartan. Un estudio realizado sobre el porcentaje de compuestos que debe ser evaluado ha demostrado que considerar todos los compuestos aumenta las posibilidades de encontrar compuestos mas similares electrostaticamente. Finalmente, hemos abordado tambien el problema del cribado virtual desde una perspectiva multiobjetivo. Para ello, hemos considerado la optimizacion simultanea de la similitud de forma y de potencial electrostatico. Para evaluar la calidad de esta nueva propuesta se comparo esta con las soluciones monoobjetivo anteriores utilizando la base de datos DrugBank. Los resultados obtenidos han demostrado que mediante esta nueva propuesta, se puede obtener compuestos que de otra forma serian ignorados al solo considerarse una de las dos propiedades.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []