joi, 19 mai 2022

Medicina de Precizie și Învățarea Automată (Machine Learning)

Conceptul de ”medicină personalizată” face referire la o abordare  precisă, prescriptivă și preventivă a serviciilor de asistență medicală.  Medicina personalizată are potențialul de a îmbunătăți practica tradițională a medicinei, ajutând la implementarea unui diagnostic precoce și a unui tratament specific și personalizat. Accesul la terapiile genice, prezicerea susceptibilității individuale de boală, diagnostic și tratament al bolilor mentale, terapia medicamentoasă adecvată, țintirea precisă a mecanismelor moleculare oncogenetice reprezintă doar câteva din promisiunile medicinei de precizie. 1

Combustibilul principal al medicinei de precizie este reprezentat de către datele medicale. În ultima perioadă, disponibilitatea crescută a tehnologiilor de genetică și biologie moelculară, a generat un număr tot mai mare de date, acestea provenind din domenii precum genomica, transciptomica, epigenomica, proteomica si metabolomica. În această eră a multi-omicii, metodele de machine learning(ML) și inteligență artificială(AI) au intrat în lumina reflectoarelor, ajutând la obținerea unor noi perspective a acestor date și a unor aplicații medicale revoluționare; au început să se dezvolte strategii de intregare a datelor multi-omicii, punându-se accent în special pe aplicațiile ML.2

În ultimii ani a avut loc o creștere marcată a publicațiilor bazate pe analize de ML, astfel că este nevoie de dezvoltarea unor standarde pentru raportarea acestora, care să permită o evaluare critică și să ajute la realizarea unor algoritmi ce duc la rezultate și predicții corecte. În acest scop, în iulie 2021 a fost publicat un articol care sumarizează recomandările propuse de către ELIXIR Machine Learning Focus Group. Aceste recomandări acoperă patru aspecte majore cuprinse în acronimul DOME (Data, Optimizare, Model, Evaluare). 3

În ceea ce privește setul de date, una dintre recomandări face referire la divizarea acestuia întru-un set de antrenare și un set de testare, utilizând tehnici de bootstrapping sau cross-validation. Cu toate acestea, în biologie deseori apar dificultăți  de suprapunere a seturilor de antrenare/testare, astfel că fiecare ramură a biologiei are propriile recomandări pentru gestionarea acestora. De asemenea, o altă recomandare face referire la raportarea statisticilor privind dimensiunea setului de date, precum și distribuția datelor. Nu în ultimul rând, un aspect important îl reprezintă accesibilitatea datelor. Optimizarea sau antrenarea face referire la procesul de schimbare a valorilor modelului, într-un mod care maximizează capacitatea acestuia de a rezolva o anumită problemă; o optimizare incorectă va duce la un model sub- sau supranatrenat. 3

Într-o altă ordine de idei, evaluarea modelelor de ML se poate realiza fie prin validare experimentală, fie evaluând performanța modelului utilizând anumiți metrici/măsuri de performanță. Întrucât disponibilitatea măsurilor de performanță a modelelor de ML este foarte mare, s-au format anumite comunități de evaluare critică-de exemplu, CAFA-Critical Assessment of Protein Function Annotation sau CAGI- Critical Assessment of Genome Interpretation. După stabilirea măsurilor de performanță, trebuie să se facă o comparare a modelelor din același domeniu, utilizând teste statistice și intervale de încredere.3

            În concluzie, abordarea științifică actuală presupune analiza genomului individual pentru a asigura o asistență medicală preventivă și precisă. Cu scopul de a implementa medicina de precizie, tehnicile de inteligență artificială și învățare automată au un mare potențial de a realiza acest lucru, ajutând la înțelegerea corelațiilor genotip-fenotip, prezicerea susceptibilității individuale de boală, prezicerea răspunsului la diverse terapii, integrarea datelor multi-omicii, s.a. Însă, pentru a crește calitatea, reproductibilitatea și performanța modelelor de învățare automată este necesară stabilirea și respectarea unor ghiduri standardizate, recomandările DOME fiind un prim pas în realizarea acestui obiectiv. 

BIBLIOGARFIE 

1.      Chandra Thapa, Seyit Camtepe. Precision health data: Requirements, challenges and existing techniques for data security and privacy. Computers in Biology and Medicine,Volume 129, 2021, 104130,ISSN 0010-4825. doi.org/10.1016/j.compbiomed.2020.104130

2.      Picard M, Scott-Boyer MP, Bodein A, Périn O, Droit A. Integration strategies of multi-omics data for machine learning analysis. Comput Struct Biotechnol J. 2021 Jun 22;19:3735-3746. doi: 10.1016/j.csbj.2021.06.030

3.      Walsh I, Fishman D, Garcia-Gasulla D, Titma T, Pollastri G; ELIXIR Machine Learning Focus Group, Harrow J, Psomopoulos FE, Tosatto SCE. DOME: recommendations for supervised machine learning validation in biology. Nat Methods. 2021 Oct;18(10):1122-1127. doi: 10.1038/s41592-021-01205-4.






Niciun comentariu:

Trimiteți un comentariu

Bioinformatica și genetica criminalistică

                                                                                                                                      Zoltan...