Conceptul de ”medicină personalizată” face referire la o
abordare precisă, prescriptivă și preventivă
a serviciilor de asistență medicală. Medicina personalizată are potențialul
de a îmbunătăți practica tradițională a medicinei, ajutând la implementarea
unui diagnostic precoce și a unui tratament specific și personalizat. Accesul la
terapiile genice, prezicerea susceptibilității individuale de boală, diagnostic
și tratament al bolilor mentale, terapia medicamentoasă adecvată, țintirea
precisă a mecanismelor moleculare oncogenetice reprezintă doar câteva din promisiunile
medicinei de precizie. 1
Combustibilul principal al medicinei de precizie este
reprezentat de către datele medicale. În ultima perioadă, disponibilitatea crescută
a tehnologiilor de genetică și biologie moelculară, a generat un număr tot mai
mare de date, acestea provenind din domenii precum genomica, transciptomica, epigenomica,
proteomica si metabolomica. În această eră a multi-omicii, metodele de machine
learning(ML) și inteligență artificială(AI) au intrat în lumina reflectoarelor,
ajutând la obținerea unor noi perspective a acestor date și a unor aplicații medicale
revoluționare; au început să se dezvolte strategii de intregare a datelor
multi-omicii, punându-se accent în special pe aplicațiile ML.2
În ultimii ani a avut loc o creștere marcată a publicațiilor
bazate pe analize de ML, astfel că este nevoie de dezvoltarea unor standarde pentru
raportarea acestora, care să permită o evaluare critică și să ajute la
realizarea unor algoritmi ce duc la rezultate și predicții corecte. În acest
scop, în iulie 2021 a fost publicat un articol care sumarizează recomandările
propuse de către ELIXIR Machine Learning Focus Group. Aceste recomandări acoperă
patru aspecte majore cuprinse în acronimul DOME (Data, Optimizare, Model,
Evaluare). 3
În ceea ce privește setul de date, una dintre recomandări
face referire la divizarea acestuia întru-un set de antrenare și un set de
testare, utilizând tehnici de bootstrapping sau cross-validation. Cu toate
acestea, în biologie deseori apar dificultăți de suprapunere a seturilor de antrenare/testare,
astfel că fiecare ramură a biologiei are propriile recomandări pentru
gestionarea acestora. De asemenea, o altă recomandare face referire la
raportarea statisticilor privind dimensiunea setului de date, precum și
distribuția datelor. Nu în ultimul rând, un aspect important îl reprezintă
accesibilitatea datelor. Optimizarea sau antrenarea face referire la
procesul de schimbare a valorilor modelului, într-un mod care maximizează
capacitatea acestuia de a rezolva o anumită problemă; o optimizare incorectă va
duce la un model sub- sau supranatrenat. 3
Într-o altă ordine de idei, evaluarea modelelor de ML se
poate realiza fie prin validare experimentală, fie evaluând performanța
modelului utilizând anumiți metrici/măsuri de performanță. Întrucât disponibilitatea
măsurilor de performanță a modelelor de ML este foarte mare, s-au format anumite
comunități de evaluare critică-de exemplu, CAFA-Critical Assessment of Protein
Function Annotation sau CAGI- Critical Assessment of Genome Interpretation.
După stabilirea măsurilor de performanță, trebuie să se facă o comparare a
modelelor din același domeniu, utilizând teste statistice și intervale de încredere.3
În concluzie, abordarea științifică actuală presupune analiza genomului individual pentru a asigura o asistență medicală preventivă și precisă. Cu scopul de a implementa medicina de precizie, tehnicile de inteligență artificială și învățare automată au un mare potențial de a realiza acest lucru, ajutând la înțelegerea corelațiilor genotip-fenotip, prezicerea susceptibilității individuale de boală, prezicerea răspunsului la diverse terapii, integrarea datelor multi-omicii, s.a. Însă, pentru a crește calitatea, reproductibilitatea și performanța modelelor de învățare automată este necesară stabilirea și respectarea unor ghiduri standardizate, recomandările DOME fiind un prim pas în realizarea acestui obiectiv.
BIBLIOGARFIE
1.
Chandra
Thapa, Seyit Camtepe. Precision health data: Requirements, challenges and
existing techniques for data security and privacy. Computers in Biology and
Medicine,Volume 129, 2021, 104130,ISSN 0010-4825. doi.org/10.1016/j.compbiomed.2020.104130
2.
Picard
M, Scott-Boyer MP, Bodein A, Périn O, Droit A. Integration strategies of
multi-omics data for machine learning analysis. Comput Struct Biotechnol J.
2021 Jun 22;19:3735-3746. doi: 10.1016/j.csbj.2021.06.030
3.
Walsh
I, Fishman D, Garcia-Gasulla D, Titma T, Pollastri G; ELIXIR Machine Learning
Focus Group, Harrow J, Psomopoulos FE, Tosatto SCE. DOME: recommendations for
supervised machine learning validation in biology. Nat Methods. 2021
Oct;18(10):1122-1127. doi: 10.1038/s41592-021-01205-4.
Niciun comentariu:
Trimiteți un comentariu