joi, 26 mai 2022

Predictia diabetului zaharat


                                                                                                          Flavia Costi

Diabetul zaharat este cea mai des întalnita boala a sistemului endocrin si se declanseaza atunci cand in organism, cantitatea de insulina secretata nu este cea optima sau când celulele periferice nu raspund la actiunea sa (insulina este un hormon care participa la micsorarea concentratiei glucozei din sange). Aceasta afectiune produce tulburari la nivelul intregului metabolism si, în timp, poate afecta functionarea diverselor organe din corp.


Datorita numarului mare de pacienti care sufera de diabet zaharat, predictia acestuia este un aspect important. Din acest motiv, aplicatia: XAI.Pro are ca scop predictia acestei boli. Aplicatia cuprinde un set de date, pe baza caruia se realizeaza analize si predictii.


Setul de date utilizat este: 

care cuprinde 8 caracteristici care determina aparitia diabetului zaharat si o caracteristica care prezinta daca un pacient sufera sau nu de diabet zaharat.


Pe baza acestor caracteristici, s-au facut diferite analize:

  • Analiza impactului fiecarei caracteristici asupra diabetului zaharat:
     
          * Se poate observa faptul ca valoarea glucozei este mult mai compacta si similara pentru pacientii care nu sufera de diabet zaharat, fata de cei diagnosticati cu aceasta boala. Cei care sufera de diabet zaharat au o valoare a glucozei din sange mult mai variata. In schimb, tot din figura putem sa observam din al doilea plot ca varsta celor care sufera de diabet zaharat este mult mai compacta, fata de a celor care nu sufera de aceasta boala.

  • Matricea de corelatie pentru caracteristicile din dataset

           * Din matricea de corelatie putem observa faptul ca numarul de sarcini depinde de varsta pacientelor, dar si ca insulina depinde de glucoza din sange. Aceste caracteristici sunt in stransa legatura. 

  • Matrice a valorilor caracteristicilor din setul de date, in functie de caracteristica: pacientul sufera sau nu de diabet zaharat
          * punctele de dispersie prezinta cat de compacte sunt valorile caracteristicilor si se poate observa ca exista cateva valori care nu sunt cuprinse in norul multimii de valori comune.


Finalizand cu analiza datelor, indreptandu-ne spre partea de predictie putem observa ca pentru realizarea acestora s-au utiliat 2 algoritmi importanti: PDP si SHAP. Astfel vom continua sa analizam predictiile realizate:

  • PDP
        * Am ales ca 50% din valorile din setul de date sa fie antrenate si am obtinut urmatoarea predictie pentru caracteristica glucoza:


          * Se poate observa faptul ca valorile glucozei se afla intr-o crestere ascendenta.

  • Predictia impactului a doua caracteristici
      * Pentru a ilustra impactul a doua caracteristici am ales sa prezint impactul caracteristicilor: Glucoza si Insulina, stiind de mai sus ca se afla in stransa legatura.
 
             * Din plot se poate observa ca predictia impactului celor doua caracteristici este una care demonstreaza ca exista multe valori care se intersecteaza.

  • Predictia diabetului zaharat folosid valorile SHAP
        




        * Putem sa observam faptul ca toate caracteristicile au un impact major asupra diagnosticului diabet zahart, dar totodata se identifica faptul ca BMI-ul este o caracteristica care ar putea sa lipseasca, acest lucru este datorat faptului ca acesta se obtine din valoarea masei corporale si a inaltimii. Persoanele au o valoare a BMI-ului destul de asemanatoare, astfel aceasta nu poate sa ajute foarte mult in predictia diabetului zaharat.


Astfel, concluzionand aceasta parte, observam ca diabetul zaharat este influentat de cele 8 caracteristici descrise mai sus si ca un pacient ar trebui sa tina cont de valorile acestora, in momentul diagnosticarii cu diabet zaharat.

Totodata exista o parte de predictie a diabetului zaharat in functie de anumite caracteristici, pe care pacientul, individual, le poate completa si poate identifica daca sufera sau nu de diabet zaharat.





         * Pentru predictia dorita, am primit rezultat negativ, ceea ce inseamna ca obezitatea si problemele cu vazul nu au determinat aparitia diabetului zaharat. Se poate observa faptul ca valoarea acuratetii si a predictiei este una mare, ceea ce inseamna ca predictia este una reusita. Pentru predictie s-au utilizat 5 modele de antrenare a setului de date: 
  1. Random Forest
  2. SVC
  3. Logistic Regression
  4. Naive Bayes
  5. K-Neighbors

In concluzie, predictia diabetului zaharat, care este o boala care impacteaza tot mai multe persoane, este una foarte eficienta si de dorit, pentru ca pacientul sa stie din timp daca sufera sau nu de aceasta boala. Caracteristicile evidentiate mai sus au un impact major asura aparitiei diabetului zaharat.



Bibliografie:

Site-ul: XAI.Pro, si resursele biografice din aplicatie

Niciun comentariu:

Trimiteți un comentariu

Bioinformatica și genetica criminalistică

                                                                                                                                      Zoltan...