How To Implement A Federated Learning Project With Healthcare Data

Ponovno objavil Platon

Spremljevalci: 0

Kako uvesti projekt zveznega učenja s podatki o zdravstvenem varstvu
Foto: Natalija Vaitkevič

Federated Learning (FL) je pristop strojnega učenja, ki omogoča usposabljanje modela v več decentraliziranih napravah ali institucijah, ne da bi bilo treba podatke centralizirati na enem strežniku. Uporablja se v več panogah, od tipkovnic mobilnih naprav do avtonomnih vozil do naftnih ploščadi. Še posebej je uporaben v zdravstveni industriji, kjer gre za občutljive podatke bolnikov in je treba upoštevati stroge predpise za zaščito zasebnosti posameznikov. V tej objavi v spletnem dnevniku bomo razpravljali o nekaterih praktičnih korakih za izvajanje projekta združenega učenja s podatki o zdravstvenem varstvu.

Najprej je pomembno razumeti zahteve in omejitve vašega projekta. To vključuje razumevanje vrste podatkov, s katerimi boste delali, in predpisov, ki jih je treba upoštevati za zaščito zasebnosti posameznikov. Morda boste morali pridobiti tudi potrebne odobritve in dovoljenja za uporabo podatkov za vaš projekt, npr. odobritve Institucionalnega odbora za pregled (IRB).

Nato boste morali pripraviti svoje podatke. To vključuje pridobivanje podatkov iz različnih kliničnih sistemov, usklajevanje podatkov na različnih lokacijah (saj so lahko podatki različno kodirani, imajo različne formate in drugačno porazdelitev na vsaki lokaciji), označevanje podatkov (kar včasih zahteva, da zdravnik pregleda podatke in komentirati) in razdelitev podatkov na particije za usposabljanje, testiranje in validacijo. Za zagotovitev natančnih rezultatov je pomembno zagotoviti, da so podatki ustrezno uravnoteženi in reprezentativni za celotno populacijo.

Ko so vaši podatki pripravljeni, boste morali izbrati ogrodje zveznega učenja, ki ga boste uporabljali. Na voljo je več možnosti, med drugim NVIDIA FLARE, TensorFlow Federated, PySyft, OpenFLin Flower. Vsako od teh ogrodij ima svoj nabor funkcij in zmožnosti, zato je pomembno, da izberete tisto, ki najbolje ustreza potrebam vašega projekta. Ugotovili smo, da NVIDIA FLARE zagotavlja robusten okvir, ki lahko deluje s katerim koli osnovnim okvirom ML (PyTorch, TensorFlow, sklearn itd.).

Nato boste morali vzpostaviti infrastrukturo za svoj projekt zveznega učenja. To vključuje izbiro strežnika v oblaku, na katerem boste gostili končni model in orkestrirali proces FL, ter nastavitev strežnikov na vsakem sodelujočem mestu, namestitev zahtevane programske opreme, omogočanje dostopa vašega lokalnega nabora podatkov temu strežniku in zagotavljanje, da lahko strežnik komunicira z vaš strežnik v oblaku. Odvisno od ogrodja FL, ki ste ga izbrali, boste morda morali vzpostaviti tudi varen komunikacijski kanal med lokalnimi strežniki na vsakem mestu in vašim strežnikom v oblaku, da zagotovite zasebnost in varnost podatkov.

Ko je infrastruktura postavljena, lahko začnete s procesom usposabljanja. To vključuje zagotavljanje arhitekture vašega modela strežniku v oblaku, ki bo orkestriral usposabljanje FL – pošiljanje modela sodelujočim napravam ali institucijam, kjer bodo lokalni podatki uporabljeni za usposabljanje lokalnega modela. Lokalni modeli se nato pošljejo nazaj na strežnik, kjer se združijo in uporabijo za posodobitev globalnega modela. Ta postopek se ponavlja, dokler globalni model ne konvergira na sprejemljivo raven natančnosti.

Nazadnje je pomembno oceniti delovanje modela in zagotoviti, da izpolnjuje zahteve vašega projekta. To vključuje testiranje modela na ločenem nizu podatkov ali njegovo uporabo za napovedovanje podatkov iz resničnega sveta. V mnogih primerih to vključuje tudi ponavljanje arhitekture modela, osnovnih podatkovnih nizov in/ali predprocesiranje, da se optimizira zmogljivost modela.

Ti koraki se morda zdijo zapleteni, a na srečo obstajajo podobne platforme FL Nosorogovo zdravje zaradi česar je celoten postopek preprost in brezhiben. Robustne platforme FL od konca do konca bodo poskrbele za zagotavljanje infrastrukture, zagotavljale močne varnostne zmogljivosti in podpirale vse korake zveznega projekta od predhodne obdelave podatkov prek usposabljanja modelov in analize rezultatov, z največjo prilagodljivostjo – omogočala podatkovnim znanstvenikom, da uporabljajo svoje orodja za analizo/obdelavo podatkov in okviri ML/FL po izbiri. Zaradi njih so zvezni projekti veliko bolj podobni projektom, ki uporabljajo centralizirane podatke.

Prihodnost inovacij v zdravstvu je odvisna od možnosti dostopa do velikih količin podatkov za analizo in usposabljanje modelov. Zvezno učenje je močno orodje za dostop do podatkov brez tveganja za zasebnost podatkov, zaradi česar je obetaven način za izboljšanje oskrbe pacientov in napredek na področju zdravstvene oskrbe. Če sledite tem korakom in upoštevate potrebne previdnostne ukrepe za zaščito zasebnosti bolnikov, lahko uspešno izvedete projekt združenega učenja in pozitivno vplivate na zdravstveno industrijo.

Yuval Baror je tehnični direktor in soustanovitelj Rhino Health. Ima skoraj 20 let izkušenj s programskim inženiringom, upravljanjem in startupi (vključno z ustanovitvijo startupa, ki je bil uspešno pridobljen). V zadnjem desetletju je delal na gradnji proizvodnih sistemov, ki temeljijo na AI, v treh različnih podjetjih. Uživam v globokih izzivih umetne inteligence, navdušenju nad gradnjo proizvodnih sistemov, ki imajo velik vpliv na stranke, in edinstvenem prerezu delovanja umetne inteligence v sistemih resničnega sveta.