Hogyan modernizálta a GE Healthcare adatplatformját egy Lake House Architecture segítségével

Forrás csomópont: 997764

A GE Healthcare (GEHC) leányvállalataként működik General Electric. A cég székhelye az Egyesült Államokban található, és több mint 160 országban szolgálja ki ügyfeleit. A GE Healthcare vezető globális orvosi technológiai, diagnosztikai és digitális megoldások megújítójaként az Edison intelligenciaplatform által támogatott intelligens eszközök, adatelemzés, alkalmazások és szolgáltatások révén lehetővé teszi a klinikusok számára, hogy gyorsabban és megalapozottabban hozzanak döntéseket.

A GE Healthcare régi vállalati elemzési platformja egy nagy adatforgalmazótól származó hagyományos Postgres-alapú, helyszíni adattárházat használt az elemzési munkaterhelések jelentős részének futtatására. Az adattárház kulcsfontosságú a GE Healthcare számára; lehetővé teszi a felhasználók számára az egységek között, hogy adatokat gyűjtsenek, és napi jelentéseket készítsenek és betekintést készítsenek a kulcsfontosságú üzleti funkciók végrehajtásához. Az elmúlt néhány évben a fürthöz hozzáférő csapatok száma csaknem háromszorosára nőtt, és a kezdeti felhasználók számának kétszerese négyszer annyi napi lekérdezést futtatott, mint amire a fürtöt tervezték. Az örökölt adattárház nem volt képes a GE Healthcare üzleti igényeinek kielégítésére méretezhető, és jelentős befektetést igényelne a karbantartáshoz, frissítéshez és biztonsághoz.

Modern adatplatform keresése

Több éves adatbázis-központú munka után az adatok gyors növekedése költség- és karbantartási szempontból életképtelenné tette a GEHC on-prem rendszerét. Ez lehetőséget kínált a GE Healthcare-nek arra, hogy holisztikus pillantást vethessen az adatokkal és elemzésekkel kapcsolatos felmerülő és stratégiai igényekre. Ezt szem előtt tartva a GE Healthcare úgy döntött, hogy az AWS-szolgáltatásokat használó Lake House architektúrát alkalmaz:

  • Felhasználás Amazon egyszerű tárolási szolgáltatás (Amazon S3) nyers vállalati és eseményadatok tárolására
  • Használjon ismerős SQL utasításokat az adatok kombinálásához és feldolgozásához az Amazon S3 és az összes adattárban Amazon RedShift
  • Alkalmazza a „legjobban illeszkedő” koncepciót a megfelelő AWS-technológia használatával, hogy megfeleljen a konkrét üzleti igényeknek

Építészet

A következő diagram a GE Healthcare architektúráját mutatja be.

Az Amazon Redshift kiválasztása a vállalati felhő adattárházhoz

A megfelelő adattár kiválasztása ugyanolyan fontos, mint az elemzéshez szükséges adatgyűjtés módja. Az Amazon Redshift nyújtotta a legjobb értéket, mert könnyen elindítható, hozzáférhetett és tárolható volt az adatok, és igény szerint méretezhető volt üzleti igényeinknek megfelelően. Az alábbiakban felsorolunk néhány további okot, amelyek miatt a GE Healthcare az Amazon Redshiftet a felhő adattárházává tette:

  • A petabájtos méretű adatok Amazon S3-ban való tárolásának és az Amazon S3-ban és az Amazon Redshift-ben lévő adatok lekérdezésének képessége kis előfeldolgozással azért volt fontos, mert a GE Healthcare adatigényei jelentős ütemben bővülnek.
  • Az AWS alapú stratégia pénzügyi rugalmasságot biztosít. A GE Healthcare átállt a fix költség/helyi tárgyi eszköz modellről a fogyasztás alapú modellre. Ezenkívül az AWS-alapú architektúra teljes birtoklási költsége (TCO) alacsonyabb volt, mint a helyettesített megoldásé.
  • Az AWS Analytics ökoszisztémával való natív integráció megkönnyítette a végpontok közötti elemzési munkafolyamatok súrlódásmentes kezelését. A GE Healthcare hibrid megközelítést alkalmazott a feladatok kinyerésére, átalakítására és betöltésére (ETL) a következők kombinációjával AWS ragasztó, Amazon Redshift SQL, valamint a bonyolultságon, méreteken és költségeken alapuló tárolt eljárások.
  • A rugalmas platform megkönnyíti a meghibásodások utáni helyreállítást, mivel a későbbiekben előforduló hibák kevésbé befolyásolják az éles környezetet, mivel minden előzményadat az Amazon S3-on található.
  • A Lake House Architecture gondolata az, hogy az analitika egy méretben történő megközelítése végül kompromisszumokhoz vezet. Ez nem egyszerűen egy adattó és egy adattárház integrálásáról szól, hanem inkább egy adattó, adattárház és célirányosan épített adattárak integrálásáról, valamint az egységes irányításról és az egyszerű adatmozgatásról. (További információ a Lake House építészetéről, lásd Használja ki az adatok erejét az AWS Analytics segítségével.)
  • Az AWS kiterjedt termékképessége és a Amazon Redshift Lake House építészet.

A megvalósítás lépései és a legjobb gyakorlatok

Ennek az útnak a részeként a GE Healthcare együttműködött AWS professzionális szolgáltatások hogy felgyorsítsák lendületüket. Az AWS Professional Services fontos szerepet játszott a Working Backwards (WB) folyamat követésében, amely az Amazon ügyfélközpontú termékfejlesztési folyamata.

Így működött:

  • Az AWS Professional Services végigvezette a GE Healthcare-t és a partnercsapatokat a Lake House architektúrán, megosztva az AWS-szabványokat és a legjobb gyakorlatokat.
  • A csapatok felgyorsították az Amazon Redshift tárolt eljárások migrációját, beleértve az adatstruktúra kiválasztását és a táblázatok tervezését.
  • A csapatok nagy teljesítményű kódot adtak át, hogy lehetővé tegyék az időben történő élesítést.
  • Megvalósítottak egy kötegfájl-kivonat keretrendszert, hogy támogassák a downstream adatfelhasználást egy Data as a Service (DaaS) megoldáson keresztül.

Következtetés

Az Amazon Redshift segítségével Lake House architektúrára való korszerűsítés lehetővé tette a GEHC számára, hogy felgyorsuljon, gyorsabban tudjon újítani, és jobban megoldja az ügyfelek igényeit. A cikk írásakor a GE Healthcare munkaterhelései teljes skálán futnak a termelésben. Leállítottuk a helyszíni infrastruktúránkat. A felügyelt tárhellyel rendelkező Amazon Redshift RA3 példányok lehetővé tették számunkra, hogy ügyfeleink igényei szerint külön méretezzük a számításokat és a tárolást. Ezenkívül az Amazon Redshift párhuzamossági skálázási funkciójával nem kell aggódnunk amiatt, hogy a csúcsidők befolyásolják a felhasználói teljesítményt. Az Amazon Redshift automatikusan skálázódik és lép be.

Kíváncsian várjuk továbbá az Amazon Redshift adatmegosztás és az AQUA (Advanced Query Accelerator) előnyeit az Amazon Redshift számára, miközben folyamatosan növeljük Amazon Redshift adattárházunk teljesítményét és méretét. Nagyra értékeljük az AWS folyamatos innovációját ügyfelei nevében.


A szerzőkről

Krishna Prakash (KP) Bhat a GE Healthcare adat- és elemzési részlegének idősebb igazgatója. Ebben a munkakörben a GE Healthcare Digital Technologies Organisation-on belüli adat- és elemzési megoldások architektúrájáért és adatkezeléséért felel. Szabadidejében KP szívesen tölt időt a családjával. Kapcsold be LinkedIn.

Suresh Patnam az AWS megoldástervezője, a big data és az AI/ML szakterülete. Az ügyfelekkel dolgozik a felhő felé vezető úton, különös tekintettel a big data-ra, az adattókra és az AI/ML-re. Szabadidejében Suresh szívesen teniszez és a családjával tölti az idejét. Kapcsold be LinkedIn.

Forrás: https://aws.amazon.com/blogs/big-data/how-ge-healthcare-modernized-their-data-platform-using-a-lake-house-architecture/

Időbélyeg:

Még több AWS