נובו נורדיסק היא חברת תרופות גלובלית מובילה, האחראית על ייצור תרופות מצילות חיים המגיעות ליותר מ-34 מיליון חולים בכל יום. הם עושים זאת בעקבות השורה התחתונה המשולשת שלהם - שהם חייבים לשאוף להיות ברי קיימא מבחינה סביבתית, ברי קיימא חברתית וברי קיימא כלכלית. השילוב של שימוש ב-AWS ונתונים תומך בכל היעדים הללו.
הנתונים נפוצים בכל שרשרת הערך של נובו נורדיסק. החל ממחקר יסודי, קווי ייצור, מכירות ושיווק, ניסויים קליניים, מעקב תרופתי, דרך יישומים מונעי מטופלים. לכן, השגת הבסיס סביב האופן שבו נתונים מאוחסנים, שומרים ומשתמשים בהם בצורה המספקת את הערך הרב ביותר הוא אחד המניעים המרכזיים לשיפור התוצאות העסקיות.
ביחד עם שירותים מקצועיים של AWS, אנו בונים פתרון נתונים וניתוח באמצעות ארכיטקטורת נתונים מודרנית. שיתוף הפעולה בין נובו נורדיסק ו-AWS Professional Services הוא התקשרות הדוק אסטרטגית וארוכה, שבה מפתחים משני הארגונים עבדו יחד בשיתוף פעולה הדוק במשך שנים. סביבות הנתונים והניתוח בנויים סביב עקרונות הליבה של רשת הנתונים - בעלות על תחום מבוזר על נתונים, נתונים כמוצר, תשתית נתונים בשירות עצמי וממשל חישובי מאוחד. זה מאפשר למשתמשי הסביבה לעבוד עם נתונים באופן שמניע את התוצאות העסקיות הטובות ביותר. שילבנו זאת עם אלמנטים מארכיטקטורות אבולוציוניות שיאפשרו לנו להתאים פונקציונליות שונות כאשר AWS מפתחת ללא הרף שירותים ויכולות חדשות.
בסדרת פוסטים זו תלמד כיצד נובו נורדיסק ו-AWS Professional Services בנו מערכת אקולוגית של נתונים וניתוח כדי להאיץ חדשנות בקנה מידה פטה-בייט:
- בפוסט הראשון הזה תלמדו כיצד העיצוב הכולל אפשר לרכיבים בודדים להתאחד בצורה מודולרית. אנו צוללים לעומק כיצד בנינו פתרון לניהול נתונים המבוסס על ארכיטקטורת רשת הנתונים.
- הפוסט השני דן כיצד בנינו רשת אמון בין המערכות המרכיבות את הפתרון כולו. אנו מראים כיצד אנו משתמשים בארכיטקטורות מונעות אירועים, יחד עם השימוש בבקרות גישה מבוססות תכונות, כדי להבטיח שגבולות ההרשאה מכובדים בקנה מידה.
- בפוסט השלישי, אנו מראים כיצד משתמשי קצה יכולים לצרוך נתונים מכלי הבחירה שלהם, מבלי להתפשר על ניהול הנתונים. זה כולל איך להגדיר את Okta, תצורת אגם AWS, ו-Microsoft Power BI כדי לאפשר שימוש מאוחד מבוסס SAML ב אמזונה אתנה עבור פעילות בינה עסקית ארגונית (BI).
סביבה תואמת תרופות
כתעשיית תרופות, תאימות GxP היא מנדט עבור נובו נורדיסק. GxP הוא קיצור כללי של "Good x Practice" הנחיות ותקנות איכות שהוגדרו על ידי רגולטורים כגון סוכנות התרופות האירופית, מנהל המזון והתרופות האמריקאי ואחרים. הנחיות אלו נועדו להבטיח שמוצרים רפואיים בטוחים ויעילים לשימוש המיועד להם. בהקשר של סביבת נתונים, תאימות GxP כרוכה בהטמעת בקרות שלמות עבור נתונים המשמשים בקבלת החלטות ובתהליכים ומשמשת להנחות כיצד מיושמים תהליכי ניהול שינויים כדי להבטיח תאימות מתמשכת לאורך זמן.
מכיוון שסביבת נתונים זו תומכת בצוותים בכל הארגון, כל בעל נתונים בודד חייב לשמור על אחריות על הנתונים שלו. תכונות תוכננו כדי לספק לבעלי נתונים אוטונומיה ושקיפות בעת ניהול הנתונים שלהם, מה שמאפשר להם לקחת אחריות זו. זה כולל את היכולת לטפל במידע אישי מזהה (PII) ובעומסי עבודה רגישים אחרים. כדי לספק מעקב על הסביבה, נוספו יכולות ביקורת, אותן אנו מתארים יותר בפוסט זה.
סקירת פתרונות
הפתרון המלא הוא נוף רחב של שירותים עצמאיים הפועלים יחד כדי לאפשר נתונים וניתוח עם מודל ניהול נתונים מבוזר בקנה מידה פטה-בייט. באופן סכמטי, זה יכול להיות מיוצג כמו באיור הבא.
הארכיטקטורה מחולקת לשלוש שכבות עצמאיות: ניהול נתונים, וירטואליזציה וצריכה. משתמש הקצה יושב בשכבת הצריכה ועובד עם הכלי שבחר. זה נועד להפשט כמה שיותר מהמשאבים המקוריים של AWS לפרימיטיבים של יישומים. שכבת הצריכה משולבת בשכבת הוירטואליזציה, אשר מפשטת את הגישה לנתונים. מטרת שכבת הוירטואליזציה היא לתרגם בין צריכת נתונים ופתרונות ניהול נתונים. הגישה לנתונים מנוהלת על ידי מה שאנו מכנים פתרונות ניהול נתונים. אנו דנים באחד מפתרונות ניהול הנתונים הרב-תכליתיים שלנו בהמשך הפוסט הזה. כל שכבה בארכיטקטורה זו אינה תלויה זו בזו ובמקום זאת מסתמכת רק על ממשקים מוגדרים היטב.
מרכזי בארכיטקטורה זו הוא שהגישה מוקפת ב- AWS זהות וניהול גישה מפגש תפקידים (IAM). שכבת ניהול הנתונים מתמקדת במתן הרשאות וממשל נכונים לתפקיד IAM, שכבת הווירטואליזציה מספקת גישה לתפקיד, ושכבת הצריכה מפשטת את השימוש בתפקידים בכלי הבחירה.
ארכיטקטורה טכנית
לכל אחד משלושת השכבות בארכיטקטורה הכוללת יש אחריות ברורה, אך אין יישום יחיד. חשבו עליהם כעל שיעורים מופשטים. ניתן ליישם אותם בשיעורי בטון, ובמקרה שלנו הם מסתמכים על שירותי ויכולות בסיסיות של AWS. נעבור על כל אחת משלושת השכבות.
שכבת ניהול נתונים
שכבת ניהול הנתונים אחראית על מתן גישה לנתונים וניהולם. כפי שמודגם בתרשים הבא, מבנה מינימלי בשכבת ניהול הנתונים הוא השילוב של an שירות אחסון פשוט של אמזון (Amazon S3) דלי ותפקיד IAM שנותן גישה לדלי S3. ניתן להרחיב את המבנה הזה כך שיכלול הרשאה פרטנית עם Lake Formation, אודיטינג עם AWS CloudTrail, ויכולות תגובת אבטחה מ רכזת אבטחה של AWS. התרשים הבא מראה גם שלפתרון ניהול נתונים יחיד אין טווח יחיד. זה יכול לחצות חשבונות AWS רבים ולהיות מורכב מכל מספר של שילובי תפקידים של IAM.
בכוונה לא הדגמנו את מדיניות האמון של התפקידים הללו באיור זה, מכיוון שאלה הם אחריות משותפת בין שכבת הווירטואליזציה לשכבת ניהול הנתונים. אנו נפרט כיצד זה עובד בפוסט הבא בסדרה זו. אנשי מקצוע בהנדסת נתונים מתממשקים לעתים קרובות ישירות עם שכבת ניהול הנתונים, שם הם אוצרים ומכינים נתונים לצריכה.
שכבת וירטואליזציה
מטרת שכבת הוירטואליזציה היא לעקוב אחר מי יכול לעשות מה. אין לו יכולות בפני עצמו, אבל מתרגם את הדרישות מהמערכות האקולוגיות של ניהול הנתונים לשכבות הצריכה ולהיפך. זה מאפשר למשתמשי קצה בשכבת הצריכה לגשת ולתפעל נתונים על מערכת אקולוגית אחת או יותר לניהול נתונים, בהתאם להרשאות שלהם. שכבה זו מפשטת ממשתמשי הקצה את הפרטים הטכניים על גישה לנתונים, כגון מודל הרשאות, הנחות תפקיד ומיקום אחסון. היא הבעלים של הממשקים לשכבות האחרות ואוכפת את ההיגיון של ההפשטה. בהקשר של ארכיטקטורות משושה (ראה פיתוח ארכיטקטורה אבולוציונית עם AWS Lambda), שכבת הממשק ממלאת את התפקיד של הלוגיקה של התחום, היציאות והמתאמים. שני השכבות האחרות הם שחקנים. שכבת ניהול הנתונים מתקשרת את מצב השכבה לשכבת הוירטואליזציה ומנגד מקבלת מידע על נוף השירות שניתן לסמוך עליו. ארכיטקטורת שכבת הוירטואליזציה מוצגת בתרשים הבא.
שכבת צריכה
שכבת הצריכה היא המקום שבו יושבים משתמשי הקצה של מוצרי הנתונים. זה יכול להיות מדעני נתונים, אנליסטים של בינה עסקית, או כל צד שלישי שמייצר ערך מצריכת הנתונים. חשוב עבור סוג זה של ארכיטקטורה שלשכבת הצריכה תהיה זרימת כניסה מבוססת וו, שבה ניתן לשנות את ההרשאה לאפליקציה בזמן הכניסה. זה נועד לתרגם את הדרישה הספציפית ל-AWS ליישומי היעד. לאחר שההפעלה באפליקציה בצד הלקוח החלה בהצלחה, זה תלוי באפליקציה עצמה להכשיר להפשטת שכבת נתונים, מכיוון שזה יהיה ספציפי לאפליקציה. וזהו ניתוק חשוב נוסף, שבו אחריות מסוימת נדחפת ליחידות המבוזרות. יישומי תוכנה כשירות מודרניים רבים (SaaS) תומכים במנגנונים מובנים אלה, כגון דאטבריקס or מעבדת דומינו, בעוד שיישומים מסורתיים יותר בצד הלקוח כמו שרת RStudio יש תמיכה מקומית מוגבלת יותר לכך. במקרה שבו חסרה תמיכה מקורית, ניתן לבצע תרגום למטה להפעלת משתמש מערכת ההפעלה כדי לאפשר את ההפשטה. שכבת הצריכה מוצגת באופן סכמטי בתרשים הבא.
כאשר משתמשים בשכבת הצריכה כמתוכנן, המשתמשים לא יודעים שקיימת שכבת הוירטואליזציה. התרשים הבא ממחיש את דפוסי הגישה לנתונים.
מודולריות
אחד היתרונות העיקריים של אימוץ דפוס הארכיטקטורה המשושה, והאצלת הן השכבה הצורכת והן את שכבת ניהול הנתונים לשחקנים ראשיים ומשניים, פירושו שניתן לשנות או להחליפם עם שחרור פונקציונליות חדשות הדורשות פתרונות חדשים. זה נותן דפוס מסוג רכז ודיבור, שבו סוגים רבים ושונים של מערכות מסוג יצרן/צרכן יכולות להיות מחוברות ולעבוד בו-זמנית באיחוד. דוגמה לכך היא שהפתרון הנוכחי הפועל בנובו נורדיסק תומך במספר פתרונות ניהול נתונים בו-זמנית ונחשפים בצורה הומוגנית בשכבה הצורכת. זה כולל גם אגם נתונים, פתרון רשת הנתונים המוצג בפוסט זה וגם מספר פתרונות ניהול נתונים עצמאיים. ואלה חשופים לסוגים רבים של יישומים צורכים, החל מיישומים מנוהלים בהתאמה אישית, באירוח עצמי, ועד להצעות SaaS.
מערכת אקולוגית לניהול נתונים
כדי להגדיל את השימוש בנתונים ולהגדיל את החופש, נובו נורדיסק, בשיתוף עם AWS Professional Services, בנתה סביבת ניהול וממשל נתונים, בשם Novo Nordisk Enterprise DataHub (NNEDH). NNEDH מיישמת ארכיטקטורת נתונים מבוזרת מבוזרת, ויכולות ניהול נתונים כגון קטלוג נתונים עסקיים ארגוניים וזרימת עבודה של שיתוף נתונים. NNEDH היא דוגמה לאקוסיסטם של ניהול נתונים במסגרת המושגית שהוצגה קודם לכן.
ארכיטקטורה מבוזרת: מאגם נתונים ריכוזי לארכיטקטורה מבוזרת
אגם הנתונים המרכזי של נובו נורדיסק מורכב מ-2.3 PB של נתונים מיותר מ-30 תחומי נתונים עסקיים ברחבי העולם המשרתים למעלה מ-2000 משתמשים פנימיים לאורך שרשרת הערך. זה פועל בהצלחה כבר כמה שנים. זוהי אחת מהמערכות האקולוגיות לניהול נתונים הנתמכות כיום.
בתוך ארכיטקטורת הנתונים הריכוזית, נתונים מכל תחום נתונים מועתקים, מאוחסנים ומעובדים במיקום מרכזי אחד: אגם נתונים מרכזי המתארח באחסון נתונים אחד. לדפוס זה יש אתגרים בקנה מידה מכיוון שהוא שומר על בעלות הנתונים עם הצוות המרכזי. בקנה מידה, מודל זה מאט את המסע לעבר ארגון מונע נתונים, מכיוון שהבעלות על הנתונים אינה מעוגנת מספיק עם אנשי המקצוע הקרובים ביותר לתחום.
ארכיטקטורת אגם הנתונים המונוליטי מוצגת בתרשים הבא.
בתוך ארכיטקטורת הנתונים המבוזרים המבוזרים, הנתונים מכל תחום נשמרים בתוך התחום בחשבון אחסון הנתונים והמחשוב שלו. במקרה זה, הנתונים נשמרים קרובים למומחי דומיינים, מכיוון שהם אלו שמכירים את הנתונים שלהם בצורה הטובה ביותר ובסופו של דבר הם הבעלים של כל מוצרי נתונים שנבנו סביב הנתונים שלהם. לעתים קרובות הם עובדים בשיתוף פעולה הדוק עם אנליסטים עסקיים כדי לבנות את מוצר הנתונים ולכן יודעים מה המשמעות של נתונים טובים לצרכנים של מוצרי הנתונים שלהם. במקרה זה, האחריות לנתונים היא גם מבוזרת, כאשר לכל תחום יש בעל נתונים משלו, מה שמטיל את האחריות על הבעלים האמיתיים של הנתונים. עם זאת, ייתכן שהמודל הזה לא יעבוד בקנה מידה קטן, למשל ארגון עם יחידה עסקית אחת בלבד ועשרות משתמשים, מכיוון שהוא יכניס יותר תקורה לצוות ה-IT לניהול נתוני הארגון. זה מתאים יותר לארגונים גדולים, או קטנים ובינוניים שרוצים לגדול ולהתרחב.
ארכיטקטורת רשת הנתונים של נובו נורדיסק מוצגת בתרשים הבא.
דומיינים של נתונים ונכסי נתונים
כדי לאפשר את המדרגיות של דומיינים של נתונים ברחבי הארגון, חובה להחזיק במודל הרשאות סטנדרטי ודפוס גישה לנתונים. אסור שהתקן הזה יהיה מגביל מדי בצורה כזו שהוא עשוי להיות חוסם עבור מקרי שימוש ספציפיים, אך יש לתקנן אותו בצורה כזו לשימוש באותו ממשק בין שכבות ניהול הנתונים והווירטואליזציה.
תחומי הנתונים ב-NNEDH מיושמים על ידי מבנה הנקרא an סביבה. סביבה מורכבת לפחות מחשבון AWS אחד ואזור AWS אחד. זהו מקום עבודה שבו צוותי תחום נתונים יכולים לעבוד ולשתף פעולה כדי לבנות מוצרי נתונים. הוא מקשר את מישור הבקרה של NNEDH לחשבונות AWS שבהם נמצאים הנתונים והמחשוב של התחום. הרשאות הגישה לנתונים מוגדרות גם ברמת הסביבה, המנוהלות על ידי הבעלים של תחום הנתונים. לסביבות יש שלושה מרכיבים עיקריים: שכבת ניהול וממשל נתונים, נכסי נתונים ושרטוטים אופציונליים לעיבוד נתונים.
לניהול נתונים וממשל, תחומי הנתונים מסתמכים על Lake Formation, דבק AWS, ו-CloudTrail. שיטת הפריסה וההגדרה של רכיבים אלה סטנדרטית בין תחומי הנתונים. בדרך זו, מישור הבקרה של NNEDH יכול לספק קישוריות וניהול לתחומי נתונים בצורה סטנדרטית.
נכסי הנתונים של כל תחום השוכן בסביבה מאורגנים במערך נתונים, שהוא אוסף של נתונים קשורים המשמשים לבניית מוצר נתונים. הוא כולל מטא נתונים טכניים כגון פורמט נתונים, גודל וזמן יצירה, ומטא נתונים עסקיים כגון מפיק, סיווג נתונים והגדרה עסקית. מוצר נתונים יכול להשתמש במערך נתונים אחד או כמה. הוא מיושם באמצעות דלי S3 מנוהלים וקטלוג הנתונים של דבק AWS.
ניתן ליישם עיבוד נתונים בדרכים שונות. NNEDH מספקת שרטוטים לצינורות נתונים עם קישוריות מוגדרת מראש לנכסי נתונים כדי להאיץ את אספקת מוצרי הנתונים. למשתמשי תחום הנתונים יש את החופש להשתמש בכל יכולת מחשוב אחרת בתחום שלהם, למשל שימוש בשירותי AWS שאינם מוגדרים מראש על השרטוטים או גישה למערך הנתונים מכלי ניתוח אחרים המיושמים בשכבת הצריכה, כפי שהוזכר קודם לכן בפוסט זה.
פרסונות ותפקידים בתחום הנתונים
ב-NNEDH, רמות ההרשאה בדומיינים של נתונים מנוהלות באמצעות פרסונות מוגדרות מראש, למשל בעלי נתונים, מנהלי נתונים, מפתחים וקוראים. כל פרסונה משויכת לתפקיד IAM שיש לו רמת הרשאה מוגדרת מראש. הרשאות אלו מבוססות על הצרכים האופייניים של משתמשים בתפקידים אלו. עם זאת, כדי להעניק גמישות רבה יותר לדומיינים של נתונים, ניתן להתאים אישית הרשאות אלו ולהרחיב אותן לפי הצורך.
ההרשאות המשויכות לכל פרסונה קשורות רק לפעולות המותרות בחשבון AWS של תחום הנתונים. לגבי האחריות על נכסי נתונים, הגישה לנתונים לנכסים מנוהלת על ידי מדיניות משאבים ספציפית במקום תפקידי IAM. רק הבעלים של כל מערך נתונים, או מנהלי נתונים שהואצלו על ידי הבעלים, יכולים להעניק או לבטל גישה לנתונים.
ברמת הנתונים, דמות נדרשת היא הבעלים של הנתונים. בדרך כלל, הם עובדים בשיתוף פעולה הדוק עם דייל נתונים אחד או רבים כמנהלי מוצרי נתונים. מנהל הנתונים הוא המומחה לנושאי הנתונים של תחום מוצר הנתונים, האחראי לפרש נתונים ומטא נתונים שנאספו כדי להפיק תובנות עסקיות עמוקות ולבנות את המוצר. מנהל הנתונים מגשר בין משתמשים עסקיים לצוותים טכניים בכל תחום נתונים.
קטלוג נתונים עסקיים ארגוניים
כדי לאפשר חופש ולהפוך את נכסי הנתונים של הארגון לניתנים לגילוי, מיושם קטלוג נתונים של פורטל מבוסס אינטרנט. הוא מוסיף מטא נתונים במאגר יחיד מתוך מערכי נתונים הבנויים על דומיינים של נתונים, שובר ממגורות נתונים ברחבי הארגון. קטלוג הנתונים מאפשר חיפוש וגילוי נתונים על פני תחומים שונים, כמו גם אוטומציה וממשל בשיתוף נתונים.
קטלוג הנתונים העסקיים מיישם תהליכי ממשל נתונים בתוך הארגון. זה מבטיח את הבעלות על הנתונים - מישהו בארגון אחראי על מקור הנתונים, ההגדרה, התכונות העסקיות, הקשרים והתלות.
המבנה המרכזי של קטלוג נתונים עסקיים הוא מערך נתונים. זוהי יחידת החיפוש בקטלוג העסקים, בעלת מטא נתונים טכניים ועסקיים כאחד. כדי לאסוף מטא נתונים טכניים מנתונים מובנים, הוא מסתמך על סורקי AWS Glue כדי לזהות ולחלץ מבני נתונים מפורמטי הנתונים הפופולריים ביותר, כולל CSV, JSON, Avro ו- Apache Parquet. הוא מספק מידע כגון סוג נתונים, תאריך יצירה ופורמט. משתמשים עסקיים יכולים להעשיר את המטא נתונים על ידי הוספת תיאור ההקשר העסקי, תגים וסיווג הנתונים.
הגדרת מערך הנתונים ומטא נתונים קשורים מאוחסנים ב-an אמזון אורורה ללא שרת מסד נתונים ו שירות חיפוש פתוח של אמזון, המאפשר לך להריץ שאילתות טקסטואליות בקטלוג הנתונים.
שיתוף מידע
NNEDH מיישמת זרימת עבודה לשיתוף נתונים, המאפשרת שיתוף נתונים בין עמית לעמית בין חשבונות AWS באמצעות Lake Formation. זרימת העבודה היא כדלקמן:
- צרכן נתונים מבקש גישה למערך הנתונים.
- בעל הנתונים מעניק גישה על ידי אישור בקשת הגישה. הם יכולים להאציל את אישור בקשות הגישה למנהל הנתונים.
- עם אישור בקשת גישה, הרשאה חדשה מתווספת למערך הנתונים הספציפי ב-Lake Formation של חשבון המפיק.
זרימת העבודה של שיתוף הנתונים מוצגת באופן סכמטי באיור הבא.
אבטחה וביקורת
הנתונים ברשת הנתונים של נובו נורדיסק נמצאים בחשבונות AWS שבבעלות חשבונות עסקיים של נובו נורדיסק. התצורה והמצבים של רשת הנתונים מאוחסנים ב שירות מסדי נתונים יחסי של אמזון (Amazon RDS). ארכיטקטורת האבטחה של נובו נורדיסק מוצגת באיור הבא.
יש לרשום גישה ועריכות לנתונים ב- NNEDH למטרות ביקורת. אנחנו צריכים להיות מסוגלים לדעת מי שינה את הנתונים, מתי השינוי קרה, ואילו שינויים הוחלו. בנוסף, עלינו להיות מסוגלים לענות מדוע השינוי הותר על ידי אותו אדם באותו זמן.
כדי לעמוד בדרישות אלו, אנו משתמשים ברכיבים הבאים:
- CloudTrail לרישום קריאות API. אנו מאפשרים במיוחד רישום אירועי נתונים של CloudTrail עבור דליים ואובייקטים של S3. על ידי הפעלת הרישום, נוכל לעקוב אחר כל שינוי בקבצים כלשהם באגם הנתונים לאדם שביצע את השינוי. אנו אוכפים שימוש ב זהות המקור עבור הפעלות תפקידים של IAM כדי להבטיח מעקב אחר המשתמש.
- אנו משתמשים ב- Amazon RDS כדי לאחסן את התצורה של רשת הנתונים. אנו רושמים שאילתות מול מסד הנתונים של RDS. יחד עם CloudTrail, יומן זה מאפשר לנו לענות על השאלה מדוע יתכן שינוי בקובץ באמזון S3 בזמן מסוים על ידי אדם ספציפי.
- אמזון CloudWatch כדי לרשום פעילויות על פני הרשת.
בנוסף למנגנוני רישום אלה, הדליים של S3 נוצרים באמצעות המאפיינים הבאים:
- הדלי מוצפן באמצעות הצפנה בצד השרת עם שירות ניהול מפתח AWS (AWS KMS) ומפתחות מנוהלים על ידי לקוחות
- ניהול גרסאות של Amazon S3 מופעל כברירת מחדל
הגישה לנתונים ב- NNEDH נשלטת ברמת הקבוצה במקום משתמשים בודדים. הקבוצה מתאימה לקבוצה המוגדרת בקבוצת ספריות נובו נורדיסק. כדי לעקוב אחר האדם ששינה את הנתונים באגמי הנתונים, אנו משתמשים במנגנון זהות המקור שהוסבר בפוסט כיצד לקשר בין פעילות תפקיד IAM לזהות ארגונית.
סיכום
בפוסט זה, הראינו כיצד נובו נורדיסק בנתה ארכיטקטורת נתונים מודרנית כדי להאיץ את האספקה של מקרי שימוש מונעי נתונים. זה כולל ארכיטקטורת נתונים מבוזרת, להגדלת השימוש לקנה מידה פטה-בייט עבור למעלה מ-2,000 משתמשים פנימיים בכל שרשרת הערך, כמו גם ארכיטקטורת אבטחה וביקורת מבוזרת המטפלת באחריות נתונים ועקיבות על הסביבה כדי לעמוד בדרישות התאימות שלהם.
הפוסט הבא בסדרה זו מתאר את היישום של ממשל ובקרה של נתונים מבוזרים בקנה מידה של ארכיטקטורת הנתונים המודרנית של נובו נורדיסק.
על הכותבים
יונתן סלסינג הוא מדען חוקר לשעבר עם דוקטורט באסטרופיזיקה שפנה לענן. כיום הוא מהנדס ענן מוביל בנובו נורדיסק, שם הוא מאפשר עומסי עבודה של נתונים וניתוח בקנה מידה. עם דגש על הפחתת עלות הבעלות הכוללת של עומסי עבודה מבוססי ענן, תוך מתן תועלת מלאה מיתרונות הענן, הוא מעצב, בונה ומתחזק פתרונות המאפשרים מחקר עבור תרופות עתידיות.
האסן ריהי הוא Sr. Data Architect בשירותים מקצועיים של AWS. הוא בעל תואר דוקטור במתמטיקה ומדעי המחשב על ניהול נתונים בקנה מידה גדול. הוא עובד עם לקוחות AWS על בניית פתרונות מונעי נתונים.
אנואר ריזאל הוא יועץ בכיר למידת מכונה שבסיסה בפריז. הוא עובד עם לקוחות AWS כדי לפתח פתרונות נתונים ו-AI לצמיחה בת קיימא של העסק שלהם.
משה ארתור מגיע מרקע של מתמטיקה ומחקר חישובי ובעל תואר שלישי באינטליגנציה חישובית המתמחה בכריית גרפים. כיום הוא מהנדס מוצר ענן בנובו נורדיסק בונה אגמי נתונים ארגוניים תואמי GxP ופלטפורמות ניתוח עבור מפעלים גלובליים של נובו נורדיסק המייצרים מוצרים רפואיים דיגיטליים.
אלסנדרו פיור הוא Sr. Data Architect בשירותים מקצועיים של AWS. עם למעלה מ-10 שנות ניסיון באספקת פתרונות נתונים וניתוח, הוא נלהב מעיצוב ובניית פלטפורמות נתונים מודרניות וניתנות להרחבה שמאיצות חברות להשיג ערך מהנתונים שלהן.
קומארי רמר הוא מנהל מעורבות בכיר מוסמך Agile ומוסמך PMP בשירותים מקצועיים של AWS. היא מספקת פתרונות נתונים ו-AI/ML שמאיצים מודלים של ניתוח חוצי-מערכות ולמידת מכונה, המאפשרים לארגונים לקבל החלטות מונחות נתונים ולהניע חידושים חדשים.
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- Platoblockchain. Web3 Metaverse Intelligence. ידע מוגבר. גישה כאן.
- מקור: https://aws.amazon.com/blogs/big-data/how-novo-nordisk-built-a-modern-data-architecture-on-aws/
- 000
- 10
- 100
- a
- יכול
- אודות
- תקציר
- תקצירים
- להאיץ
- גישה
- גישה לנתונים
- גישה
- פי
- חֶשְׁבּוֹן
- דין וחשבון
- חשבונות
- לרוחב
- פעולות
- מפעילה
- פעילויות
- פעילות
- להסתגל
- הוסיף
- תוספת
- נוסף
- מנהל
- אימוץ
- יתרונות
- לאחר
- נגד
- סוכנות
- זריז
- AI
- AI / ML
- תעשיות
- מאפשר
- אמזון בעברית
- אמזון RDS
- אנליסטים
- ניתוח
- ו
- לענות
- אַפָּשׁ
- API
- בקשה
- יישום ספציפי
- יישומים
- יישומית
- הסכמה
- ארכיטקטורה
- סביב
- נכסים
- המשויך
- אסטרופיזיקה
- תכונות
- בדיקה
- ביקורת
- כּוֹכָב הַשַׁחַר
- אישור
- אוטומציה
- AWS
- דבק AWS
- שירותים מקצועיים של AWS
- בחזרה
- רקע
- מבוסס
- כי
- תועלת
- הטוב ביותר
- מוטב
- בֵּין
- תַחתִית
- גבולות
- שבירה
- גשרים
- לִבנוֹת
- בִּניָן
- בונה
- נבנה
- מובנה
- עסקים
- מודיעין עסקי
- נקרא
- שיחות
- יכולות
- מקרה
- מקרים
- קטלוג
- מֶרכָּזִי
- מְרוּכָּז
- מוסמך
- שרשרת
- האתגרים
- שינוי
- בחירה
- כיתות
- מיון
- קליני
- ניסויים קליניים
- סְגוֹר
- מקרוב
- ענן
- לשתף פעולה
- שיתוף פעולה
- שיתוף פעולה
- לגבות
- אוסף
- שילוב
- שילובים
- משולב
- איך
- חברות
- חברה
- הענות
- רכיבים
- מורכב
- מורכב
- מתפשר
- לחשב
- המחשב
- מדעי מחשב
- רעיוני
- תְצוּרָה
- מחובר
- קישוריות
- לבנות
- יועץ
- לצרוך
- צרכן
- צרכנים
- צְרִיכָה
- הקשר
- לִשְׁלוֹט
- נשלט
- בקרות
- ליבה
- משותף
- מתכתב
- עלות
- יחד
- נוצר
- יצירה
- לַחֲצוֹת
- נוֹכְחִי
- כיום
- מנהג
- לקוח
- לקוחות
- נתונים
- גישה למידע
- תשתית נתונים
- אגם דאטה
- ניהול נתונים
- עיבוד נתונים
- שיתוף מידע
- אחסון נתונים
- נתונים מונחים
- מסד נתונים
- דאטבריקס
- מערכי נתונים
- תַאֲרִיך
- יְוֹם
- מבוזר
- החלטה
- קבלת החלטות
- החלטות
- עמוק
- אספקה
- מספק
- מסירה
- פריסה
- לתאר
- תיאור
- עיצוב
- מעוצב
- תכנון
- עיצובים
- פרט
- פרטים
- לפתח
- מפתחים
- מפתחת
- אחר
- ישירות
- תגלית
- לדון
- מובהק
- מופץ
- לא
- תחום
- תחומים
- לא
- מטה
- נהיגה
- נהגים
- תרופה
- כל אחד
- מוקדם יותר
- המערכת האקולוגית
- מערכות אקולוגיות
- אפקטיבי
- אלמנטים
- דגש
- לאפשר
- מופעל
- מאפשר
- מה שמאפשר
- כמוס
- מוצפן
- הצף
- התעסקות
- מהנדס
- הנדסה
- מועשר
- לְהַבטִיחַ
- מבטיח
- מִפְעָל
- חברות
- שלם
- סביבה
- לסביבה
- סביבות
- Ether (ETH)
- אֵירוֹפִּי
- אירוע
- דוגמה
- קיים
- מורחב
- ניסיון
- מומחה
- מומחים
- מוסבר
- חשוף
- תמצית
- מפעלים
- תכונות
- תרשים
- שלח
- קבצים
- כלכלית
- ראשון
- גמישות
- תזרים
- מתמקד
- הבא
- כדלקמן
- מזון
- מינהל המזון והתרופות האמריקאי
- פוּרמָט
- התהוות
- לשעבר
- קרן
- מסגרת
- חופש
- החל מ-
- מלא
- פונקציות
- עתיד
- כללי
- מייצר
- לקבל
- מקבל
- לתת
- נותן
- נתינה
- גלוֹבָּלִי
- Go
- טוב
- ממשל
- להעניק
- מענקים
- גרף
- קְבוּצָה
- לגדול
- מדריך
- הנחיות
- לטפל
- טיפול
- קרה
- יש
- מחזיק
- אירח
- איך
- איך
- HTML
- HTTPS
- IAM
- זהות
- הפעלה
- יושם
- יישום
- מיישמים
- חשוב
- משופר
- in
- לכלול
- כולל
- כולל
- להגדיל
- עצמאי
- אינדקסים
- בנפרד
- תעשייה
- מידע
- תשתית
- חדשנות
- חידושים
- תובנות
- במקום
- מכשיר
- משולב
- שלמות
- מוֹדִיעִין
- מִמְשָׁק
- ממשקים
- פנימי
- מבוא
- הציג
- IT
- עצמו
- מסע
- ג'סון
- שמור
- מפתח
- לדעת
- אגם
- נוף
- גָדוֹל
- בקנה מידה גדול
- שכבה
- שכבות
- עוֹפֶרֶת
- מוביל
- לִלמוֹד
- למידה
- רמה
- רמות
- מוגבל
- קווים
- קישורים
- מיקום
- לטווח ארוך
- מכונה
- למידת מכונה
- עשוי
- ראשי
- שומר
- לעשות
- עשייה
- לנהל
- הצליח
- ניהול
- פתרון ניהול
- מנהל
- מנהלים
- ניהול
- מנדט
- מנדטורי
- ייצור
- רב
- שיווק
- מתימטיקה
- דבר
- אומר
- מנגנון
- רפואי
- רפואי
- בינוני
- לִפְגוֹשׁ
- מוּזְכָּר
- מידע נוסף
- שיטה
- מיקרוסופט
- יכול
- מִילִיוֹן
- מינימלי
- כרייה
- חסר
- מודל
- מודלים
- מודרני
- שינויים
- שונים
- מודולרי
- יותר
- רוב
- הכי פופולארי
- מספר
- שם
- יליד
- צורך
- נחוץ
- צרכי
- רשת
- אף על פי כן
- חדש
- פתרונות חדשים
- הבא
- חדש
- נובו נורדיסק
- מספר
- אובייקטים
- הצעות
- OKTA
- ONE
- ארגון
- ארגונים
- מאורגן
- מָקוֹר
- OS
- אחר
- אחרים
- מקיף
- שֶׁלוֹ
- בבעלות
- בעלים
- בעלי
- בעלות
- בעלים של
- פריז
- צד
- לוהט
- חולים
- תבנית
- דפוסי
- עניין על עניין
- רשות
- הרשאות
- אדם
- אישית
- פטיבה
- התרופות
- pii
- פלטפורמות
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- מדיניות
- מדיניות
- פופולרי
- כניסה
- יציאות
- אפשרי
- הודעה
- הודעות
- כּוֹחַ
- Power BI
- להכין
- מוצג
- יְסוֹדִי
- תהליכים
- תהליך
- יַצרָן
- המוצר
- מוצרים
- מקצועי
- אנשי מקצוע
- נכסים
- לספק
- מספק
- מתן
- מטרה
- למטרות
- דחף
- מכניס
- איכות
- שאלה
- לְהַגִיעַ
- הקוראים
- מקבל
- להכיר
- הפחתה
- באזור
- תקנון
- רגולטורים
- קָשׁוּר
- מערכות יחסים
- שוחרר
- החליף
- מאגר
- מיוצג
- לבקש
- בקשות
- לדרוש
- נדרש
- דרישה
- דרישות
- מחקר
- משאב
- משאבים
- נִכבָּד
- תגובה
- אחריות
- אחראי
- מגבילה
- תפקיד
- תפקידים
- הפעלה
- ריצה
- SaaS
- בטוח
- מכירות
- אותו
- בקרת מערכות ותקשורת
- להרחבה
- סולם
- מדע
- מַדְעָן
- מדענים
- חיפוש
- שְׁנִיָה
- משני
- אבטחה
- שירות עצמי
- רגיש
- סדרה
- שרות
- שירותים
- הגשה
- מושב
- הפעלות
- התקנה
- כמה
- שיתוף
- צריך
- לְהַצִיג
- הראה
- הופעות
- פָּשׁוּט
- בו זמנית
- יחיד
- יחיד
- ישיבה
- מידה
- מאט
- קטן
- מבחינה חברתית
- תוכנה
- תוכנה כשירות
- פִּתָרוֹן
- פתרונות
- כמה
- מָקוֹר
- מיוחד
- ספציפי
- במיוחד
- מְהִירוּת
- לפצל
- תֶקֶן
- החל
- מדינה
- הברית
- אחסון
- חנות
- מאוחסן
- אסטרטגי
- לשאוף
- מובנה
- נושא
- בהצלחה
- כזה
- תמיכה
- נתמך
- תומך
- בר קיימא
- מערכות
- לקחת
- יעד
- מטרות
- נבחרת
- צוותי
- טכני
- עקרונות
- השמיים
- המקור
- המדינה
- שֶׁלָהֶם
- לכן
- שְׁלִישִׁי
- שְׁלוֹשָׁה
- דרך
- בכל
- זמן
- ל
- יַחַד
- גַם
- כלי
- כלים
- סה"כ
- לקראת
- להתחקות
- עקיבות
- לעקוב
- מסורתי
- לתרגם
- תרגום
- שקיפות
- ניסויים
- לְשַׁלֵשׁ
- נָכוֹן
- סומך
- הסתובב
- סוגים
- טיפוסי
- בדרך כלל
- לָנוּ
- בסופו של דבר
- התאחדות
- יחידה
- יחידות
- us
- נוֹהָג
- להשתמש
- משתמש
- משתמשים
- ערך
- רב צדדי
- דרכים
- המבוסס על האינטרנט
- מוגדר היטב
- מה
- אשר
- בזמן
- מי
- יצטרך
- בתוך
- לְלֹא
- תיק עבודות
- לעבוד יחד
- עבד
- זרימת עבודה
- מקום עבודה
- עובד
- עולמי
- היה
- X
- שנים
- זפירנט