שבעה אתגרים שמוסדות פיננסיים חייבים להתמודד כדי לנצל את הפוטנציאל של למידת מכונה (אנשומן פראסד)

שבעה אתגרים שמוסדות פיננסיים חייבים להתמודד כדי לנצל את הפוטנציאל של למידת מכונה (אנשומן פראסד)

צומת המקור: 2001633

למידת מכונה (ML), הזרוע הבולטת ביותר של בינה מלאכותית (AI), חותכת לשני הכיוונים עבור תעשיית השירותים הפיננסיים, שם היישומים שלה הולכים ומתרחבים מיום ליום.

היתרונות ברורים. מודלים של ML מאומנים ללמוד מתוצאות בדיוק כפי שעושה המוח האנושי ויכולים לבצע משימות מורכבות בקנה מידה ובמהירות שבני אדם פשוט לא יכולים.

אבל סכנות רבות. מורכבות הדגמים מהווה סיכון. רבים יכולים להיות אטומים וסתומים, ידועים לשמצה בשל היותם קופסאות שחורות. וכאשר דגמים לא שקופים מתפקדים, הדברים עלולים לצאת משליטה.

במקרים קיצוניים היא אף עלולה להוביל לכישלון מוסדות פיננסיים, עם השלכות מערכתיות על המשק כולו.

עבור מוסדות פיננסיים, ישנם מספר אתגרים בעצם לגרום למודלים של ML לדבוק בעקרונות הקיימים ושיטות העבודה המומלצות של ניהול סיכונים במודל. מניסיוננו בעבודה עם מוסדות פיננסיים, להלן שבעה מהאתגרים הנפוצים ביותר שאנו רואים ומה הצעדים שהם נוקטים כדי להתמודד איתם.

1) הפעלת מסגרת אימות מודל ML המכסה אלגוריתמים, טכניקות אימות, בקרות ותיעוד

מוסדות פיננסיים צריכים להקים מסגרת אימות מקצה לקצה במיוחד עבור מודלים של ML.

בחירת אלגוריתמים מתאימים ביחס לדרישות העסקיות וזמינות הנתונים היא קריטית. זה דורש מומחיות במודלים של ML, הבנה עסקית ותכנות.

טכניקות האימות עבור מודלים של ML שונות מאלו המשמשות בדרך כלל מוסדות פיננסיים עבור מודלים אחרים. הם יכולים גם להיות שונים בהתאם לאלגוריתם ה-ML שבו נעשה שימוש והזמינות והמבנה של הנתונים.

בנוסף, תיקוף מחדש ותיקוף ממוקד (שינויים משמעותיים שהוחלו על מודלים קיימים) צריכים להיות מכוסים על ידי קו ההגנה השני, כדי לאשר שהמודל מתאים למטרה. במודלים של ML, שינויים קלים בפרמטרים או כוונון ההגדרה יכולים להשפיע באופן משמעותי על התנהגות האלגוריתם ותוצאות המודל.

לאחר מכן, מסגרת הבקרה צריכה להיות במקום, עם דגש על עיצוב ויעילות הבקרות. תיעוד מלא הוא חובה כדי להבטיח שהצד הבלתי תלוי מבין את מטרת המודלים, האלגוריתמים וטכניקות האימות בשימוש, הבעלות והכיסוי.

חשוב גם שפונקציות אימות המודל יהיו מאוישות באנשים בעלי הידע והכישורים הנכונים. לפיכך, צוותי אימות המודל חייבים להעסיק אנשים עם רקע במדעי הנתונים ובסיס מוצק של טכניקות מודלים שונות של AI ו-ML.

2) הקמת מדיניות המכסה דרישות רגולטוריות, ממשל ובקרה, ניטור

עדיין קיימת אי ודאות רבה בנוגע לדרישות הרגולטוריות לאימות מודל ML.

גופי הפיקוח הציגו ציפיות רגולטוריות כלליות; עם זאת, אין מסגרת רגולטורית רשמית עבור מודלים של ML. מוסדות פיננסיים צריכים לפתח מדיניות המציינת דרישות רגולטוריות כלליות, שיכולות לכלול הנחיות לניהול סיכונים והנחיות למודלים של ML.

ההנחיות לניהול סיכונים במודל צריכות לכסות תקינות רעיונית, בדיקות איכות נתונים, ממשל ובקרה, ניטור מודלים ואימות מודל. הדירקטוריון וההנהלה הבכירה צריכים להיות מודעים למקרי שימוש ולהבין את האפקטיביות של הבקרות המשמשות במחזור החיים של מודל ה-ML. תפקידים ואחריות צריכים להיות מוגדרים בבירור כדי להשיג בעלות ואחריות.

3) הטמעת מודלים של ML בתוך סביבה חזקה ומבוקרת

יישום מודלים של ML נוטה לסיכונים. בהשוואה למודלים סטטיסטיים או מסורתיים, המפרטים המורכבים של אלגוריתמי ML שמים דגש על יעילות חישובית וזיכרון, מה שמגביר את החששות לגבי סיכוני הטמעה.

יישום מודלים של ML באמצעות פלטפורמות שונות דורש מומחיות ותשתית. הדגש צריך להיות על יצירת תשתית IT איתנה, פיתוח כלים באמצעות תכנות, שיפור ניטור מודלים והגדרות אימות בתוך כלים אלה. מורכבות זו מקשה על משימת האימות לאימות היישום הנכון של מודלים בתוך מערכת ה-IT.

תיעוד תהליך ההטמעה מאפשר לגורם בלתי תלוי להבין את זרימת התהליך של המערכת בה נעשה שימוש. פונקציית אימות המודל צריכה להעריך את ההתאמה של יישום המודל, ולהעריך את הבדיקות שבוצעו ואת מסגרת הבקרה הכוללת העומדת בבסיס המודל.

4) עיצוב תהליכי ממשל נתונים יעילים

מאחר שהנתונים הם היבט חשוב במודלים של ML, תהליכי ממשל נאותים סביבם הם קריטיים. תהליך ניהול הנתונים צריך לכסות מקורות, בדיקות איכות של נתוני קלט, ניתוח נתונים (הכוללים ניתוח חד-משתני וניתוח חריגים), בקרה על תשומות ידניות והיבטים אחרים.
מנקודת מבט של אימות מודל, בדיקת נתונים דורשת מסגרת אפקטיבית לניהול נתונים הקובעת מערכת כללים לגבי איכות, שלמות ועיתוי נתונים עבור מודלים. במובן כזה, חריגות מהסטנדרטים הללו הם נושא מאתגר, שכן הנתונים המשמשים בשיטות ML הם עצומים בהשוואה למודלים מסורתיים. כמו כן, מודלים של ML מסתמכים על כמויות גדולות של נתונים הטרוגניים ובממדים גבוהים, מה שהופך את התיעוד של המקור, העיבוד והטרנספורמציה, ועד לשלב האחרון של הפריסה המלאה של המודל, כדי להבטיח שהנתונים מתאימים.

לכן, צוות אימות המודל חייב לאשר שנתוני קלט זמינים ועברו בדיקות איכות מתאימות לפני השימוש בייצור. כמו כן, יש צורך לבדוק כיצד טכניקות ML שונות מטפלות בנתונים חסרים, טכניקות נורמליזציה ונתונים חריגים. כמו כן, על חברות להבטיח מעקב טוב של נתונים בחזרה למערכות המקור, כך שניתן יהיה לתקן אתגרי הנתונים במקור.

5) בקרה על חוסר הסבר של מודלים של ML

היעדר יכולת ההסבר של מודלים של ML הוא אתגר מרכזי עבור הטכניקות המורכבות יותר, כגון ANN, שבהן תגובות הקלט-פלט אינן ברורות וחסרות שקיפות. המורכבות של מודלים מסוימים של ML יכולה להפוך את זה למאתגר לספק מתאר ברור של התיאוריה, ההנחות והבסיס המתמטי של ההערכות הסופיות. לבסוף, מודלים כאלה מתגלים כקשים לאימות ביעילות.

מאפיין הקופסה השחורה מקשה על הערכת האמינות הרעיונית של הדגם, ומפחית את מהימנותו. לדוגמה, האימות של הפרמטרים ההיפר עשוי לדרוש ידע סטטיסטי נוסף, ולכן, על המוסדות לוודא שהצוות המפקח על האימות מקבל הכשרה מתאימה.

מאמת מודלים יכולים להסתכל על בקרות מקלות כדי לטפל בחוסר השקיפות. בקרות כאלה יכולות להיות חלק מהניטור השוטף שהן קפדניות יותר. כמו כן, מומלץ להשתמש במודלים בנצ'מרק כדי להשוות תפוקות ושונות מול כללים מוגדרים מראש, מה שעלול להוביל לחקירה נוספת או הפסקת השימוש במודלים בייצור.

6) כיול היפרפרמטר של דגמי ML

ההנחות המרכזיות עבור מודלים של ML הן בדרך כלל הפרמטרים ההיפר-פרמטרים שפותחו והתכוונו ליישום במודל. אם ההנחות הללו אטומות, כך תהיה גם האינטואיציה העסקית או האיתנות. יתרה מכך, במודלים של ML, הערך של הפרמטרים ההיפר יכול להשפיע קשות על תוצאות המודל.

יש להעריך שינויים בהגדרות ההיפרפרמטר כדי להעריך את מידת ההתאמה של בחירתו של המעצב. אם נערכו שינויים נוספים בהיפרפרמטרים, צוות האימות חייב לאשר שתוצאות המודל עקביות.

7) ניתוח תוצאות

ניתוח התוצאות, ראינו, הוא חיוני כדי לפצות על חוסר ההסבר בכמה טכניקות ML. יתרה מכך, לניתוח התוצאות יש תפקיד חשוב בהערכת ביצועי המודל. הניתוח מתמקד באימות צולב ובגרסאותיו. להליכי בדיקה חוזרת אין את אותה רלוונטיות כמו במודלים המסורתיים.

פשרה בין שונות לעומת הטיה במודלים של ML יכולה להיות מאתגרת ומדאיגה. למרות שזה לא היה מחוץ לתחום המודלים הסטטיסטיים והרגרסיים, מודלים של ML מגבירים את האזעקות.

ניתן להשתמש במדדים רבים למטרה זו, בהתאם למתודולוגיה של המודל. לדוגמה, MSE יכול להתפרק להטיה ושונות. יש לסקור ולתעד הערכה מפורשת של הפשרות.

בדיקות מחוץ לדגימה הן גם מרכיב חשוב לניתוח תוצאות עבור AI/ML. על המאמתים לסקור ולהעריך אם בוצעו נהלים מתאימים בתהליך פיתוח המודל כדי להבטיח שניתוח התוצאות מתבצע כראוי, כולל ערכות אימות צולבות ובדיקות.

בול זמן:

עוד מ פינקסטרה