תוכנית הבאונטי לזיהוי הטיית LLM הושקה על ידי DoD AI

תוכנית הבאונטי לזיהוי הטיית LLM הושקה על ידי DoD AI

צומת המקור: 2469496

השלב הראשון של תוכנית AI Bias Bounty, מאמץ מיקור המונים למציאת הטיה במערכות AI, הושק על ידי המשרד הראשי לדיגיטל ובינה מלאכותית (CDAO) של משרד ההגנה האמריקאי (DoD).

המשרד הראשי לבינה דיגיטלית ובינה מלאכותית (CDAO) של משרד ההגנה האמריקאי עשה צעד גדול לקראת השלב הראשוני של תוכנית הטיית הבינה המלאכותית (AI) Bias Bounty. התוכנית היא יוזמה במקור המונים שנועדה לזהות הטיה במערכות בינה מלאכותית, החל ממודלים של שפות גדולות (LLM).

תוכנית הבאונטי כוללת שני תרגילים, כאשר הראשון פתוח כעת לקהל ומתקיים בין ה-29 בינואר ל-27 בפברואר 2024. התרגיל הראשון פתוח לקהל הרחב, ומומלץ לכולם הירשם. לא צריך ידע נרחב בקידוד כדי להירשם, ופרסים כספיים יוענקו על סמך ניקוד והערכה על ידי ConductorAI-Bugcrowd. עם זאת, פרטים נוספים על התרגיל השני טרם נחשפו.

תרגיל הבאונטי

לפי ה-DoD, המטרה הראשונה של תרגיל הבאונטי היא לזהות אזורי סיכון לא ידועים במודלים של שפה גדולה (LLMs), החל בצ'אטבוטים בקוד פתוח. עבודה זו יכולה, אם כן, לתמוך בהפחתה מתחשבת ובקרה של סיכונים כאלה.

קרייג מרטל, קצין ראשי בינה דיגיטלית ובינה מלאכותית, אמר כי התוצאה של תרומות אלו עשויה להשפיע באופן משמעותי על מדיניות ה-DoD AI ועל אימוץ העתיד. הוא גם הצהיר כי ה-CDAO עוקב באופן פעיל אחר תחום זה, בהתחשב בהתמקדות הנוכחית של המחלקה בסיכונים הקשורים ל-LLMs.

ה-DoD עשוי לשקול בנוסף את תוצאות ההטבות הללו לצורך מחקר נוסף, ניתוח, שיטות עבודה מומלצות והמלצות מדיניות. זה מדגיש את המחויבות של המחלקה להבטיח מערכות AI חסרות פניות בכל פעולותיה. שני יתרונות ההטיה מנוהלים על ידי חטיבת ה-CDAO Responsible AI (RAI). הם פיתחו והוציאו לפועל שותפויות עם ConductorAI-Bugcrowd ו-BiasBounty.AI ויעצו להם על ידי מנהלת השירותים הדיגיטליים של CDAO.

אסטרטגיות AI

ה-DoD חשף אסטרטגיה בנובמבר 2023 כדי לזרז את השילוב של יכולות AI מתקדמות. המוקד היה להבטיח עליונות מתמשכת של החלטות עבור חיילי ארה"ב בשדה הקרב בשנים הבאות.

עם זאת, האסטרטגיה החדשה, שנוצרה על ידי ה- Chief Digital and AI Office, עולה על 2018 אסטרטגיית AI ואסטרטגיית הנתונים המתוקנת משנת 2020. מסמכי היסוד הללו הציבו, כתוצאה מכך, את הקרקע לאסטרטגיית המחלקה לפריסת יכולות התומכות בינה מלאכותית.

התרגילים נערכים בנוסף לפיתוח גישות חדשות לביקורת אלגוריתמית ומודלים של בינה מלאכותית בשילוב אדום. זה יקל על ניסויים בטיפול בסיכונים שזוהו והבטחת שהמערכות אינן מוטות, בהתחשב בהקשר הפריסה המסוים שלהן.

ה-CDAO

ה-CDAO הוקם ביוני 2022 כדי לשלב ולייעל יכולות AI ברחבי ה-DoD. משרד זה אחראי על האצת האימוץ של נתונים, ניתוחים ובינה מלאכותית בתוך המחלקה וגם הגנה מפני איומים נוכחיים ומתעוררים.

באופן משמעותי, ה-DoD, עם תרגיל הטיית הבינה המלאכותית הראשון הזה, מהווה דוגמה לארגונים אחרים לתעדף מערכות AI חסרות פניות. צעד זה מבטיח ששימוש אתי בבינה מלאכותית לטובת החברה, לא רק שהיא מקדמת הוגנות. העולם כולו מחפש לצפות את תוצאות התרגיל הזה וכיצד הוא יעצב את מדיניות DoD עתידית בנוגע לבינה מלאכותית.

בול זמן:

עוד מ מטא ניוז