שודדים קוונטיים רב-זרועיים: חקר מול ניצול בעת לימוד תכונות של מצבים קוונטיים

צומת המקור: 1590105

ג'וזף למבררס1, Erkka Haapasalo1, ומרקו טומיכל1,2

1המרכז לטכנולוגיות קוונטיות, האוניברסיטה הלאומית בסינגפור, סינגפור
2המחלקה להנדסת חשמל ומחשבים, הפקולטה להנדסה, האוניברסיטה הלאומית של סינגפור, סינגפור

מצא את העיתון הזה מעניין או רוצה לדון? סקייט או השאירו תגובה ב- SciRate.

תַקצִיר

אנו יוזמים את חקר הפערים בין חקר וניצול בלמידה מקוונת של מאפיינים של מצבים קוונטיים. בהינתן גישה רציפה של אורקל למצב קוונטי לא ידוע, בכל סבב, מוטל עלינו המשימה לבחור צפייה מתוך מערכת של פעולות שמטרתן למקסם את ערך הציפייה שלו על המצב (הפרס). ניתן להשתמש במידע שנרכש על המצב הלא ידוע מסבבים קודמים כדי לשפר בהדרגה את בחירת הפעולה, ובכך להקטין את הפער בין התגמול לתגמול המקסימלי שניתן להשיג עם ערכת הפעולות הנתונה (החרטה). אנו מספקים גבולות תחתונים תאורטיים שונים על החרטה המצטברת שעל לומד אופטימלי לספוג, ומראים כי היא משתנה לפחות כשורש הריבועי של מספר הסיבובים ששיחקו. אנו גם חוקרים את התלות של החרטה המצטברת במספר הפעולות הזמינות ובמימד המרחב הבסיסי. יתר על כן, אנו מציגים אסטרטגיות אופטימליות עבור שודדים עם מספר סופי של זרועות ומצבים מעורבים כלליים.

[תוכן מוטבע]

► נתוני BibTeX

► הפניות

[1] T. Latimore ו-C. Szepesvári. "אלגוריתמים של שודדים". הוצאת אוניברסיטת קיימברידג'. (2020).
https: / / doi.org/ 10.1017 / 9781108571401

[2] א' סליבקינס. "מבוא לשודדים רב-זרועיים". יסודות ומגמות בלמידת מכונה 12, 1–286 (2019).
https: / / doi.org/ 10.1561 / 2200000068

[3] S. Bubeck and N. Cesa-Bianchi. "ניתוח חרטה של ​​בעיות שודדים מרובי זרועות סטוכסטיות ולא סטוכסטיות". יסודות ומגמות בלמידת מכונה 5, 1–122 (2012).
https: / / doi.org/ 10.1561 / 2200000024

[4] ד' בונפוף, א' ריש וג' אגרוואל. "סקר על יישומים של שודדים רב-זרועיים והקשרים". בשנת 2020 קונגרס IEEE על חישוב אבולוציוני (CEC). עמודים 1-8. (2020).
https:/​/​doi.org/​10.1109/​CEC48606.2020.9185782

L. Tang, R. Rosales, A. Singh, and D. Agarwal. "בחירת פורמט מודעה אוטומטית באמצעות שודדים לפי הקשר". במסגרת הכנס הבינלאומי ה-22 של ACM לניהול מידע וידע. עמוד 1587–1594. האגודה למכונות מחשוב (2013).
https: / / doi.org/ 10.1145 / 2505515.2514700

[6] מ' כהן, א' לובל ור' פאס לם. "תמחור דינמי מבוסס תכונות". מדע הניהול 66, 4921–4943 (2020).
https: / / doi.org/ 10.1287 / mnsc.2019.3485

[7] וו. תומפסון. "על הסבירות שהסתברות לא ידועה אחת עולה על אחרת לאור העדויות של שתי דגימות". ביומטריקה 25, 285–294 (1933).
https:/​/​doi.org/​10.1093/​biomet/​25.3-4.285

[8] ה' רובינס. "כמה היבטים של עיצוב רציף של ניסויים". Bulletin of the American Mathematical Society 58, 527–535 (1952).
https:/​/​doi.org/​10.1090/​S0002-9904-1952-09620-8

[9] ת"ל לאי וה' רובינס. "כללי הקצאה אדפטיביים יעילים מבחינה אסימפטוטית". Advances in Applied Mathematics 6, 4–22 (1985).
https:/​/​doi.org/​10.1016/​0196-8858(85)90002-8

[10] פ' אור, נ' צ'זה-ביאנצ'י, ופ' פישר. "ניתוח זמן סופי של בעיית השודדים הרב-זרועיים". מאך. לִלמוֹד. 47, 235–256 (2002).
https: / / doi.org/ 10.1023 / A: 1013689704352

[11] B. Casalé, G. Di Molfetta, H. Kadri, and L. Ralaivola. "שודדים קוונטיים". קוונטים מאך. אינטל. 2 (2020).
https:/​/​doi.org/​10.1007/​s42484-020-00024-8

[12] D. Wang, X. You, T. Li, and A. Childs. "אלגוריתמים של חקר קוונטים לשודדים מרובי זרועות". בהליכי ועידת AAAI לבינה מלאכותית. כרך 35, עמודים 10102–10110. (2021).

[13] P. Rebentrost, Y. Hamodi, M. Ray, X. Wang, S. Yang, and M. Santha. "אלגוריתמים קוונטיים לגידור ולמידת מודלים של איסינג". פיזי. ר' א 103, 012418 (2021).
https: / / doi.org/ 10.1103 / PhysRevA.103.012418

[14] או' שמיר. "על המורכבות של אופטימיזציה ליניארית של השודד". בהליכי הכנס ה-28 בנושא תורת הלמידה. כרך 40 של Proceedings of Machine Learning Research, עמודים 1523–1551. PMLR (2015).

[15] פ' רוסמוויצ'ינטונג וג' ציציקליס. "שודדים בעלי פרמטרים לינאריים". מתמטיקה של חקר מבצעים 35 (2008).
https: / / doi.org/ 10.1287 / moor.1100.0446

[16] ג'יי בארי, די"ט בארי וס' אהרונסון. "תהליכי החלטות מרקוב הניתנים לצפייה חלקית קוונטית". פיזי. ר' א 90, 032311 (2014).
https: / / doi.org/ 10.1103 / PhysRevA.90.032311

[17] M. Ying, Y. Feng, ו-S. Ying. "מדיניות אופטימלית לתהליכי החלטות קוונטי מרקוב". International Journal of Automation and Computing 18, 410–421 (2021).
https: / / doi.org/ 10.1007 / s11633-021-1278-z

[18] מ' פריז וג'יי רחצ'ק. "הערכת מצב קוונטית". Springer Publishing Company, Incorporated. (2010). מהדורה 1.
https: / / doi.org/ 10.1007 / b98673

[19] ש' אהרונסון. "טומוגרפיית צללים של מצבים קוונטיים". בהליכים של סימפוזיון ACM SIGACT השנתי ה-50 על תורת המחשוב. עמ' 325–338. STOC 2018. האגודה למכונות מחשוב (2018).
https: / / doi.org/ 10.1145 / 3188745.3188802

[20] ש' אהרונסון, X. Chen, E. Hazan, S. Kale, and A. Nayak. "למידה מקוונת של מצבים קוונטיים". כתב עת למכניקה סטטיסטית: תיאוריה וניסוי 2019 (2018).
https: / / doi.org/ 10.1088 / 1742-5468 / ab3988

[21] J. Bretagnolle ו-C. Huber. "הערכה של צפיפות: סיכון מינימקס". Zeitschrift für Wahrscheinlichkeitstheorie und verwandte Gebiete 47, 119–137 (1979).
https: / / doi.org/ 10.1007 / BF00535278

[22] M. Müller-Lennert, F. Dupuis, O. Szehr, S. Fehr, and M. Tomamichel. "על אנטרופיות קוונטיות רני: הכללה חדשה וכמה מאפיינים". כתב עת לפיזיקה מתמטית 54, 122203 (2013).
https: / / doi.org/ 10.1063 / 1.4838856

[23] M. Wilde, A. Winter, and D. Yang. "שיחה חזקה ליכולת הקלאסית של שבירת הסתבכות וערוצי Hadamard באמצעות אנטרופיה יחסית של רני". תקשורת בפיזיקה מתמטית 331, 593–622 (2014).
https: / doi.org/â € ‹10.1007 / s00220-014-2122-x

[24] וו. הופדינג. "אי-שוויון בהסתברות לסכומים של משתנים אקראיים מוגבלים". Journal of the American Statistics Association 58, 13–30 (1963).
https: / / doi.org/ 10.1080 / 01621459.1963.10500830

[25] פ' אור. "שימוש בגבולות אמון עבור פשרות ניצול-חקירה". ג'יי מאך. לִלמוֹד. מילון 3, 397–422 (2003).
https: / / doi.org/ 10.5555 / 944919.944941

[26] ד' ורש''א, ט' הייז, וס' קקאדה. "אופטימיזציה ליניארית סטוכסטית תחת משוב שודד". בהליכי הכנס ה-21 לתורת הלמידה. עמודים 355–366. (2008).

[27] פ. רוסמוויצ'ינטונג וג'.נ. ציציקליס. "שודדים בעלי פרמטרים לינאריים". מתמטיקה של חקר מבצעים 35, 395–411 (2010).
https: / / doi.org/ 10.1287 / moor.1100.0446

[28] Y. Abbasi-Yadkori, D. Pál, and Cs. Szepesvári. "אלגוריתמים משופרים לשודדים סטוכסטיים ליניאריים". בהתקדמות במערכות עיבוד מידע עצבי. כרך 24. Curran Associates, Inc. (2011).

[29] ת"ל לאי. "הקצאת טיפול מותאם ובעיית השודדים הרב-זרועיים". The Annals of Statistics 15, 1091 – 1114 (1987).
https: / / doi.org/ 10.1214 / aos / 1176350495

[30] M. Guţă, J. Kahn, R. Kueng, ו-JA Tropp. "טומוגרפיית מצב מהיר עם גבולות שגיאה אופטימליים". Journal of Physics A: Mathematical and Theoretical 53, 204001 (2020).
https: / / doi.org/ 10.1088 / 1751-8121 / ab8111

[31] ט' לאטימור וב' האו. "שליפת שלב השודדים". בהתקדמות במערכות עיבוד מידע עצבי. כרך 34, עמודים 18801–18811. Curran Associates, Inc. (2021).

מצוטט על ידי

[1] Zongqi Wan, Zhijie Zhang, Tongyang Li, Jialin Zhang, ו-Xiaoming Sun, "שודדים רב-זרועיים קוונטיים ושודדים ליניאריים סטוכסטיים נהנים מחרטות לוגריתמיות", arXiv: 2205.14988.

[2] Xinyi Chen, Elad Hazan, Tongyang Li, Zhou Lu, Xinzhao Wang ו- Rui Yang, "למידה מקוונת אדפטיבית של מדינות קוונטיות", arXiv: 2206.00220.

הציטוטים לעיל הם מ- מודעות SAO / NASA (עודכן לאחרונה בהצלחה 2022-07-24 00:26:50). הרשימה עשויה להיות שלמה מכיוון שלא כל בעלי האתרים מספקים נתוני ציטוט ראויים ומלאים.

On השירות המוזכר של קרוסרף לא נמצאו נתונים על ציטוט עבודות (ניסיון אחרון 2022-07-24 00:26:48)

בול זמן:

עוד מ יומן קוונטים