راهزنان کوانتومی چند مسلح: اکتشاف در مقابل بهره برداری هنگام یادگیری ویژگی های حالت های کوانتومی

گره منبع: 1590105

جوزپ لومبراس1ارکا هاپاسالو1، و مارکو تومایکل1,2

1مرکز فناوری های کوانتومی، دانشگاه ملی سنگاپور، سنگاپور
2گروه مهندسی برق و کامپیوتر، دانشکده مهندسی، دانشگاه ملی سنگاپور، سنگاپور

این مقاله را جالب می دانید یا می خواهید بحث کنید؟ SciRate را ذکر کنید یا در SciRate نظر بدهید.

چکیده

ما مطالعه مبادله بین اکتشاف و بهره‌برداری را در یادگیری آنلاین ویژگی‌های حالت‌های کوانتومی آغاز می‌کنیم. با توجه به دسترسی متوالی اوراکل به یک حالت کوانتومی ناشناخته، در هر دور، ما وظیفه داریم یک قابل مشاهده را از مجموعه ای از اقدامات با هدف به حداکثر رساندن ارزش انتظاری آن در حالت (پاداش) انتخاب کنیم. اطلاعات به دست آمده در مورد وضعیت ناشناخته از دورهای قبلی می تواند برای بهبود تدریجی انتخاب عمل مورد استفاده قرار گیرد، بنابراین شکاف بین پاداش و حداکثر پاداش قابل دستیابی با مجموعه اقدامات داده شده (پشیمانی) کاهش می یابد. ما مرزهای مختلف اطلاعاتی-نظری را در مورد پشیمانی تجمعی که یک یادگیرنده بهینه باید متحمل شود ارائه می‌کنیم و نشان می‌دهیم که حداقل به اندازه جذر تعداد دورهای بازی شده است. ما همچنین وابستگی پشیمانی تجمعی را به تعداد اقدامات موجود و بعد فضای زیربنایی بررسی می‌کنیم. علاوه بر این، ما استراتژی‌هایی را نشان می‌دهیم که برای راهزنانی با تعداد محدود بازو و حالت‌های ترکیبی عمومی بهینه هستند.

[محتوای جاسازی شده]

► داده های BibTeX

◄ مراجع

[1] T. Lattimore و C. Szepesvári. ” الگوریتم های راهزن ” . انتشارات دانشگاه کمبریج. (2020).
https://doi.org/​10.1017/​9781108571401

[2] اسلیوکینز. "آشنایی با راهزنان چند مسلح". مبانی و روندها در یادگیری ماشینی 12، 1-286 (2019).
https://doi.org/​10.1561/​2200000068

[3] S. Bubeck و N. Cesa-Bianchi. "تحلیل پشیمانی مشکلات راهزن چند مسلح تصادفی و غیر تصادفی". مبانی و روندها در یادگیری ماشینی 5، 1-122 (2012).
https://doi.org/​10.1561/​2200000024

[4] D. Bouneffouf، I. Rish، و C. Aggarwal. "بررسی کاربرد راهزنان چند مسلح و متنی". در سال 2020 کنگره IEEE در محاسبات تکاملی (CEC). صفحات 1-8. (2020).
https://doi.org/​10.1109/​CEC48606.2020.9185782

L. Tang، R. Rosales، A. Singh و D. Agarwal. "انتخاب فرمت تبلیغات خودکار از طریق راهزن های متنی". در مجموعه مقالات بیست و دومین کنفرانس بین المللی ACM در مدیریت اطلاعات و دانش. صفحه 22-1587. انجمن ماشین های محاسباتی (1594).
https://doi.org/​10.1145/​2505515.2514700

[6] M. Cohen، I. Lobel، و R. Paes Leme. "قیمت گذاری پویا مبتنی بر ویژگی". علوم مدیریت 66، 4921-4943 (2020).
https://doi.org/​10.1287/​mnsc.2019.3485

[7] دبلیو تامپسون. "در این احتمال که یک احتمال مجهول از احتمال دیگر با توجه به شواهد دو نمونه فراتر رود." Biometrika 25, 285-294 (1933).
https://doi.org/​10.1093/​biomet/​25.3-4.285

[8] اچ رابینز. "برخی از جنبه های طراحی متوالی آزمایش ها". بولتن انجمن ریاضی آمریکا 58، 527-535 (1952).
https:/​/​doi.org/​10.1090/​S0002-9904-1952-09620-8

[9] تی ال لای و اچ رابینز. "قوانین تخصیص تطبیقی ​​کارآمد مجانبی". پیشرفت در ریاضیات کاربردی 6، 4-22 (1985).
https:/​/​doi.org/​10.1016/​0196-8858(85)90002-8

[10] P. Auer، N. Cesa-Bianchi و P. Fischer. "تحلیل زمان محدود مسئله راهزن چند مسلح". ماخ فرا گرفتن. 47, 235-256 (2002).
https://doi.org/​10.1023/​A:1013689704352

[11] B. Casalé، G. Di Molfetta، H. Kadri، و L. Ralaivola. "راهزنان کوانتومی". کوانتوم ماخ هوشمند 2 (2020).
https:/​/​doi.org/​10.1007/​s42484-020-00024-8

[12] D. Wang، X. You، T. Li، و A. Childs. "الگوریتم های اکتشاف کوانتومی برای راهزنان چند مسلح". در مجموعه مقالات کنفرانس AAAI در مورد هوش مصنوعی. جلد 35، صفحات 10102–10110. (2021).

[13] P. Rebentrost، Y. Hamoudi، M. Ray، X. Wang، S. Yang، و M. Santha. الگوریتم‌های کوانتومی برای پوشش ریسک و یادگیری مدل‌ها فیزیک Rev. A 103, 012418 (2021).
https://doi.org/​10.1103/​PhysRevA.103.012418

[14] ای شامیر. "در مورد پیچیدگی بهینه سازی خطی راهزن". در مجموعه مقالات بیست و هشتمین کنفرانس تئوری یادگیری. جلد 28 از مجموعه مقالات تحقیقات یادگیری ماشین، صفحات 40-1523. PMLR (1551).

[15] P. Rusmevichientong و J. Tsitsiklis. "راهزنان با پارامترهای خطی". ریاضیات تحقیق در عملیات 35 (2008).
https://doi.org/​10.1287/​moor.1100.0446

[16] J. Barry، DT Barry و S. Aaronson. "فرایندهای تصمیم گیری مارکوف تا حدی قابل مشاهده کوانتومی". فیزیک Rev. A 90, 032311 (2014).
https://doi.org/​10.1103/​PhysRevA.90.032311

[17] M. Ying، Y. Feng و S. Ying. "سیاست های بهینه برای فرآیندهای تصمیم گیری مارکوف کوانتومی". مجله بین المللی اتوماسیون و محاسبات 18، 410-421 (2021).
https://doi.org/​10.1007/​s11633-021-1278-z

[18] M. Paris و J. Rehacek. "برآورد حالت کوانتومی". شرکت انتشارات Springer، ثبت شده است. (2010). چاپ 1.
https://doi.org/​10.1007/​b98673

[19] اس. آرونسون. "توموگرافی سایه ای حالات کوانتومی". در مجموعه مقالات پنجاهمین سمپوزیوم سالانه ACM SIGACT در نظریه محاسبات. صفحه 50-325. STOC 338. Association for Computing Machinery (2018).
https://doi.org/​10.1145/​3188745.3188802

[20] S. Aaronson، X. Chen، E. Hazan، S. Kale، و A. Nayak. "یادگیری آنلاین حالات کوانتومی". مجله مکانیک آماری: تئوری و آزمایش 2019 (2018).
https://doi.org/​10.1088/​1742-5468/​ab3988

[21] J. Bretagnolle و C. Huber. "Estimation des densités: risque minimax". Zeitschrift für Wahrscheinlichkeitstheorie und verwandte Gebiete 47, 119–137 (1979).
https://doi.org/​10.1007/​BF00535278

[22] M. Müller-Lennert، F. Dupuis، O. Szehr، S. Fehr و M. Tomamichel. "درباره آنتروپی های کوانتومی رنی: تعمیم جدید و برخی ویژگی ها". مجله فیزیک ریاضی 54, 122203 (2013).
https://doi.org/​10.1063/​1.4838856

[23] M. Wilde، A. Winter، و D. Yang. "مکالمه قوی برای ظرفیت کلاسیک کانال های درهم تنیدگی و هادامارد از طریق آنتروپی نسبی رنی ساندویچ شده". ارتباطات در فیزیک ریاضی 331، 593-622 (2014).
https://doi.org/​10.1007/​s00220-014-2122-x

[24] دبلیو هوفدینگ. "نابرابری های احتمال برای مجموع متغیرهای تصادفی محدود". مجله انجمن آماری آمریکا 58، 13-30 (1963).
https://doi.org/​10.1080/​01621459.1963.10500830

[25] P. Auer. "استفاده از مرزهای اطمینان برای مبادلات بهره برداری-اکتشاف". جی. ماخ. فرا گرفتن. Res. 3, 397-422 (2003).
https://doi.org/​10.5555/​944919.944941

[26] D. Varsha، T. Hayes، و S.Kakade. "بهینه سازی خطی تصادفی تحت بازخورد راهزن." در مجموعه مقالات بیست و یکمین کنفرانس تئوری یادگیری. صفحات 21-355. (366).

[27] P. Rusmevichientong و JN Tsitsiklis. "راهزنان با پارامترهای خطی". ریاضیات تحقیق در عملیات 35، 395-411 (2010).
https://doi.org/​10.1287/​moor.1100.0446

[28] ی. عباسی یادکوری، دی. پال و سیس. Szepesvári. "الگوریتم های بهبود یافته برای راهزن های تصادفی خطی". در پیشرفت در سیستم های پردازش اطلاعات عصبی. جلد 24. Curran Associates, Inc. (2011).

[29] تی ال لای. "تخصیص درمان تطبیقی ​​و مشکل راهزن چند مسلح". The Annals of Statistics 15, 1091 – 1114 (1987).
https://doi.org/​10.1214/​aos/​1176350495

[30] M. Guţă، J. Kahn، R. Kueng، و JA Tropp. "توموگرافی حالت سریع با محدوده خطای بهینه". مجله فیزیک الف: ریاضی و نظری 53، 204001 (2020).
https://doi.org/​10.1088/​1751-8121/​ab8111

[31] T. Lattimore و B. Hao. "بازیابی مرحله راهزن". در پیشرفت در سیستم های پردازش اطلاعات عصبی. جلد 34، صفحات 18801–18811. Curran Associates, Inc. (2021).

ذکر شده توسط

[1] Zongqi Wan، Zhijie Zhang، Tongyang Li، Jialin Zhang و Xiaoming Sun، "راهزنان کوانتومی چند مسلح و راهزنان خطی تصادفی از پشیمانی لگاریتمی لذت می برند" arXiv: 2205.14988.

[2] Xinyi Chen، Elad Hazan، Tongyang Li، Zhou Lu، Xinzhao Wang و Rui Yang، "یادگیری آنلاین تطبیقی ​​حالات کوانتومی"، arXiv: 2206.00220.

نقل قول های بالا از SAO/NASA Ads (آخرین به روز رسانی با موفقیت 2022-07-24 00:26:50). فهرست ممکن است ناقص باشد زیرا همه ناشران داده های استنادی مناسب و کاملی را ارائه نمی دهند.

On سرویس استناد شده توسط Crossref هیچ داده ای در مورد استناد به آثار یافت نشد (آخرین تلاش 2022-07-24 00:26:48).

تمبر زمان:

بیشتر از مجله کوانتومی