Multi-armed Quantum Bandits: Exploration Versus Exploitation When Learning Properties Of Quantum States

بازنشر افلاطون

دنبال: 0

جوزپ لومبراس¹ارکا هاپاسالو¹، و مارکو تومایکل^1,2

¹مرکز فناوری های کوانتومی، دانشگاه ملی سنگاپور، سنگاپور
²گروه مهندسی برق و کامپیوتر، دانشکده مهندسی، دانشگاه ملی سنگاپور، سنگاپور

این مقاله را جالب می دانید یا می خواهید بحث کنید؟ SciRate را ذکر کنید یا در SciRate نظر بدهید.

چکیده

ما مطالعه مبادله بین اکتشاف و بهره‌برداری را در یادگیری آنلاین ویژگی‌های حالت‌های کوانتومی آغاز می‌کنیم. با توجه به دسترسی متوالی اوراکل به یک حالت کوانتومی ناشناخته، در هر دور، ما وظیفه داریم یک قابل مشاهده را از مجموعه ای از اقدامات با هدف به حداکثر رساندن ارزش انتظاری آن در حالت (پاداش) انتخاب کنیم. اطلاعات به دست آمده در مورد وضعیت ناشناخته از دورهای قبلی می تواند برای بهبود تدریجی انتخاب عمل مورد استفاده قرار گیرد، بنابراین شکاف بین پاداش و حداکثر پاداش قابل دستیابی با مجموعه اقدامات داده شده (پشیمانی) کاهش می یابد. ما مرزهای مختلف اطلاعاتی-نظری را در مورد پشیمانی تجمعی که یک یادگیرنده بهینه باید متحمل شود ارائه می‌کنیم و نشان می‌دهیم که حداقل به اندازه جذر تعداد دورهای بازی شده است. ما همچنین وابستگی پشیمانی تجمعی را به تعداد اقدامات موجود و بعد فضای زیربنایی بررسی می‌کنیم. علاوه بر این، ما استراتژی‌هایی را نشان می‌دهیم که برای راهزنانی با تعداد محدود بازو و حالت‌های ترکیبی عمومی بهینه هستند.

[محتوای جاسازی شده]

► داده های BibTeX

@article{Lumbreras2022multiarmedquantum، doi = {10.22331/q-2022-06-29-749}، url = {https://doi.org/10.22331/q-2022-06-29-749}، عنوان = {راهزنان کوانتومی چند مسلح: {E}کاوش در مقابل بهره‌برداری هنگام یادگیری ویژگی‌های حالات کوانتومی}، نویسنده = {Lumbreras، Josep and Haapasalo، Erkka and Tomamichel، Marco}، journal = {{کوانتوم}}، issn = {2521-327X}، ناشر = {{Verein zur F{“{o}}rderung des Open Access Publizierens in den Quantenwissenschaften}}، حجم = {6}، صفحات = {749}، ماه = ژوئن، سال = {2022} }

◄ مراجع

[1] T. Lattimore و C. Szepesvári. ” الگوریتم های راهزن ” . انتشارات دانشگاه کمبریج. (2020).
https://doi.org/10.1017/9781108571401

[2] اسلیوکینز. "آشنایی با راهزنان چند مسلح". مبانی و روندها در یادگیری ماشینی 12، 1-286 (2019).
https://doi.org/10.1561/2200000068

[3] S. Bubeck و N. Cesa-Bianchi. "تحلیل پشیمانی مشکلات راهزن چند مسلح تصادفی و غیر تصادفی". مبانی و روندها در یادگیری ماشینی 5، 1-122 (2012).
https://doi.org/10.1561/2200000024

[4] D. Bouneffouf، I. Rish، و C. Aggarwal. "بررسی کاربرد راهزنان چند مسلح و متنی". در سال 2020 کنگره IEEE در محاسبات تکاملی (CEC). صفحات 1-8. (2020).
https://doi.org/10.1109/CEC48606.2020.9185782

[5] L. Tang، R. Rosales، A. Singh و D. Agarwal. "انتخاب فرمت تبلیغات خودکار از طریق راهزن های متنی". در مجموعه مقالات بیست و دومین کنفرانس بین المللی ACM در مدیریت اطلاعات و دانش. صفحه 22-1587. انجمن ماشین های محاسباتی (1594).
https://doi.org/10.1145/2505515.2514700

[6] M. Cohen، I. Lobel، و R. Paes Leme. "قیمت گذاری پویا مبتنی بر ویژگی". علوم مدیریت 66، 4921-4943 (2020).
https://doi.org/10.1287/mnsc.2019.3485

[7] دبلیو تامپسون. "در این احتمال که یک احتمال مجهول از احتمال دیگر با توجه به شواهد دو نمونه فراتر رود." Biometrika 25, 285-294 (1933).
https://doi.org/10.1093/biomet/25.3-4.285

[8] اچ رابینز. "برخی از جنبه های طراحی متوالی آزمایش ها". بولتن انجمن ریاضی آمریکا 58، 527-535 (1952).
https://doi.org/10.1090/S0002-9904-1952-09620-8

[9] تی ال لای و اچ رابینز. "قوانین تخصیص تطبیقی کارآمد مجانبی". پیشرفت در ریاضیات کاربردی 6، 4-22 (1985).
https://doi.org/10.1016/0196-8858(85)90002-8

[10] P. Auer، N. Cesa-Bianchi و P. Fischer. "تحلیل زمان محدود مسئله راهزن چند مسلح". ماخ فرا گرفتن. 47, 235-256 (2002).
https://doi.org/10.1023/A:1013689704352

[11] B. Casalé، G. Di Molfetta، H. Kadri، و L. Ralaivola. "راهزنان کوانتومی". کوانتوم ماخ هوشمند 2 (2020).
https://doi.org/10.1007/s42484-020-00024-8

[12] D. Wang، X. You، T. Li، و A. Childs. "الگوریتم های اکتشاف کوانتومی برای راهزنان چند مسلح". در مجموعه مقالات کنفرانس AAAI در مورد هوش مصنوعی. جلد 35، صفحات 10102–10110. (2021).

[13] P. Rebentrost، Y. Hamoudi، M. Ray، X. Wang، S. Yang، و M. Santha. الگوریتم‌های کوانتومی برای پوشش ریسک و یادگیری مدل‌ها فیزیک Rev. A 103, 012418 (2021).
https://doi.org/10.1103/PhysRevA.103.012418

[14] ای شامیر. "در مورد پیچیدگی بهینه سازی خطی راهزن". در مجموعه مقالات بیست و هشتمین کنفرانس تئوری یادگیری. جلد 28 از مجموعه مقالات تحقیقات یادگیری ماشین، صفحات 40-1523. PMLR (1551).

[15] P. Rusmevichientong و J. Tsitsiklis. "راهزنان با پارامترهای خطی". ریاضیات تحقیق در عملیات 35 (2008).
https://doi.org/10.1287/moor.1100.0446

[16] J. Barry، DT Barry و S. Aaronson. "فرایندهای تصمیم گیری مارکوف تا حدی قابل مشاهده کوانتومی". فیزیک Rev. A 90, 032311 (2014).
https://doi.org/10.1103/PhysRevA.90.032311

[17] M. Ying، Y. Feng و S. Ying. "سیاست های بهینه برای فرآیندهای تصمیم گیری مارکوف کوانتومی". مجله بین المللی اتوماسیون و محاسبات 18، 410-421 (2021).
https://doi.org/10.1007/s11633-021-1278-z

[18] M. Paris و J. Rehacek. "برآورد حالت کوانتومی". شرکت انتشارات Springer، ثبت شده است. (2010). چاپ 1.
https://doi.org/10.1007/b98673

[19] اس. آرونسون. "توموگرافی سایه ای حالات کوانتومی". در مجموعه مقالات پنجاهمین سمپوزیوم سالانه ACM SIGACT در نظریه محاسبات. صفحه 50-325. STOC 338. Association for Computing Machinery (2018).
https://doi.org/10.1145/3188745.3188802

[20] S. Aaronson، X. Chen، E. Hazan، S. Kale، و A. Nayak. "یادگیری آنلاین حالات کوانتومی". مجله مکانیک آماری: تئوری و آزمایش 2019 (2018).
https://doi.org/10.1088/1742-5468/ab3988

[21] J. Bretagnolle و C. Huber. "Estimation des densités: risque minimax". Zeitschrift für Wahrscheinlichkeitstheorie und verwandte Gebiete 47, 119–137 (1979).
https://doi.org/10.1007/BF00535278

[22] M. Müller-Lennert، F. Dupuis، O. Szehr، S. Fehr و M. Tomamichel. "درباره آنتروپی های کوانتومی رنی: تعمیم جدید و برخی ویژگی ها". مجله فیزیک ریاضی 54, 122203 (2013).
https://doi.org/10.1063/1.4838856

[23] M. Wilde، A. Winter، و D. Yang. "مکالمه قوی برای ظرفیت کلاسیک کانال های درهم تنیدگی و هادامارد از طریق آنتروپی نسبی رنی ساندویچ شده". ارتباطات در فیزیک ریاضی 331، 593-622 (2014).
https://doi.org/10.1007/s00220-014-2122-x

[24] دبلیو هوفدینگ. "نابرابری های احتمال برای مجموع متغیرهای تصادفی محدود". مجله انجمن آماری آمریکا 58، 13-30 (1963).
https://doi.org/10.1080/01621459.1963.10500830

[25] P. Auer. "استفاده از مرزهای اطمینان برای مبادلات بهره برداری-اکتشاف". جی. ماخ. فرا گرفتن. Res. 3, 397-422 (2003).
https://doi.org/10.5555/944919.944941

[26] D. Varsha، T. Hayes، و S.Kakade. "بهینه سازی خطی تصادفی تحت بازخورد راهزن." در مجموعه مقالات بیست و یکمین کنفرانس تئوری یادگیری. صفحات 21-355. (366).

[27] P. Rusmevichientong و JN Tsitsiklis. "راهزنان با پارامترهای خطی". ریاضیات تحقیق در عملیات 35، 395-411 (2010).
https://doi.org/10.1287/moor.1100.0446

[28] ی. عباسی یادکوری، دی. پال و سیس. Szepesvári. "الگوریتم های بهبود یافته برای راهزن های تصادفی خطی". در پیشرفت در سیستم های پردازش اطلاعات عصبی. جلد 24. Curran Associates, Inc. (2011).

[29] تی ال لای. "تخصیص درمان تطبیقی و مشکل راهزن چند مسلح". The Annals of Statistics 15, 1091 – 1114 (1987).
https://doi.org/10.1214/aos/1176350495

[30] M. Guţă، J. Kahn، R. Kueng، و JA Tropp. "توموگرافی حالت سریع با محدوده خطای بهینه". مجله فیزیک الف: ریاضی و نظری 53، 204001 (2020).
https://doi.org/10.1088/1751-8121/ab8111

[31] T. Lattimore و B. Hao. "بازیابی مرحله راهزن". در پیشرفت در سیستم های پردازش اطلاعات عصبی. جلد 34، صفحات 18801–18811. Curran Associates, Inc. (2021).

ذکر شده توسط

[1] Zongqi Wan، Zhijie Zhang، Tongyang Li، Jialin Zhang و Xiaoming Sun، "راهزنان کوانتومی چند مسلح و راهزنان خطی تصادفی از پشیمانی لگاریتمی لذت می برند" arXiv: 2205.14988.

[2] Xinyi Chen، Elad Hazan، Tongyang Li، Zhou Lu، Xinzhao Wang و Rui Yang، "یادگیری آنلاین تطبیقی حالات کوانتومی"، arXiv: 2206.00220.

نقل قول های بالا از SAO/NASA Ads (آخرین به روز رسانی با موفقیت 2022-07-24 00:26:50). فهرست ممکن است ناقص باشد زیرا همه ناشران داده های استنادی مناسب و کاملی را ارائه نمی دهند.

On سرویس استناد شده توسط Crossref هیچ داده ای در مورد استناد به آثار یافت نشد (آخرین تلاش 2022-07-24 00:26:48).

این مقاله در Quantum تحت عنوان منتشر شده است Creative Commons Attribution 4.0 International (CC BY 4.0) مجوز. حق چاپ نزد دارندگان حق چاپ اصلی مانند نویسندگان یا مؤسسات آنها باقی می ماند.

تمبر زمان: ژوئن 29، 2022ژوئیه 23، 2022

تمبر زمان: سپتامبر 8، 2022

راهزنان کوانتومی چند مسلح: اکتشاف در مقابل بهره برداری هنگام یادگیری ویژگی های حالت های کوانتومی

بازنشر افلاطون

چکیده

► داده های BibTeX

◄ مراجع

ذکر شده توسط

بیشتر از مجله کوانتومی

تصفیه درهم تنیدگی با کدهای LDPC کوانتومی و رمزگشایی تکراری

مقادیر متغیر پنهان محلی بدون رویه های بهینه سازی

شبیه‌سازی دقیق تئوری‌های گیج و سیستم‌های بوزونی

رمزگذاری دامنه کوانتومی کارآمد توابع چند جمله ای

طراحی کانال های کوانتومی القا شده توسط دروازه های قطری

محدود کردن حداقل زمان اندازه گیری کوانتومی

توموگرافی فرآیند کوانتومی حداقل مربعات پیش بینی شده

سوئیچ کوانتومی به طور منحصر به فردی با عملکرد آن بر روی عملیات واحد تعریف می شود

در اینجا SU(N) می آید: دروازه ها و گرادیان های کوانتومی چند متغیره

رویکرد گرادیان خط مشی برای تدوین مدارهای کوانتومی متغیر

درباره‌ ما

جستجوی عمودی و هوش مصنوعی

سکو

همیشه در ارتباط ماندن

حساب