মাল্টি-আর্মড কোয়ান্টাম দস্যু: কোয়ান্টাম স্টেটের বৈশিষ্ট্য শেখার সময় অনুসন্ধান বনাম শোষণ

উত্স নোড: 1590105

জোসেপ লুম্বেরাস1, এরক্কা হাপাসালো1, এবং মার্কো টমামিচেল1,2

1সেন্টার ফর কোয়ান্টাম টেকনোলজিস, ন্যাশনাল ইউনিভার্সিটি অফ সিঙ্গাপুর, সিঙ্গাপুর
2ইলেকট্রিক্যাল অ্যান্ড কম্পিউটার ইঞ্জিনিয়ারিং বিভাগ, প্রকৌশল অনুষদ, সিঙ্গাপুর জাতীয় বিশ্ববিদ্যালয়, সিঙ্গাপুর

এই কাগজ আকর্ষণীয় খুঁজুন বা আলোচনা করতে চান? স্কাইটে বা স্কাইরেটে একটি মন্তব্য দিন.

বিমূর্ত

আমরা কোয়ান্টাম স্টেটের বৈশিষ্ট্যগুলির অনলাইন শিক্ষার মধ্যে অনুসন্ধান এবং শোষণের মধ্যে ট্রেডঅফের অধ্যয়ন শুরু করি। একটি অজানা কোয়ান্টাম রাজ্যে অনুক্রমিক ওরাকল অ্যাক্সেস দেওয়া, প্রতিটি রাউন্ডে, আমাদেরকে রাজ্যের (পুরস্কার) প্রত্যাশার মান সর্বাধিক করার লক্ষ্যে কর্মের একটি সেট থেকে একটি পর্যবেক্ষণযোগ্য চয়ন করার দায়িত্ব দেওয়া হয়। পূর্ববর্তী রাউন্ডগুলি থেকে অজানা অবস্থা সম্পর্কে প্রাপ্ত তথ্যগুলি ক্রমান্বয়ে কর্মের পছন্দকে উন্নত করতে ব্যবহার করা যেতে পারে, এইভাবে প্রদত্ত অ্যাকশন সেট (অনুশোচনা) দিয়ে পুরষ্কার এবং সর্বাধিক পুরষ্কারের মধ্যে ব্যবধান হ্রাস করে। আমরা ক্রমবর্ধমান অনুশোচনার উপর বিভিন্ন তথ্য-তাত্ত্বিক নিম্ন সীমা প্রদান করি যা একজন সর্বোত্তম শিক্ষার্থীকে অবশ্যই বহন করতে হবে, এবং দেখাই যে এটি কমপক্ষে বাজানো রাউন্ডের সংখ্যার বর্গমূল হিসাবে স্কেল করে। আমরা উপলব্ধ কর্মের সংখ্যা এবং অন্তর্নিহিত স্থানের মাত্রার উপর ক্রমবর্ধমান অনুশোচনার নির্ভরতাও তদন্ত করি। অধিকন্তু, আমরা এমন কৌশলগুলি প্রদর্শন করি যা সীমিত সংখ্যক অস্ত্র এবং সাধারণ মিশ্র অবস্থা সহ দস্যুদের জন্য সর্বোত্তম।

[এম্বেড করা সামগ্রী]

► বিবিটেক্স ডেটা

। তথ্যসূত্র

[1] T. Lattimore এবং C. Szepesvári. "দস্যু অ্যালগরিদম"। ক্যামব্রিজ ইউনিভার্সিটি প্রেস. (2020)।
https: / / doi.org/ 10.1017 / 9781108571401

[2] উঃ স্লিভকিন্স। "মাল্টি-আর্মড দস্যুদের ভূমিকা"। মেশিন লার্নিং এর ভিত্তি এবং প্রবণতা 12, 1–286 (2019)।
https: / / doi.org/ 10.1561 / 2200000068

[3] এস. বুবেক এবং এন. সেসা-বিয়ানচি। "স্টকাস্টিক এবং ননস্টোকাস্টিক মাল্টি-আর্মড দস্যু সমস্যার অনুশোচনা বিশ্লেষণ"। মেশিন লার্নিং এর ভিত্তি এবং প্রবণতা 5, 1–122 (2012)।
https: / / doi.org/ 10.1561 / 2200000024

[4] ডি. বাউনেফুফ, আই. রিশ এবং সি. আগরওয়াল। "মাল্টি-আর্মড এবং প্রাসঙ্গিক দস্যুদের অ্যাপ্লিকেশনের উপর সমীক্ষা"। 2020 সালে IEEE কংগ্রেস অন ইভোলিউশনারি কম্পিউটেশন (CEC)। পৃষ্ঠা 1-8। (2020)।
https://​/​doi.org/​10.1109/​CEC48606.2020.9185782

এল. ট্যাং, আর. রোজালেস, এ. সিং, এবং ডি. আগরওয়াল। "প্রসঙ্গিক দস্যুদের মাধ্যমে স্বয়ংক্রিয় বিজ্ঞাপন বিন্যাস নির্বাচন"। তথ্য ও জ্ঞান ব্যবস্থাপনার উপর 22 তম ACM আন্তর্জাতিক সম্মেলনের কার্যক্রমে। পৃষ্ঠা 1587-1594। অ্যাসোসিয়েশন ফর কম্পিউটিং মেশিনারি (2013)।
https: / / doi.org/ 10.1145 / 2505515.2514700

[6] এম. কোহেন, আই. লোবেল এবং আর. পেস লেমে। "বৈশিষ্ট্য-ভিত্তিক গতিশীল মূল্য"। ব্যবস্থাপনা বিজ্ঞান 66, 4921–4943 (2020)।
https://​doi.org/​10.1287/​mnsc.2019.3485

[7] ডব্লিউ থম্পসন। "দুটি নমুনার প্রমাণের পরিপ্রেক্ষিতে একটি অজানা সম্ভাবনা অন্যটিকে ছাড়িয়ে যাওয়ার সম্ভাবনার উপর"। বায়োমেট্রিকা 25, 285–294 (1933)।
https://​/​doi.org/​10.1093/​biomet/​25.3-4.285

[8] এইচ. রবিন্স। "পরীক্ষার অনুক্রমিক নকশার কিছু দিক"। আমেরিকান ম্যাথমেটিকাল সোসাইটির বুলেটিন 58, 527–535 (1952)।
https:/​/​doi.org/​10.1090/​S0002-9904-1952-09620-8

[9] টিএল লাই এবং এইচ. রবিন্স। "অসিম্পটটিকভাবে দক্ষ অভিযোজিত বরাদ্দ নিয়ম"। ফলিত গণিতে অগ্রগতি 6, 4-22 (1985)।
https:/​/​doi.org/​10.1016/​0196-8858(85)90002-8

[10] P. Auer, N. Cesa-Bianchi, এবং P. ফিশার। "মাল্টিআর্মড দস্যু সমস্যার সীমাবদ্ধ-সময় বিশ্লেষণ"। মাখ। শিখুন। 47, 235-256 (2002)।
https://​doi.org/​10.1023/​A:1013689704352

[11] B. Casale, G. Di Molfetta, H. Kadri, , এবং L. Ralaivola. "কোয়ান্টাম দস্যু"। কোয়ান্টাম মাক। বুদ্ধি। 2 (2020)।
https:/​/​doi.org/​10.1007/​s42484-020-00024-8

[12] D. Wang, X. You, T. Li, এবং A. Childs. "মাল্টি-আর্মড দস্যুদের জন্য কোয়ান্টাম অনুসন্ধান অ্যালগরিদম"। কৃত্রিম বুদ্ধিমত্তা সম্পর্কিত AAAI সম্মেলনের কার্যপ্রণালীতে। ভলিউম 35, পৃষ্ঠা 10102-10110। (2021)।

[13] P. Rebentrost, Y. Hamoudi, M. Ray, X. Wang, S. Yang, এবং M. Santha. "হেজিং এবং ইসিং মডেল শেখার জন্য কোয়ান্টাম অ্যালগরিদম"। ফিজ। Rev. A 103, 012418 (2021)।
https: / / doi.org/ 10.1103 / ফিজারিভা 103.012418

[14] ও. শামির। "দস্যু রৈখিক অপ্টিমাইজেশানের জটিলতার উপর"। লার্নিং থিওরির উপর 28তম সম্মেলনের কার্যপ্রণালীতে। প্রসিডিংস অফ মেশিন লার্নিং রিসার্চের ভলিউম 40, পৃষ্ঠা 1523-1551। PMLR (2015)।

[15] পি. রুসমেভিচিয়েন্টং এবং জে. সিটসিক্লিস। "লিনিয়ারলি প্যারামিটারাইজড দস্যু"। অপারেশন রিসার্চের গণিত 35 (2008)।
https://​doi.org/​10.1287/​moor.1100.0446

[16] জে. ব্যারি, ডিটি ব্যারি এবং এস. অ্যারনসন। "কোয়ান্টাম আংশিকভাবে পর্যবেক্ষণযোগ্য মার্কভ সিদ্ধান্ত প্রক্রিয়া"। ফিজ। Rev. A 90, 032311 (2014)।
https: / / doi.org/ 10.1103 / ফিজারিভা 90.032311

[17] এম. ইং, ওয়াই ফেং এবং এস. ইং। "কোয়ান্টাম মার্কভ সিদ্ধান্ত প্রক্রিয়ার জন্য সর্বোত্তম নীতি"। ইন্টারন্যাশনাল জার্নাল অফ অটোমেশন অ্যান্ড কম্পিউটিং 18, 410–421 (2021)।
https://​doi.org/​10.1007/​s11633-021-1278-z

[18] এম. প্যারিস এবং জে. রেহাসেক। "কোয়ান্টাম রাষ্ট্র অনুমান"। স্প্রিংগার পাবলিশিং কোম্পানি, ইনকর্পোরেটেড। (2010)। ১ম সংস্করণ।
https://​doi.org/​10.1007/​b98673

[19] এস. অ্যারনসন। "কোয়ান্টাম অবস্থার ছায়া টমোগ্রাফি"। কম্পিউটিং তত্ত্বের উপর 50 তম বার্ষিক ACM SIGACT সিম্পোজিয়ামের কার্যপ্রণালীতে। পৃষ্ঠা 325-338। STOC 2018. অ্যাসোসিয়েশন ফর কম্পিউটিং মেশিনারি (2018)।
https: / / doi.org/ 10.1145 / 3188745.3188802

[20] এস. অ্যারনসন, এক্স. চেন, ই. হাজান, এস. কালে, এবং এ. নায়ক। "কোয়ান্টাম অবস্থার অনলাইন শিক্ষা"। জার্নাল অফ স্ট্যাটিসটিক্যাল মেকানিক্স: থিওরি অ্যান্ড এক্সপেরিমেন্ট 2019 (2018)।
https://​doi.org/​10.1088/​1742-5468/​ab3988

[21] J. Bretagnolle এবং C. Huber. "আনুমানিক ঘনত্ব: ঝুঁকি মিনিম্যাক্স"। Zeitschrift für Wahrscheinlichkeitstheorie und verwandte Gebiete 47, 119–137 (1979)।
https: / / doi.org/ 10.1007 / BF00535278

[22] M. Müller-Lennert, F. Dupuis, O. Szehr, S. Fehr, এবং M. Tomamichel. "কোয়ান্টাম রেনি এনট্রপিস: একটি নতুন সাধারণীকরণ এবং কিছু বৈশিষ্ট্য"। জার্নাল অফ ম্যাথমেটিকাল ফিজিক্স 54, 122203 (2013)।
https: / / doi.org/ 10.1063 / 1.4838856

[23] এম. ওয়াইল্ড, এ. উইন্টার এবং ডি. ইয়াং। "স্যান্ডউইচড রেনি রিলেটিভ এনট্রপির মাধ্যমে এনট্যাঙ্গলমেন্ট-ব্রেকিং এবং হাদামার্ড চ্যানেলের ক্লাসিক্যাল ক্যাপাসিটির জন্য শক্তিশালী কথোপকথন"। গাণিতিক পদার্থবিদ্যায় যোগাযোগ 331, 593–622 (2014)।
https://​doi.org/​10.1007/​s00220-014-2122-x

[24] W. Hoeffding. "বাউন্ডেড এলোমেলো ভেরিয়েবলের যোগফলের জন্য সম্ভাব্যতা অসমতা"। আমেরিকান স্ট্যাটিস্টিক্যাল অ্যাসোসিয়েশনের জার্নাল 58, 13–30 (1963)।
https: / / doi.org/ 10.1080 / 01621459.1963.10500830

[25] P. Auer. "শোষণ-অন্বেষণ বাণিজ্য-অফের জন্য আস্থার সীমানা ব্যবহার করা"। জে. মাক। শিখুন। Res. 3, 397-422 (2003)।
https: / / doi.org/ 10.5555 / 944919.944941

[26] ডি. বর্ষা, টি. হেইস, এবং এস. কাকদে। "দস্যু প্রতিক্রিয়ার অধীনে স্টকাস্টিক লিনিয়ার অপ্টিমাইজেশান।" শেখার তত্ত্বের উপর 21 তম সম্মেলনের কার্যপ্রণালীতে। পৃষ্ঠা 355-366। (2008)।

[27] P. Rusmevichientong এবং JN Tsitsiklis. "লিনিয়ারলি প্যারামিটারাইজড দস্যু"। অপারেশন রিসার্চের গণিত 35, 395–411 (2010)।
https://​doi.org/​10.1287/​moor.1100.0446

[28] ওয়াই. আব্বাসি-ইয়াদকোরি, ডি. পাল, এবং সিএস। সেপেস্বারি "রৈখিক স্টোকাস্টিক দস্যুদের জন্য উন্নত অ্যালগরিদম"। নিউরাল ইনফরমেশন প্রসেসিং সিস্টেমে অগ্রগতি। ভলিউম 24. Curran Associates, Inc. (2011)।

[29] টিএল লাই। "অভিযোজিত চিকিত্সা বরাদ্দ এবং মাল্টি-আর্মড দস্যু সমস্যা"। পরিসংখ্যানের ইতিহাস 15, 1091 – 1114 (1987)।
https://​doi.org/​10.1214/​aos/​1176350495

[30] এম. গুতা, জে. কান, আর. কুয়েং, এবং জেএ ট্রপ। "অনুকূল ত্রুটি সীমার সাথে দ্রুত রাষ্ট্র টমোগ্রাফি"। পদার্থবিজ্ঞানের জার্নাল A: গাণিতিক এবং তাত্ত্বিক 53, 204001 (2020)।
https://​doi.org/​10.1088/​1751-8121/​ab8111

[31] T. Lattimore এবং B. Hao. "দস্যু পর্যায় পুনরুদ্ধার"। নিউরাল ইনফরমেশন প্রসেসিং সিস্টেমে অগ্রগতি। ভলিউম 34, পৃষ্ঠা 18801-18811। Curran Associates, Inc. (2021)।

দ্বারা উদ্ধৃত

[১] জোংকি ওয়ান, ঝিজি ঝাং, টংইয়াং লি, জিয়ালিন ঝাং, এবং জিয়াওমিং সান, "কোয়ান্টাম মাল্টি-আর্মড দস্যু এবং স্টোকাস্টিক লিনিয়ার দস্যু লগারিদমিক অনুশোচনা উপভোগ করেন", arXiv: 2205.14988.

[২] জিনি চেন, এলাদ হাজান, টংইয়াং লি, ঝৌ লু, জিনঝাও ওয়াং এবং রুই ইয়াং, "কোয়ান্টাম স্টেটসের অভিযোজিত অনলাইন শিক্ষা", arXiv: 2206.00220.

উপরের উদ্ধৃতিগুলি থেকে প্রাপ্ত এসএও / নাসার এডিএস (সর্বশেষে সফলভাবে 2022-07-24 00:26:50 আপডেট হয়েছে)। সমস্ত প্রকাশক উপযুক্ত এবং সম্পূর্ণ উদ্ধৃতি ডেটা সরবরাহ না করায় তালিকাটি অসম্পূর্ণ হতে পারে।

On ক্রসরেফ এর উদ্ধৃত পরিষেবা উদ্ধৃতি রচনার কোনও ডেটা পাওয়া যায় নি (শেষ চেষ্টা 2022-07-24 00:26:48)।

সময় স্ট্যাম্প:

থেকে আরো কোয়ান্টাম জার্নাল

কোয়ান্টাম কম্পিউটারে স্টেট স্যাম্পলিং এবং রিয়েল-টাইম ডায়নামিক্স থেকে থার্মাল অবজারভেবলের শক্তিশালী নিষ্কাশন

উত্স নোড: 2364943
সময় স্ট্যাম্প: নভেম্বর 3, 2023

কোয়ান্টাম মেকানিক্সে অ-রৈখিক সংশোধনের উপস্থিতিতে মহাকর্ষীয় মিথস্ক্রিয়াগুলির কোয়ান্টাম প্রকৃতির পরীক্ষায়

উত্স নোড: 2347675
সময় স্ট্যাম্প: অক্টোবর 25, 2023