Minimização de risco estrutural para classificadores lineares quânticos

Minimização de risco estrutural para classificadores lineares quânticos

Nó Fonte: 1897697

Casper Gyurik1, Dyon Vreumingen, furgão1,2,3e Vedran Dunjko1,4

1LIACS, Universidade de Leiden, Niels Bohrweg 1, 2333 CA Leiden, Holanda
2QuSoft, Centrum Wiskunde & Informatica (CWI), Science Park 123, 1098 XG Amsterdã, Holanda
3Instituto de Física, Universidade de Amsterdã, Science Park 904, 1098 XH Amsterdã, Holanda
4LEÃO, Universidade de Leiden, Niels Bohrweg 2, 2333 CA Leiden, Holanda

Acha este artigo interessante ou deseja discutir? Scite ou deixe um comentário no SciRate.

Sumário

Modelos de aprendizado de máquina quântica (QML) baseados em circuitos quânticos parametrizados são frequentemente destacados como candidatos para a “aplicação matadora” de curto prazo da computação quântica. No entanto, a compreensão do desempenho empírico e de generalização destes modelos ainda é incipiente. Neste artigo, estudamos como equilibrar a precisão do treinamento e o desempenho da generalização (também chamado de minimização de risco estrutural) para dois modelos QML proeminentes introduzidos por Havlíček et al. [1], e Schuld e Killoran [2]. Em primeiro lugar, utilizando relações com modelos clássicos bem compreendidos, provamos que dois parâmetros do modelo – ou seja, a dimensão da soma das imagens e a norma de Frobenius dos observáveis ​​utilizados pelo modelo – controlam de perto a complexidade dos modelos e, portanto, o seu desempenho de generalização . Em segundo lugar, utilizando ideias inspiradas na tomografia de processo, provamos que estes parâmetros do modelo também controlam de perto a capacidade dos modelos de capturar correlações em conjuntos de exemplos de treinamento. Em resumo, nossos resultados dão origem a novas opções para minimização de risco estrutural para modelos QML.

► dados BibTeX

► Referências

[1] Vojtěch Havlíček, Antonio D Córcoles, Kristan Temme, Aram W Harrow, Abhinav Kandala, Jerry M Chow e Jay M Gambetta. “Aprendizagem supervisionada com espaços de recursos aprimorados quântica”. Natureza 567 (2019). arXiv:1804.11326.
https:/​/​doi.org/​10.1038/​s41586-019-0980-2
arXiv: 1804.11326

[2] Maria Schuld e Nathan Killoran. “Aprendizado de máquina quântica em espaços de Hilbert”. Cartas de revisão física 122 (2019). arXiv:1803.07128.
https: / / doi.org/ 10.1103 / PhysRevLett.122.040504
arXiv: 1803.07128

[3] Frank Arute, Kunal Arya, Ryan Babbush, Dave Bacon, Joseph C Bardin, Rami Barends, Rupak Biswas, Sergio Boixo, Fernando GSL Brandão, David A Buell, et al. “Supremacia quântica usando um processador supercondutor programável”. Natureza 574 (2019). arXiv:1910.11333.
https:/​/​doi.org/​10.1038/​s41586-019-1666-5
arXiv: 1910.11333

[4] John Preskill. “Computação quântica na era NISQ e além”. Quântico 2 (2018). arXiv:1801.00862.
https:/​/​doi.org/​10.22331/​q-2018-08-06-79
arXiv: 1801.00862

[5] Marco Cerezo, Andrew Arrasmith, Ryan Babbush, Simon C Benjamin, Suguru Endo, Keisuke Fujii, Jarrod R McClean, Kosuke Mitarai, Xiao Yuan, Lukasz Cincio, et al. “Algoritmos quânticos variacionais”. Nature Reviews Física 3 (2021). arXiv:2012.09265.
https:/​/​doi.org/​10.1038/​s42254-021-00348-9
arXiv: 2012.09265

[6] Jarrod R McClean, Jonathan Romero, Ryan Babbush e Alán Aspuru-Guzik. “A teoria dos algoritmos quânticos-clássicos híbridos variacionais”. Novo Jornal de Física 18 (2016). arXiv:1509.04279.
https:/​/​doi.org/​10.1088/​1367-2630/​18/​2/​023023
arXiv: 1509.04279

[7] Abhinav Kandala, Antonio Mezzacapo, Kristan Temme, Maika Takita, Markus Brink, Jerry M Chow e Jay M Gambetta. “Resolvedor quântico variacional com eficiência de hardware para pequenas moléculas e ímãs quânticos”. Natureza 549 (2017). arXiv:1704.05018.
https: / / doi.org/ 10.1038 / nature23879
arXiv: 1704.05018

[8] Peter JJ O'Malley, Ryan Babbush, Ian D Kivlichan, Jonathan Romero, Jarrod R McClean, Rami Barends, Julian Kelly, Pedram Roushan, Andrew Tranter, Nan Ding, e outros. “Simulação quântica escalável de energias moleculares”. Revisão Física X 6 (2016). arXiv:1512.06860.
https: / / doi.org/ 10.1103 / PhysRevX.6.031007
arXiv: 1512.06860

[9] Edward Farhi, Jeffrey Goldstone e Sam Gutmann. “Um algoritmo de otimização aproximada quântica” (2014). arXiv:1411.4028.
arXiv: 1411.4028

[10] Marcello Benedetti, Erika Lloyd, Stefan Sack e Mattia Fiorentini. “Circuitos quânticos parametrizados como modelos de aprendizado de máquina”. Ciência e Tecnologia Quântica 4 (2019). arXiv:1906.07682.
https:/​/​doi.org/​10.1088/​2058-9565/​ab4eb5
arXiv: 1906.07682

[11] Barbara M Terhal e David P DiVincenzo. “Computação quântica adaptativa, circuitos quânticos de profundidade constante e jogos de Arthur-Merlin”. Informação Quântica e Computação 4 (2004). arXiv:quant-ph/​0205133.
https://​/​doi.org/​10.48550/​arXiv.quant-ph/​0205133
arXiv: quant-ph / 0205133

[12] Michael J Bremner, Richard Jozsa e Dan J Shepherd. “A simulação clássica de cálculos quânticos comutados implica o colapso da hierarquia polinomial”. Anais da Royal Society A: Ciências Matemáticas, Físicas e de Engenharia 467 (2011). arXiv:1005.1407.
https: / / doi.org/ 10.1098 / rspa.2010.0301
arXiv: 1005.1407

[13] Edward Grant, Marcello Benedetti, Shuxiang Cao, Andrew Hallam, Joshua Lockhart, Vid Stojevic, Andrew G Green e Simone Severini. “Classificadores quânticos hierárquicos”. npj Informação Quântica 4 (2018). arXiv:1804.03680.
https:/​/​doi.org/​10.1038/​s41534-018-0116-9
arXiv: 1804.03680

[14] Diego Ristè, Marcus P Da Silva, Colm A Ryan, Andrew W Cross, Antonio D Córcoles, John A Smolin, Jay M Gambetta, Jerry M Chow e Blake R Johnson. “Demonstração de vantagem quântica em aprendizado de máquina”. npj Informação Quântica 3 (2017). arXiv:1512.06069.
https:/​/​doi.org/​10.1038/​s41534-017-0017-3
arXiv: 1512.06069

[15] Mehryar Mohri, Afshin Rostamizadeh e Ameet Talwalkar. “Fundamentos do aprendizado de máquina”. Imprensa do MIT. (2018).

[16] Peter L Bartlett. “A complexidade da amostra de classificação de padrões com redes neurais: o tamanho dos pesos é mais importante que o tamanho da rede”. Transações IEEE sobre Teoria da Informação 44 (1998).
https: / / doi.org/ 10.1109 / 18.661502

[17] Maria Schuld. “Modelos de aprendizado de máquina quântica supervisionados são métodos de kernel” (2021). arXiv:2101.11020.
arXiv: 2101.11020

[18] Matthias C Caro e Ishaun Datta. “Pseudodimensão de circuitos quânticos”. Inteligência de Máquina Quântica 2 (2020). arXiv:2002.01490.
https:/​/​doi.org/​10.1007/​s42484-020-00027-5
arXiv: 2002.01490

[19] Kaifeng Bu, Dax Enshan Koh, Lu Li, Qingxian Luo e Yaobo Zhang. “Sobre a complexidade estatística dos circuitos quânticos” (2021). arXiv:2101.06154.
https: / / doi.org/ 10.1103 / PhysRevA.105.062431
arXiv: 2101.06154

[20] Kaifeng Bu, Dax Enshan Koh, Lu Li, Qingxian Luo e Yaobo Zhang. “Efeitos dos recursos quânticos na complexidade estatística dos circuitos quânticos” (2021). arXiv:2102.03282.
arXiv: 2102.03282

[21] Kaifeng Bu, Dax Enshan Koh, Lu Li, Qingxian Luo e Yaobo Zhang. “Complexidade Rademacher de circuitos quânticos ruidosos” (2021). arXiv:2103.03139.
arXiv: 2103.03139

[22] Amira Abbas, David Sutter, Christa Zoufal, Aurélien Lucchi, Alessio Figalli e Stefan Woerner. “O poder das redes neurais quânticas”. Ciência Computacional da Natureza 1 (2021). arXiv:2011.00027.
https:/​/​doi.org/​10.1038/​s43588-021-00084-1
arXiv: 2011.00027

[23] Yuxuan Du, Zhuozhuo Tu, Xiao Yuan e Dacheng Tao. “Medida eficiente para a expressividade de algoritmos quânticos variacionais”. Cartas de Revisão Física 128 (2022). arXiv:2104.09961.
https: / / doi.org/ 10.1103 / PhysRevLett.128.080506
arXiv: 2104.09961

[24] Leonardo Banchi, Jason Pereira e Stefano Pirandola. “Generalização no aprendizado de máquina quântica: um ponto de vista da informação quântica”. PRX Quantum 2 (2021). arXiv:2102.08991.
https: / / doi.org/ 10.1103 / PRXQuantum.2.040321
arXiv: 2102.08991

[25] Hsin-Yuan Huang, Michael Broughton, Masoud Mohseni, Ryan Babbush, Sergio Boixo, Hartmut Neven e Jarrod R McClean. “Poder dos dados no aprendizado de máquina quântica”. Comunicações da natureza 12 (2021). arXiv:2011.01938.
https:/​/​doi.org/​10.1038/​s41467-021-22539-9
arXiv: 2011.01938

[26] Yunchao Liu, Srinivasan Arunachalam e Kristan Temme. “Uma aceleração quântica rigorosa e robusta em aprendizado de máquina supervisionado”. Física da Natureza 17, 1013–1017 (2021). arXiv:2010.02174.
https: / / doi.org/ 10.1038 / s41567-021-01287-z
arXiv: 2010.02174

[27] Bernhard Schölkopf, Alexander J Smola, Francis Bach, et al. “Aprendendo com kernels: suporte a máquinas de vetores, regularização, otimização e muito mais”. Imprensa do MIT. (2002).
https: / / doi.org/ 10.7551 / mitpress / 4175.001.0001

[28] Vladimir N Vapnik e A Ya Chervonenkis. “Sobre a convergência uniforme das frequências relativas dos eventos às suas probabilidades”. Em Medidas de complexidade. Springer (2015).
https:/​/​doi.org/​10.1007/​978-3-319-21852-6_3

[29] Michael J Kearns e Robert E Schapire. “Aprendizagem eficiente e livre de distribuição de conceitos probabilísticos”. Jornal de Ciências da Computação e Sistemas 48 (1994).
https:/​/​doi.org/​10.1016/​S0022-0000(05)80062-5

[30] Michael M Wolf. “Fundamentos matemáticos da aprendizagem supervisionada”. https://www-m5.ma.tum.de/​foswiki/​pub/​M5/​Allgemeines/​MA4801_2020S/​ML_notes_main.pdf (2020).
https://www-m5.ma.tum.de/​foswiki/​pub/​M5/​Allgemeines/​MA4801_2020S/​ML_notes_main.pdf

[31] Dyon van Vreumingen. “Aprendizagem espacial de características quânticas: caracterização e possíveis vantagens”. Tese de mestrado. Universidade de Leiden. (2020).

[32] Jae-Eun Park, Brian Quanz, Steve Wood, Heather Higgins e Ray Harishankar. “Melhoria da aplicação prática para svm quântico: teoria à prática” (2020). arXiv:2012.07725.
arXiv: 2012.07725

[33] John Shawe-Taylor, Peter L. Bartlett, Robert C. Williamson e Martin Anthony. “Minimização do risco estrutural sobre hierarquias dependentes de dados”. Transações IEEE na Teoria da Informação (1998).
https: / / doi.org/ 10.1109 / 18.705570

[34] Martin Anthony e Peter L Bartlett. “Aprendizagem de funções por interpolação”. Combinatória, Probabilidade e Computação 9 (2000).
https: / / doi.org/ 10.1017 / S0963548300004247

[35] Peter L Bartlett e Philip M Long. “Predição, aprendizagem, convergência uniforme e dimensões sensíveis à escala”. Jornal de Ciências da Computação e Sistemas 56 (1998).
https: / / doi.org/ 10.1006 / jcss.1997.1557

[36] Scott Aaronson. “A capacidade de aprendizagem dos estados quânticos”. Anais da Royal Society A: Ciências Matemáticas, Físicas e de Engenharia 463 (2007). arXiv:quant-ph/​0608142.
https: / / doi.org/ 10.1098 / rspa.2007.0113
arXiv: quant-ph / 0608142

Citado por

[1] Matthias C. Caro, Hsin-Yuan Huang, M. Cerezo, Kunal Sharma, Andrew Sornborger, Lukasz Cincio e Patrick J. Coles, “Generalização em aprendizado de máquina quântica a partir de poucos dados de treinamento”, Comunicações da Natureza 13, 4919 (2022).

[2] Matthias C. Caro, Hsin-Yuan Huang, Nicholas Ezzell, Joe Gibbs, Andrew T. Sornborger, Lukasz Cincio, Patrick J. Coles e Zoë Holmes, “Generalização fora de distribuição para aprender dinâmica quântica”, arXiv: 2204.10268.

[3] Yuxuan Du, Min-Hsiu Hsieh, Tongliang Liu, Shan You e Dacheng Tao, “Aprendebilidade de Redes Neurais Quânticas”, PRX Quantum 2 4, 040337 (2021).

[4] Joe Gibbs, Zoë Holmes, Matthias C. Caro, Nicholas Ezzell, Hsin-Yuan Huang, Lukasz Cincio, Andrew T. Sornborger e Patrick J. Coles, “Simulação dinâmica via aprendizado de máquina quântica com generalização comprovável”, arXiv: 2204.10269.

[5] Sofiene Jerbi, Lukas J. Fiderer, Hendrik Poulsen Nautrup, Jonas M. Kübler, Hans J. Briegel e Vedran Dunjko, “Aprendizagem de máquina quântica além dos métodos do kernel”, arXiv: 2110.13162.

[6] Matthias C. Caro, Elies Gil-Fuster, Johannes Jakob Meyer, Jens Eisert e Ryan Sweke, “Limites de generalização dependentes de codificação para circuitos quânticos parametrizados”, arXiv: 2106.03880.

[7] Supanut Thanasilp, Samson Wang, M. Cerezo e Zoë Holmes, “Concentração exponencial e intreinabilidade em métodos de kernel quântico”, arXiv: 2208.11060.

[8] Masahiro Kobayashi, Kohei Nakaji e Naoki Yamamoto, “Overfitting no aprendizado de máquina quântica e abandono emaranhado”, arXiv: 2205.11446.

[9] Brian Coyle, “Aplicações de aprendizado de máquina para computadores quânticos de escala intermediária ruidosa”, arXiv: 2205.09414.

[10] Evan Peters e Maria Schuld, “Generalização apesar do overfitting em modelos quânticos de aprendizado de máquina”, arXiv: 2209.05523.

[11] Marco Fanizza, Yihui Quek e Matteo Rosati, “Aprendendo processos quânticos sem controle de entrada”, arXiv: 2211.05005.

[12] Dylan Herman, Rudy Raymond, Muyuan Li, Nicolas Robles, Antonio Mezzacapo e Marco Pistoia, “Expressividade do aprendizado de máquina quântico variacional no cubo booleano”, arXiv: 2204.05286.

[13] Yuxuan Du, Min-Hsiu Hsieh, Tongliang Liu, Shan You e Dacheng Tao, “Erratum: Learnability of Quantum Neural Networks [PRX QUANTUM 2, 040337 (2021)]”, PRX Quantum 3 3, 030901 (2022).

[14] Chih-Chieh Chen, Masaru Sogabe, Kodai Shiba, Katsuyoshi Sakamoto e Tomah Sogabe, “Limites de dimensão geral Vapnik-Chervonenkis para aprendizagem de circuitos quânticos”, Jornal de Física: Complexidade 3 4, 045007 (2022).

[15] Yuxuan Du, Yibo Yang, Dacheng Tao e Min-Hsiu Hsieh, “Desmistificar o poder dependente do problema das redes neurais quânticas na classificação multiclasse”, arXiv: 2301.01597.

As citações acima são de SAO / NASA ADS (última atualização com êxito 2023-01-15 10:53:14). A lista pode estar incompleta, pois nem todos os editores fornecem dados de citação adequados e completos.

On Serviço citado por Crossref nenhum dado sobre a citação de trabalhos foi encontrado (última tentativa 2023-01-15 10:53:12).

Carimbo de hora:

Mais de Diário Quântico