数学2.0:機械学習の基本的な重要性

ソースノード: 1072199

数学2.0:機械学習の基本的な重要性

タグ: AI, 機械学習, 数学

機械学習は、コンピューターをプログラムするための単なる別の方法ではありません。 それは私たちが世界を理解する方法の根本的な変化を表しています。 数学2.0です。


By クロースホーン博士、AIの研究者および講師

画像
 
一部の人々は、特に現在のデータサイエンスの誇大宣伝の間、機械学習を単なる別のアルゴリズムと見なしています。 これはデジタル化の一部であり、自動化に役立ちます。それだけです。 残念ながら、この解釈は完全に要点を見逃しています。 機械学習は、コンピューターをプログラムするための単なる別の方法ではありません。 それは私たちが世界を理解する方法の根本的な変化を表しています。 数学2.0です。

科学理論は、世界のモデルを構築することにより、世界を理解するのに役立ちます。 それらの有用性は、私たちが将来について予測することを可能にするという事実から生じています。 歴史のこの時点まで、私たちの世界で最も洗練されたモデルは数学の言語で書かれていました(数学1.0)。 これは今変わりつつあります。 次世代の科学モデルは、機械学習モデル(おそらくニューラルネットワーク):Math2.0です。

その理由は、機械学習モデルを使用すると、より複雑な現象を記述できるためです。 数学的理論で説明できる関数の関係は非常に限られています。たとえば、XNUMX万ピクセルの値を犬や猫の概念にマッピングする関数は、現代の深層学習で非常にうまく機能します。

2003年に博士号を取得しました。 物理学では、ドイツの高エネルギー物理学センターであるDESY(当時、Googleは世界最大のデータセットのXNUMXつでした)で記録された数ペタバイトのデータをスキャンする新しいタイプの素粒子の兆候を探していました。わずかXNUMX年前に設立されました)。

XNUMXつの変数のカットを変更した後、他のすべての変数を再検討する必要があったため、観測変数に独立した選択を適用する通常のプロセスは少し面倒であることがわかりました。 だから私たちは考えました:これを自動化できますか? 実際、私たちが思いついた単純なアルゴリズムにより、選択を自動的に最適化することができました。 その後、コンピューターサイエンティストには、私たちが行っていることを表す用語があることがわかりました。彼らはそれを機械学習と呼んでいました。

すぐに、この新しいアプローチは、科学的なワークフローを調整する必要があることを意味することが明らかになりました。 物理学の知識をすべて使用して信号対バックグラウンド比を上げる代わりに、最小限のクリーンアップカットのみを実行し、アルゴリズムに作業を任せる方がはるかに優れていました。 その後、ディープラーニングの出現により、CERNの研究者は、物理量の再構築でさえ逆効果であることに気づきました。 生の測定値が与えられただけで、ディープラーニングは手作業で選択を行う物理学者よりも優れたパフォーマンスを発揮します(下の図を参照)。 したがって、Math 2.0では、Math1.0に基づくモデルでは表示できないパーティクルを表示できます。

図1
図1:低レベルの機能のみ(黒)と物理学者が通常使用する高レベルの機能(赤)に基づく深層学習アルゴリズムのパフォーマンスの比較。 (2014年のネイチャーペーパーの参考文献1から抜粋した図。)

 

人々は、ほとんどの物理モデルが非常に単純であり、ほとんどの場合、次数XNUMX以下の多項式のみを含むのはなぜか疑問に思っています。 たぶんその理由は、私たちが話すことができるものしか見えないからです。

以前は物理学で起こっていたことが今では他の分野でも起こっています。与えられたアミノ酸の配列は常に同じように折りたたまれます。 そこにはたくさんの規則性があります! 実際、それはその機能を定義するタンパク質の構造です。 しかし、 この関係を説明する数学関数を作成することはできません。 しかし、そうする機械学習モデルを構築することはできます。 このようなモデルを構築することは非常に重要なマイルストーンであるため、この特定のモデルがどのように呼ばれるかであるAlphaFoldがノーベル賞に値するかどうかについての憶測があります。

Math2.0ではMath1.0よりもはるかに複雑な関係を記述できるため、次の2.0年で生物学の変化が見られる可能性があります。 デジタル生物学は数学XNUMXの言語で書かれます。 そして、社会科学のように、より複雑な関係を持つ他の科学分野には多くの機会があります。

したがって、数学2.0の言語を話すことは、すべての学術カリキュラムのコアコンポーネントであり、特に科学におけるすべての学生の基本的な能力である必要があります。

もちろん、科学理論には数学だけではありません。 主な難しさは、特定の範囲の現象を説明するための適切な概念と量を見つけることです。 そしてそれは変わらないでしょう。 しかし、数学は、モデルを構築して予測を導き出す以上のことを私たちにもたらします。 また、(代数を介して)新しい単純化された洞察を計算および導出し、(微積分を介して)システムのダイナミクスに関する質問に答えることもできます。

私たちはまだ数学2.0革命の始まりにありますが、数学の発展と同様に、研究する新しい分野の出現が見られると私は予測しています。 機械学習モデルのシステム そして、それらをどのように構築し、自動的に最適化し、新しい洞察を導き出すために使用して、世界を新しい視点で見ることができるかを説明します。

これらの開発は、次のレベルの科学計算をもたらし、私たちに Math 2.0のおかげで、科学を行うための新しい方法。

参照:

  1. Baldi、P.、Sadowski、P。&Whiteson、D。深層学習による高エネルギー物理学でのエキゾチック粒子の検索。 Nat Commun5, 4308(2014)。 https://doi.org/10.1038/ncomms5308

 
バイオ: クロースホーン博士 はAIの研究者兼講師であり、21世紀の人間の状態を前進させる可能性が最も高いのは、人工知能とライフサイエンスの交差点であると確信しています。

元の。 許可を得て転載。

関連する

出典:https://www.kdnuggets.com/2021/09/math-fundamental-importance-machine-learning.html

タイムスタンプ:

より多くの KDナゲット