数学者が(偽情報の)バーに入る

ソースノード: 1865101

偽情報、偽情報、インフォテインメント、アルゴリズム — 過去数十年間のメディアの将来をめぐる議論が何らかの意味を持っていたとすれば、それらは少なくとも英語に辛辣な痕跡を残したはずだ。個人の心理や神経学から民主主義社会の強さに関する広範な懸念に至るまで、ソーシャルメディアが私たちに与えていることに対して、多くの攻撃や恐怖が寄せられています。 ジョセフ・バーンスタインが最近言ったように、「群衆の知恵」から「偽情報」への移行は確かに突然でした。

偽情報とは何ですか?それは存在しますか?もし存在するなら、それはどこにあり、私たちがそれを見ていることをどうやって知ることができるのでしょうか?私たちの注意を集中させようとするお気に入りのプラットフォームのアルゴリズムが私たちに何を示すのか、私たちは気にすべきでしょうか?問題になるのは、そのような複雑な数学や社会科学の質問だけです。 ノア・ジャンシラクーサ その主題に興味がある。

ボストンのベントレー大学の教授であるジャンシラクーサ氏は数学の訓練を受けていますが(代数幾何学などの分野に研究を集中しています)、社会的な話題を数学的なレンズを通して見る傾向もあります。 計算幾何学を最高裁判所に提訴。最近では『』という本を出版しました。アルゴリズムがフェイクニュースをどのように作成し防止するか」では、今日のメディア環境に関するいくつかの挑戦的な質問と、テクノロジーがそれらの傾向をどのように悪化させ、改善させているかを探ります。

私は最近、Twitter スペースでジャンシラクーサを主催しましたが、Twitter では後でこれらの講演を簡単に聞くことができなかったので (一時的です!)、私はあなたと後世のために私たちの会話の最も興味深い部分を抜粋しようと考えました。

このインタビューは、わかりやすくするために編集および要約されています。

ダニー・クリクトン:どのようにしてフェイクニュースを研究し、この本を書こうと思ったのですか?

ノア・ジャンシラクーサ: 私が気づいたことの 1 つは、フェイク ニュースやこの種のものについて、非常に興味深い社会学、政治学の議論がたくさんあるということです。そして技術的な面では、マーク・ザッカーバーグがAIがこれらすべての問題を解決すると言っているようなことが起こります。そのギャップを埋めるのは少し難しいように思えました。

おそらく誰もが、バイデンの最近の言葉を聞いたことがあるでしょう。彼らは人を殺している」ソーシャルメディア上の誤った情報に関して。そのため、アルゴリズムの側面を実際に理解するのが難しいこれらのことについて政治家が発言しています。さらに、細部にまで精通したコンピューター サイエンスの人材もいます。つまり、私はその中間にいるようなもので、本当の意味でのコンピュータ サイエンスの専門家ではありません。なので、一歩下がって俯瞰してみると少し楽になると思います。

結局のところ、物事が複雑で数学がそれほどきれいではない社会との相互作用をもう少し探求したいと感じました。

クライトン: あなたは数学的な背景から来て、多くの人がさまざまな角度から書いているこの論争の多い分野に参入しようとしています。この分野で人々は何を正しく理解しているのでしょうか?また、おそらくニュアンスを見逃していることは何でしょうか?

ジャンシラクーサ: 素晴らしいジャーナリズムがたくさんあります。多くのジャーナリストがかなり専門的なことを本当に扱うことができることに私は驚かされました。でも、一つ言えるのは、彼らは間違っていなかったのかもしれないが、ちょっと印象に残ったのは、学術論文が発表されたり、Google や Facebook などのテクノロジー企業からの発表が発表されることがよくあるということです。彼らは何かについて言及し、ジャーナリストは引用部分を抽出してそれを説明しようとするかもしれませんが、実際にそれを見て理解しようとすることを少し恐れているようです。そして、それができなかったわけではないと思います。実際には、それはむしろ脅迫と恐怖のように思えます。

数学教師として私がたくさん経験したことの 1 つは、人々は何か間違ったことを言ったり間違いを犯したりすることを非常に恐れているということです。そして、これは技術的なことについて書かなければならないジャーナリストにも当てはまります。彼らは何か間違ったことを言いたくないのです。そのため、Facebook のプレスリリースを引用するか、専門家の意見を引用する方が簡単です。

純粋な数学のとても楽しくて美しい点の 1 つは、間違っていることをあまり心配せず、ただアイデアを試して、それがどこにつながるのかを確認し、これらすべての相互作用を確認できることです。論文を書いたり講演したりする準備ができたら、詳細を確認します。しかし、数学のほとんどは創造的なプロセスであり、探索し、アイデアがどのように相互作用するかを観察しているだけです。数学者としての訓練を受けていると、間違いや正確さを期すのではないかと心配になると思われますが、それはある意味逆効果でした。

第二に、これらのアルゴリズムの多くは、見た目ほど複雑ではありません。私は座って実装しているわけではありません。プログラムするのは確かに難しいと思います。しかし、全体像としては、今日のこれらすべてのアルゴリズムは、その多くが深層学習に基づいています。つまり、ニューラル ネットワークがあるということですが、部外者の私にとって、彼らがどのようなアーキテクチャを使用しているかはあまり重要ではありません。本当に重要なのは、予測子が何であるかということだけです。基本的に、この機械学習アルゴリズムに与える変数は何ですか?そして、それは何を出力しようとしているのでしょうか?それらは誰でも理解できることです。

クライトン: これらのアルゴリズムを分析する際に私が考える大きな課題の 1 つは、透明性の欠如です。たとえば、問題の解決に取り組む学者のコミュニティである純粋な数学の世界とは異なり、これらの企業の多くは、実際には、より広範なコミュニティにデータと分析を提供することに関して非常に敵対的である可能性があります。

ジャンシラクーサ:外から見ただけで誰かが推測できることには限界があるようです。

その良い例が YouTube です。学者のチームは、YouTube の推奨アルゴリズムが人々を陰謀論のような過激主義のウサギの穴に落とすかどうかを調査したいと考えました。課題は、これが推奨アルゴリズムであるため、深層学習を使用しており、ユーザーの検索履歴、人口統計、視聴した他の動画と視聴時間、これらすべてに基づいた何百もの予測子に基づいていることです。それはあなたとあなたの経験に合わせて非常にカスタマイズされているため、私が見つけることができたすべての研究ではシークレットモードが使用されていました。

つまり、彼らは基本的に検索履歴も情報も持たないユーザーであり、動画にアクセスし、最初に推奨された動画をクリックし、次に次の動画をクリックします。そしてアルゴリズムが人々をどこへ導くのか見てみましょう。それは、歴史を持つ実際の人間のユーザーの体験とは大きく異なります。そして、これは本当に困難でした。 YouTube のアルゴリズムを外部からアルゴリズム的に探索する良い方法を見つけた人は誰もいないと思います。

正直に言うと、それができる唯一の方法は、昔ながらの研究のようなもので、ボランティアを大量に集めて、彼らのコンピュータにトラッカーを入れて、「ねえ、自分の好きなように人生を生きてください」と言うようなものです。通常、あなたの履歴やその他すべてを調べて、あなたが見ているビデオを教えてください。」したがって、これらのアルゴリズムの多く、ほぼすべてが個人データに大きく基づいているという事実を乗り越えるのは困難でした。それを総合的に研究する方法がわかりません。

データがないために困っているのは、私や外部の誰かだけではありません。アルゴリズムを構築したのはこれらの企業内の人々であり、そのアルゴリズムが机上でどのように機能するかを知っていても、それが実際にどのように動作するかは彼らにはわかりません。それはフランケンシュタインの怪物のようなものです。彼らはこれを作りましたが、それがどのように動作するかは知りません。したがって、本当に研究できる唯一の方法は、そのデータを持っている内部の人々がわざわざ時間とリソースを費やして研究することだと思います。

クライトン:誤った情報の評価やプラットフォームでのエンゲージメントの決定に関しては、多くの指標が使用されています。あなたの数学的背景から、これらの尺度は堅牢だと思いますか?

ジャンシラクーサ: 人々は誤った情報を暴こうとします。しかし、その過程で、彼らはそれについてコメントしたり、リツイートしたり共有したりするかもしれません、そしてそれはエンゲージメントとしてカウントされます。では、こうしたエンゲージメントの測定値の多くは、本当にポジティブなものを対象としているのでしょうか、それともすべてのエンゲージメントだけを対象としているのでしょうか?ご存知のとおり、すべてがひとまとめにされてしまいます。

これは学術研究でも起こります。引用は、研究がどの程度成功したかを示す普遍的な指標です。そうですね、ウェイクフィールドの元の自閉症とワクチンの論文のような本当にインチキなものは大量に引用されました、その多くはそれが正しいと思って引用した人々ですが、その多くは科学者がそれを暴いています、彼らは論文の中でそれを引用していますたとえば、この理論が間違っていることを証明します。しかしどういうわけか引用は引用です。したがって、すべてが成功指標にカウントされます。

それがエンゲージメントに関して起こっていることの一部だと思います。私がコメントに「おい、それはクレイジーだ」というようなことを投稿した場合、アルゴリズムは私がそれをサポートしているかどうかをどのようにして判断するのでしょうか? AI 言語処理を使用して試すこともできますが、実際に使用できるかどうかはわかりませんし、そうするには多大な労力がかかります。

クライトン: 最後に、GPT-3 と、合成メディアやフェイク ニュースに関する懸念について少し話したいと思います。 AI ボットが偽情報でメディアを圧倒するのではないかという多くの恐怖があります。私たちはどれだけ怖がるべきでしょうか、あるいは怖がるべきでしょうか?

ジャンシラクーサ: 私の本は実際に経験から得た授業から生まれたものなので、公平性を保ち、人々に情報を提供し、彼らが自分自身で決定できるようにしたいと思いました。私はその議論を打ち切って、双方に実際に話してもらうことにしました。ニュースフィードのアルゴリズムや認識アルゴリズムは多くの有害なものを増幅させており、それは社会に壊滅的な影響を与えていると思います。しかし、アルゴリズムを生産的に使用してフェイクニュースを制限することに成功したという驚くべき進歩もたくさんあります。

AI がすべてを解決し、真実を伝え、事実を確認し、誤った情報を検出して削除できるアルゴリズムが登場するだろうと言うテクノユートピア主義者たちがいます。多少の進歩はありますが、そのようなことは起こらず、完全に成功することはありません。常に人間に頼らなければなりません。しかし、私たちが抱えているもう一つのことは、ある種の不合理な恐怖です。アルゴリズムが非常に強力で、特異点のようなもので私たちを滅ぼそうとしている、この種の双曲型 AI ディストピアがあります。

2018 年にディープ フェイクが初めてニュースになり、数年前に GPT-3 がリリースされたとき、「くそー、これでフェイク ニュースや真実の理解に関するすべての問題が解決するだろう」という多くの恐怖がありました。世界はずっとずっと大変だ。」そして今、私たちは数年の距離を置いているので、彼らがそれを少し困難にしていることがわかると思いますが、私たちが期待していたほど大幅ではありませんでした。そして、主な問題は、何よりも心理的、経済的なものです。

GPT-3 のオリジナルの作成者は、このアルゴリズムを紹介する研究論文を持っています。彼らが行ったことの 50 つは、テキストを貼り付けて記事に展開するテストでした。その後、何人かのボランティアに評価して推測してもらいました。はアルゴリズムによって生成されたもので、どの記事が人間によって生成されたものです。彼らは、XNUMX% に非常に近い精度が得られたと報告しました。これは、ランダムな推測をわずかに上回ることを意味します。それは、驚くべきことであり、恐ろしいことでもあると思います。

しかし、詳細を見てみると、1 行の見出しからテキストの段落まで続いていました。もしあなたが、The Atlantic や New Yorker のような長さの記事を完全に書こうとすると、矛盾が見え始め、思考が蛇行することになるでしょう。この論文の著者らはこれについては触れず、実験を行って、「ほら、どれだけ成功したか見てください」と言っただけです。

だからこそ、彼らはこのような印象的な記事を作ることができるのです。しかし、結局のところ、フェイクニュースや誤った情報、その他すべてに関する限り、GPT-3 がそこまで変革を起こせていない主な理由はここにあります。フェイクニュースはほとんどがゴミだからだ。文章は悪く、質も低く、非常に安価で作成が早いため、16 歳の甥にお金を払って、大量のフェイクニュース記事を数分で作成してもらうことができます。

数学がこれを理解するのに役立ったというほどではありません。ただどういうわけか、私たちが数学でやろうとしている主なことは、懐疑的になることです。したがって、これらのことに疑問を持ち、少し懐疑的になる必要があります。

出典: https://techcrunch.com/2021/08/20/a-mathematician-walks-into-a-bar-of-disinformation/

タイムスタンプ:

より多くの TechCrunchの