GitHub の Copilot が最初のオープン ソース著作権訴訟に突入

ソースノード: 1753328

意見 Microsoft の AI 主導のペア プログラミング サービスである GitHub Copilot は、すでに非常に人気があります。 Microsoft は、最新の四半期レポートで GitHub の収益とサブスクリプション数を初めて発表しました。

GitHub の年間経常収益は、買収時の 1 億ドルから 200 億ドルに増加し、現在では 300 億ドルに達しています。 現在、このプラットフォームのアクティブ ユーザー数は、昨年 90 月の 73 万人から XNUMX 万人に増えています。 最近の収益と加入者数の増加の多くは、CoPilot によるものです。 残念ながら、パーティーはすぐに終わってしまうかもしれません。

CoPilot が最初に公開されたとき、その機械学習 (ML) モデルは OpenAI の Codex に基づいていたため、賢明な人々は心配していました。 何らかのオープンソース ライセンスに基づいて著作権で保護されたコードが含まれていました。 結局、Codex は、GitHub のパブリック リポジトリにあるコードを含め、公開されている数十億行のソース コードでトレーニングされていました。 これには、とりわけ、Apache Foundation の多くのプロジェクトのコードがすべて含まれていました。

したがって、弁護士、デザイナー、開発者である Matthew Butterick が、主要な集団訴訟法律事務所である Joseph Saveri Law Firm と協力して、 調べる GitHub に対して著作権の申し立てを行う可能性。 その可能性は 現実.

3 月 XNUMX 日、彼らはカリフォルニア州北部地区連邦地方裁判所に Microsoft とパートナーに対して集団訴訟を起こしました。 彼らの主張は? Copilot は、公的にアクセス可能な環境でトレーニングされた AI ベースのシステムです オープンソース ライセンス コード [PDF]。 GitHub は、プログラマー向けに作成するコードは単なるコードのコピーではないと主張していますが、実際には、それがまさにそれであると訴訟は主張しています。 「被告は、Codex と Copilot が訓練を受けた資料のコピーを保持していないと主張しています。 ただし、実際には、出力はトレーニング データからのコードのほぼ同一の複製であることがよくあります。」

さらに、「Codex は、この出力やその他の著作権の所有者を特定しません。帰属を提供するように訓練されていません。 また、出力に添付された著作権表示やライセンス条項も含まれません。 これは設計によるものであり、Codex はそのようなデータを再現するようにコーディングまたはトレーニングされていません。」

要するに、彼らは Copilot が著作権を侵害する模倣品にすぎないと主張しているのです。

マイクロソフトは事実を主張することはできません。 Copilot はオープン ソース コードに基づいています。 本当の問題は、彼らの行動がコードの著作権を侵害したかどうかです。 それは「フェアユース」ですか、それとも知的財産の窃盗ですか? それは、私の友人、複雑な質問です。 すぐには解決しません。 バテリックはこれを知っています。

「これは長い旅の第一歩です。 私たちが知る限り、これは米国で AI システムのトレーニングと出力に異議を唱える最初の集団訴訟です。 それは最後ではありません。 AIシステムは法律から免除されていません。 これらのシステムを作成して運用する者は、責任を負わなければなりません。」

もちろん、GitHub は次のように主張しています。

それはあまり言いませんね。

Microsoft と OpenAI は、この訴訟についてまだコメントしていません。 それは間に合うでしょう。 このケースはなくなりません。 最終的に、彼らはクレームに対処する必要があります。 それから、これが法廷外で解決される可能性はないと思うので、それは米国の法制度を通じて長くゆっくりとした旅を始めるでしょう. この XNUMX 年で決定的な答えが得られるとは思っていません。

その間、オープンソースのリーダーたちは、この訴訟のすべての影響をまだ検討しています。 Open Source Initiative (OSI) のベテランである Simon Phipps 氏は、Mastodon について次のように述べています。 Copilot についてのこの時点での結論は、法的な不確実性により、オープンソース プロジェクトでの使用が不適切になるということです。に設立された地域オフィスに加えて、さらにローカルカスタマーサポートを提供できるようになります。」

Software Freedom Conservancy (SFC) は、「問題は深刻で重要です、」それは単純ではありません。 たとえば、オープンソース ライセンスの問題に関する重要な原則の XNUMX つは、「コミュニティ指向の施行では、金銭的利益を決して優先してはならない」というものです。 集団訴訟は、その性質上、金銭的補償に関するものになりがちです。

SFC は、原告が「これらの原則を支持する。 Microsoft の GitHub が侵害を続けていること、および Microsoft と GitHub が積極的な反 FOSS 活動と前例のないライセンス違反に関してコミュニティと協力することを拒否していることに対するあなたの不満と怒りを共有します. ただし、FOSS ライセンスは、主にビジネス モデルや財務回復に関するものではありません。 Copilot に対する GitHub の行動は、主に、ユーザー、開発者、および消費者がすべて平等な権利を持つことを保証するために特別に設計されたコピーレフトのシステムを弱体化させようとしているため、攻撃的です。」

危険性は、Copilot ユーザーにとっても潜在的に大きなものです。 GitHub に対する訴訟が勝訴した場合、GitHub を使用して作成したコードの最後のすべてのビットが、さまざまなオープンソース ライセンスの対象となる可能性があります。 それでも怖くない場合は、会社の弁護士に相談してください。 気が付くと白くなることに気付くかもしれません。

間違えないでください。 この訴訟は、勝っても負けても引き分けでもあり、オープンソース ソフトウェアと AI/ML の使用方法を変えるでしょう。 実際、テクノロジーの世界全体を変える可能性があります。 ちょっと待って、私たちは大まかな乗り心地になるでしょう。 ®

タイムスタンプ:

より多くの 登録