EMNLP2021の知識グラフ

プラトン再発行

フォロワー： 0

今年はプンタカナに行けませんでしたしかし、あらゆる移動制限にもかかわらずなんとかそこに到着した人々のことを（遠隔的に）嬉しく思います。プレミアムコンテンツが含まれています。

秋はとても忙しくなったので、より短い形式を試してみたいと思います: それぞれの大きなトピックに 1 つの「スポットライト」を当てる私が特に興味深いと思うメインブロックの作品と、少し短い説明を持つ関連作品がいくつかあります。

今日の計画：

KG拡張言語モデル：分類
会話型AI：幻覚をやめろ
エンティティリンク: In the Shadow of Colossal (エンティティ)
KG建設
KG の質問への回答: いくつか追加 SPARQL

この詳細な教育コンテンツがあなたに役立つ場合は、 AIリサーチメーリングリストに登録する新しい素材がリリースされたときに警告が表示されます。

KG拡張言語モデル：分類

文脈言語モデルにおける関係世界知識表現：レビュータラ・サファビとダナイ・コウトラ

あなたがそのようなダイジェスト（または以前の投稿）の経験豊富な読者であれば、あらゆるカンファレンスで公開され、毎週 arxiv にアップロードされる KG 拡張 LM が大量にあることをよくご存知でしょう。道に迷ったら —あなただけではないと断言します。

今年、ようやく サウンドフレームワーク およびさまざまな KG+LM アプローチの分類法!著者らは 3 つの大きなファミリーを定義しています。 1⃣ KG の監督なし、クローズ形式のプロンプトを使用して LM パラメータにエンコードされた知識を調査します。 2⃣ エンティティと ID による KG の監督。 3⃣ リレーションテンプレートとサーフェスフォームを使用した KG 監督。

各家族にはいくつかの支店がありますたとえば、以下に示す 4 つのエンティティ認識モデルを見てみましょう。から変わります 「あまり象徴的ではない」 〜へ 「より象徴的」、一部の LM は、言及スパンマスキング、対照学習、または既知の語彙からのエンティティ埋め込みの融合を実行します。著者らは、フレームワークに従って数十の既存のアーキテクチャを分類するという素晴らしい仕事をしました。今では、よりよく整理されているように見えます。とても必要な仕事です！

いくつかの短い論文は、LMを生物医学KGで強化することに焦点を当てています。これは、LMにドメイン固有の生物医学を教えるための長期にわたる取り組みです。 スラング。
孟ら提案するパーティションの混合物（MoP）、に基づくLM アダプタフュージョン LMを最初から事前トレーニングする必要性を軽減する手法。 MoPは、一般的な生物医学用語とオントロジーUMLSおよびSNOMEDCTでトレーニングされました。
ソンら 頼む 「言語モデルは生物医学の知識ベースになることができますか？」 を参照して Petroniらによる有名なEMNLP'19論文。答えは主に NO。著者のデザインバイオラマ、UMLS、CTD、Wikidata から構築された生物医学知識を調査するためのベンチマークです。彼らは、最新の LM がそれらのプローブで 10% 未満の精度しか得ていないことを発見しました。そのため、コミュニティは間違いなくより信頼性の高いものを必要としています。 .

会話型AI：幻覚をやめろ

ニューラルパスハンター：パスグラウンディングによる対話システムの幻覚の低減 Nouha Dziri、Andrea Madotto、Osmar Zaiane、Avishek Joey Bose

KGバックグラウンドを持つConvAIシステムで応答を生成するのは難しいです。多くのコンポーネントを含むパイプラインシステムでは、サーフェスフォーム（エンティティ名）を厳密に使用し、ほとんどの場合テンプレートを使用します。 テンプレートは退屈です そしてほとんど維持できません。一方、GPT-2やGPT-2などのe3e生成モデルは、はるかにユニークな応答を生成しますが、多くの場合、幻覚を引き起こします。つまり、予期しないときに間違ったエンティティ名を挿入します。

この作品の作者は、狩り KG監督による幻覚軽減の提案ニューラルパスハンター。まず、彼らはいくつかを研究します 幻覚の種類 、それらがどこから来たのか（主にトップkのサンプリングから）、そしてそれを定量化する方法。

NPH 自体は 1 つのモジュールで構成されます。2⃣ トークンに対してバイナリ分類を実行するクリティカル (非自己回帰 LM)。 XNUMX⃣ エンティティエラーを修正するためのエンティティ取得ツール: これは本質的にエンティティメモリであり、エンティティの埋め込みが GPT から取得され、グラフ構造を使用して CompGCN で更新されます。最も妥当な候補は、DistMult スコアリング関数を適用することで得られます。出来上がり！

NPHは、事前にトレーニングされたLMと組み合わせることができます。オープンダイヤルKG GPT2-KGによるベンチマーク、 GPT2-KE, アダプターボット大幅な削減を実証幻覚と増加忠実に。ユーザー調査では、人間が測定した幻覚が NPH モデルで約 2 倍減少したと報告されています

この文脈に関連するもう 1 つの研究: ホノビッチら 対話システムで同じ問題を研究しますが、バックグラウンドKGを使用せず、新しいベンチマークを提案します Q² 質問の生成と質問応答の事実上の一貫性を測定します（質問した場合、両方のQが由来します）。

ConvAI と常識的な KG に興味がある場合は、CLUE (Conversational Multi-Hop Reasoner) を必ずチェックしてください。 アラブシャヒ、リー他の概念を組み込んだ if-（状態）、then-（アクション）、なぜなら-（目標） パターン論理ルールとシンボリック推論。

エンティティリンキング：ワンダと巨像

以前のプローブを使用したエンティティの曖昧性解消のロバスト性評価：エンティティのシャドウイングの場合 by Vera Provatorova、Svitlana Vakulenko、Samarth Bhargav、Evangelos Kanoulas

言語タスクに実際のKGを接続すると、必然的に遭遇します さまざまなエンティティ 正確に同名。残念ながら、人類は世界中のすべてのエンティティに一意のハッシュを使用しているわけではないため、エンティティの曖昧さの解消は依然としてエンティティリンクの重要なステップです。

たとえば、ウィキデータには「マイケルジョーダン」という名前の少なくとも18のエンティティ。多くの場合、ELシステムは基本的な統計と人気スコアに依存しているため、最も人気のある「バスケットボール選手のマイケルジョーダン」は（少なくともポップカルチャーでは）あまり目立たない人々に影を落とします。

著者らはこの問題に取り組み、新しいデータセットを導入しました。シャドウリンク、最新のELシステムの混乱の程度を測定します。最高のF1スコアが0.35に達することはほとんどありません（最近の生成ジャンル最も難しい部分で0.26）を生成します。すべてのシステムは、ロングテールのまれなエンティティでスコアを飽和させ、より一般的なエンティティにも対処します。主な課題は次のように定式化されています。タスクを困難にするのは、あいまいさと非共通性の組み合わせです」。著者がデータセットをにアップロードすることをお勧めします HuggingFaceデータセットクールなプロジェクトの認知度を高めるため .

アロラ他 別の方向からエンティティリンキングの問題にアプローチします。主なアイデアは true 命名 エンティティ ドキュメント内（XNUMXつずつではなく共同で処理されます） スパン 低ランク 部分空間 候補を含むすべてのエンティティの空間内 (以下の視覚的な例を確認してください)。の 固有テーマ 事前にトレーニングされたエンティティの埋め込みがある場合、このアプローチは監視されません。作成者はWikidataの英語のサブセットに対してDeepWalkを使用します（または、単語の埋め込みを試みますが、うまく機能しません）。

概念的には似たようなエンティティベースの競合の問題によって研究されています ロングプレら、つまり、知識の置換 — 段落内の実際のエンティティをランダムなエンティティ（または矛盾するエンティティ）に反転した場合、モデルは答えを変更しますか?言い換えれば、QA モデルはコンテキストの読み取りや記憶された知識に依存するのでしょうか? このような置換を使用して QA モデルをトレーニングすると、OOD 一般化を大幅に向上させることができることがわかりました。

最後にアンケート調査を見てみましょう テデスキ他 on 「エンティティリンキングのNER：機能するものと次の機能」。著者は、ELの主要な課題を特定し、NER関連の課題に対処しようとしています。 NER4EL 事前トレーニングされた大規模な LM と、特に低リソースのシナリオに関連する小規模なモデルとの間のパフォーマンスのギャップを減らすことを目的としています。 .

（オンタリオ州ロンドン）と（英国ロンドン）が出会う。出典：Shadow of the Colossus

KG建設

私はここでキャッチーなラインを思い付くことができませんでした：/あなたがOpenIEとKG Constructionに興味があるなら、以下の論文が関連するかもしれません。

ドニンら 提案する リジェネ、Text2Graph タスクと Graph2Text タスクの両方を実行するように LM を微調整する (または特殊なモデルを微調整する) アプローチ。主要な成分標準のクロスエントロピー (CE) に加えて、RL 損失 (セルフクリティカルシーケンストレーニング) を追加しています。これは、事前にトレーニングされた LM に簡単に追加できます。著者は、T5-Large (770M パラメータ) と T5-base (220M パラメータ) で試しています。実験的には、 リジェネ Text2Graph WebNLGベースライン（メトリックに応じて3〜10絶対ポイント）を大幅に改善し、 ずっと より大きい TekGenデータセット（6Mトレーニングペア）。

ダッシュ他 勉強する 正規化 OpenIEの問題—さまざまな表面形状を持つエンティティが （NYC、ニューヨーク市） 同じプロトタイプを参照してください。教師なしの方法で、IEシステムがそれらの言及を自動的にクラスター化することを望んでいます。方法、クバ、クラスターを識別するために変分オートエンコーダー（VAE）に頼ります（エンティティと関係はガウス分布によってパラメーター化されます）。 VAEの標準に加えて 再建損失、CUVAは追加を採用しています リンク予測 損失 HolE スコアリング関数に基づいています。さらに、著者は小説を紹介します カノニックネル データセット！

KG の質問への回答: いくつか追加 SPARQL

中間質問分解からのSPARQLingデータベースクエリ by イリーナ・サパリナとアントン・オシン

残念ながら、*CL ドメインには SPARQL のアプリケーションはそれほど多くありません。これは NLP でさらに広く採用される価値があると思います。クールなアプリケーションでサポートされていれば、私はその気になれます .
構造化されたQAデータセットの大部分、またはセマンティック解析ターゲットSQLをメインの出力形式として使用しているデータセット。 SQLパイプラインを超えた人生はありますか？

サパリナとオソキンまず 1⃣ を使用して、その問題に対する新しい見方を提案します。質問分解意味表現（QDMR）質問を構文に依存しない論理形式に変換するフレームワーク。 2⃣ このフォームは任意の構造化フォーマットに変換できます。ここで著者は SPARQL を利用して、グラフ形式でデータベースをクエリする方がはるかに簡単であることを示しています。入力テーブルを RDF に変換する必要がありますが、クモスケーリングは非常に簡単に実行できます。

トレーニング可能なモジュールには次のものが含まれます RATトランス QDMRトークンを生成するLSTMデコーダーを備えたエンコーダー。 QDMR-> SPARQLは、いくつかのルールに基づくストレートトランスパイルです。
SOTA と同等の結果。
コードが利用可能です ;
SPARQL は SQL よりもうまく機能します。
良い紙を作るために他に何が必要ですか？

もう一つの刺激的な作品 Dasetalによる「知識ベースを介した自然言語クエリの事例ベース推論」 SPARQLと 事例ベースの推論 （CBR）。 CBRは、80年代にエキスパートシステムに深く根ざしていますが、最近、表現学習の力で復活しました。 2021年のCBRのTLDRの説明：これは、概念的には構成の一般化に近いものです。つまり、いくつかの基本的な例を見て、以前は見られなかったエンティティに関するより複雑なクエリを作成できます。

以下の例をご覧ください。入力クエリがあります 「ホビットのギムリの父親の兄弟は誰ですか？」。トレーニングデータでは、GimliやHobbitについては何もわかっていない可能性がありますが、「比較的類似している」可能性があります。例クエリに役立つと思われる関係について、たとえば、 「チャーリーシーンのお父さんは誰ですか？」 Freebase関係で people.person_parents および 「リアーナの兄弟は誰ですか？」 関係と people.person.sibling_s 。私たちの質問のためにそれらを構成し、データベースへのSPARQLクエリを構築します。

提案 CBR-KBQA このアプローチは、1⃣ DPR スタイルのトレーニング可能なニューラルレトリーバー (監視は重複関係に基づいています)、2⃣ 連結された関連する質問とクエリは非常に長いため、線形トランスフォーマー (BigBird を使用)、3⃣ をクリーンアップするためのいくつかの再ランキングメカニズムを組み合わせています。予測。既製の NER およびエンティティリンクモジュールを使用し、再ランキング用に事前トレーニングされた TransE リレーションエンベディングも採用しています。 CBR-KBQA は、以下を含むいくつかの KBQA データセットで優れたパフォーマンスを示します。 CFQ。ちょっとしたメモ：利用可能な最高のSOTAモデル（67.3 MCD-Mean）が78.1までのマージンを上回り、ベンチマークに提出されていないのではないかと少し疑っています。コードもまだ利用できません。

シらマルチホップQAを研究し、エンティティ/関係ID（ラベル形式）とその自然言語の説明（テキスト形式）の両方をメッセージ伝播フレームワークに統合することを提案しますトランスファーネット。評価は、標準のMetaQA、WebQuestionsSP、およびComplexWebQuestionsデータセットで行われます。

同じタスク (前の作業と同じデータセット) で、 オリヤ他 ほとんどのSOTAQAモデルは、すでにKGエンティティにリンクされているテキストスパンを必要とし、KGエンティティのノード近傍の機能とテキストスパンの機能を使用して動的エンティティの再ランク付けでこの要件を回避しようとしていることに気付きました。

それはすべての人々です

この短い「プレママ」が気に入ったら教えてください以前のレビューのような長いテキストの壁よりも優れたフォーマットです。ここに時間を割いていただきありがとうございます。何か役立つものをお持ち帰っていただければ幸いです

この記事は、最初に公開された M 著者の許可を得てTOPBOTSに再公開しました。

技術教育が追加されましたらお知らせします。

Eメールアドレス*
名前 *
名姓
会社概要*
AIをどのビジネスユースケースに適用していますか？*
- 管理部門
- アナリティクス
- カスタマーサービス
- ファイナンス
- HR
- リーガルポリシー
- マーケティング
- 業務執行統括
- プロダクト
- 研究
- 営業
- その他（以下にご記入ください）
応用AIの最大の課題は何ですか？*