RAG (Retrieval-Augmented Generation)

・英語による用語:RAG (Retrieval-Augmented Generation)	
・用語カテゴリ:技術用語
・日本語訳・読み:ラグ(検索拡張生成)
・備考:検索で関連情報を取り出し、それを根拠に回答を生成する手法。幻覚を抑えやすい。

RAGとは?検索と生成を融合した最新AIアプローチ

RAG(Retrieval-Augmented Generation:検索拡張生成)は、生成AIが回答を作る直前に、外部の情報源(社内文書、FAQ、Web記事、DBなど)から関連情報を検索して取り込み、その内容を根拠として回答させる手法です。モデルが学習済み知識だけに頼るのではなく、必要な情報を「その場で参照」するため、社内ルールや最新情報に沿った“根拠ある回答(grounded response)”を作りやすくなります。 

仕組みは大きく4段階です。まず文書を適切な長さに分割(チャンク化)し、意味を表す数値(埋め込み=embedding)に変換して、ベクトルDB等に索引化します(Indexing)。次に質問文を同じく埋め込み化し、意味が近いチャンクを検索します(Retrieval)。取り出した情報をプロンプトに整形して添付し(Augmentation)、最後に生成モデルがその文脈を踏まえて回答します(Generation)。この「パラメータに記憶された知識(parametric)+外部メモリ(non-parametric)」を組み合わせる考え方は、学術的にもRAGとして整理されています。

実務での価値は、(1) ハルシネーションの抑制、(2) 社内固有情報への対応、(3) 情報更新の速さです。モデルの再学習を待たずに文書差し替えで追従でき、問い合わせ対応、ナレッジ検索、製品仕様QA、提案書作成支援などで効果が出ます。一方で、RAGは「検索品質=回答品質」になりがちです。チャンク設計(粒度)、メタデータ(部署・版数・日付)フィルタ、再ランキング、クエリ書き換え、ハイブリッド検索(キーワード+ベクトル)など、検索側の設計が要点になります。

注意点もあります。取り出した文書に誤りがあれば回答も誤る(garbage in, garbage out)ほか、文書内の悪意ある指示に引っ張られる“プロンプトインジェクション”対策、機密情報の権限管理、ログ・監査、評価指標(検索ヒット率と回答正確性の両方)を運用に組み込む必要があります。RAGは「生成AIを社内の真実(Single Source of Truth)に接続するための実装パターン」と捉えると、導入設計がブレません。

コメント

コメントする