The light of hope to the other side of the tunnel - Kotsu Kotsu To -

LLMの基礎 ⑥：RAGとは？

AI LLM

RAG(Retrieval Augmented Generation、検索拡張)について。

RAG（検索拡張生成）は、大規模言語モデル（LLM）の弱点を補いながら、より正確で有用な回答を生成する技術として注目されています。

RAGとは？

RAG（検索拡張生成）は、大規模言語モデル（LLM）の出力を向上させるために、外部データを検索（Retrieval）して活用しながら回答を生成（Generation）する手法 です。

RAGが注目される理由を以下に。

1. LLMの知識の限界を補える

問題点:

LLMは事前学習したデータに基づいて応答を生成するため、新しい情報や特定の業務データにアクセスできない。

RAGによる解決:

LLMの回答を外部データ（企業のナレッジベース、ドキュメント、論文、Web情報など） で補強できる。
これにより、 最新情報や専門的な知識を参照しながら回答を生成可能になる。

例: AIチャットボットが、社内のFAQや最新のニュース記事を検索して正しい情報を提供。

2. “幻覚”の抑制（ハルシネーション問題）

問題点:

LLMは、学習データに基づいて最も可能性の高い単語を並べるだけなので、 事実でない内容（ハルシネーション）を生成することがある。

RAGによる解決:

RAGは検索した事実ベースの情報を元に回答するため、間違った情報の生成リスクを減らせる。
LLM単体よりも、エビデンス（根拠）を提示できる。

例:

RAGなし →「2025年のオリンピック開催地は？」と聞くと、間違った都市名を答える可能性あり。
RAGあり → 最新のニュースサイトを検索して正確な開催地を回答。

3. 企業向けAIの導入を加速

問題点:

企業のドキュメントや顧客データをLLMにそのまま学習させるのは難しい。
プライバシーやセキュリティの問題もある。

RAGによる解決:

企業のデータ（PDF、メール、チケット履歴など）を検索し、適切な情報をLLMが利用する形にできる。
外部データを都度検索するため、モデルの学習コストを削減し、セキュリティのリスクも軽減できる。

例:

カスタマーサポート → 過去の問い合わせデータを検索し、適切な回答を自動生成
法律・医療分野 → 最新の法律や診療ガイドラインを参照して助言を生成

4. リアルタイム性と柔軟性が向上

問題点:

一度トレーニングされたLLMは、新しい情報をすぐには学習できない。
最新ニュースやトレンドを取り入れられない。

RAGによる解決:

検索データを動的に取得できるため、常に最新の情報を利用可能。
LLMの事前学習を待たずに、新しい情報に対応できる。

例:

金融業界 → 最新の株価情報を参照して投資アドバイスを生成
Eコマース → 在庫状況や最新のプロモーション情報を考慮した商品提案

5. コスト効率が良い

問題点:

LLMの事前トレーニングには莫大なコストがかかる。
毎回、巨大なモデルをフルに動かすのは非効率。

RAGによる解決:

必要なデータを検索することで、LLMの推論コストを抑えつつ高精度な回答を実現。
必ずしも大規模なモデルを使わなくても、検索データ＋小規模LLMで高品質な応答が可能。

例:

小規模LLM + RAG → コストを抑えつつ、ChatGPT並みの性能を出せる。

ほなほな。