CharGPTのRAG構築方法の体系的まとめ＋無料・有料区分

RAG（Retrieval-Augmented Generation）は、AIが回答を生成する際に外部の資料やデータベースから関連情報を検索（Retrieve）し、その情報をもとに生成（Generate）する技術。

目的：ChatGPTのような大規模言語モデルに手持ち資料の知識を反映させ、最新情報・非公開資料をもとに正確で根拠ある回答を得ること。

2. 構成の基本要素

機能	役割	代表的ツール / サービス
① ドキュメント読み込み	PDF, Word, TXTなどを分割して取り込む	LangChain, LlamaIndex
② 埋め込み生成（ベクトル化）	テキストを数値ベクトルに変換	OpenAI Embeddings（text-embedding-3）
③ ベクトルDB（検索）	類似度で関連文書を検索	FAISS, Chroma, Pinecone
④ LLM（生成）	検索結果をもとに回答を生成	GPT-4, GPT-5, GPT-4o-mini など
⑤ 統合フレームワーク	検索→生成の一連処理を自動化	LangChain, LlamaIndex, Semantic Kernel

3. 構築方法① ChatGPT内簡易RAG

4. 構築方法② ローカルRAG（Python環境）

項目	内容
実行環境	PC・Raspberry Pi・社内サーバー等
必要技術	Python + LangChain / LlamaIndex + FAISS
外部通信	OpenAI APIへのみ（質問と回答データ）
永続性	自前ベクトルDBとして保存可
費用	構築無料（ライブラリ無料）＋API利用分の従量課金
長所	データを外部に保存しない、制御自在
短所	Python環境が必要、初期設定に多少の知識が要る

5. 構築方法③ クラウドRAG（外部DB運用）

項目	内容
実行環境	VPS, GCP, AWS, Azure等のクラウドサーバー
主な構成	LangChain / LlamaIndex + Pinecone / Weaviate + OpenAI API
永続性	クラウドDBに保存され、複数端末からアクセス可能
費用	サーバー代＋API利用料（月数千円〜）
長所	共有・スケール可能、API連携が容易
短所	セキュリティ管理・コストが必要

6. 無料／有料区分の比較表

7. 選択ガイド

通信量は「質問＋関連文書送信」分のみで、画像・動画がなければ数KB〜数十KB程度。通信負荷は軽く、ネットワーク制限下でも運用可能。

今後の展開例：ローカルRAG＋ST7735ディスプレイ連携、監査支援DB化、音声TTS統合ナビゲーション等

九州・福岡・東京ときどきIoT