Embedding RAGの限界とPageIndex:ベクターレスRAGを自社サイトで試した【LangGraph実装付き】
BM25+Embeddingのハイブリッド検索を一通り試したが、精度向上に限界を感じた。そこでベクターDBもEmbeddingも使わないPageIndexを自社サイトに導入し、URLのツリー構造をLLMが目次のようにたどる方式でページを特定する仕組みを構築した。LangGraphで6ノードのエージェントを実装し、実ログとともに動作を検証した。
BM25+Embeddingのハイブリッド検索を一通り試したが、精度向上に限界を感じた。そこでベクターDBもEmbeddingも使わないPageIndexを自社サイトに導入し、URLのツリー構造をLLMが目次のようにたどる方式でページを特定する仕組みを構築した。LangGraphで6ノードのエージェントを実装し、実ログとともに動作を検証した。