perplexityで特定のサイトのRAGを作成する
※本稿は2024年12月時点の情報です。AI関連の情報は変化・進化が急激なため、閲覧されている時点ではすでに古い、または利用できなくなっている、もっと優れた方法がほかにある可能性があることをご了承ください
perplexityで特定サイトのRAGが簡単に作成できるようになりました。
「このツールの使いかたを知りたい」といったニーズに対して、正解に近い情報源となるサイトがある場合はそのサイトをRAGの対象とすることで、正しい回答が得られやすくなります。
※RAGとはRetrieval-Augmented GenerationのLLM(Large language Models/大規模言語モデル)によるテキスト生成に、外部の情報の検索を組み合わせることで回答精度を向上させること
perplexityで特定サイトのRAGを作成する
まずperplexityの左側メニューから「スペース」をクリックします。
スペース一覧画面で「スペースを作成する」をクリックします。
スペースのタイトルを付けて、AIモデルを選択して「続ける」をクリック。
右側にリンクを追加するボタンがあるので、ここからRAGの対象にしたいドメインやディレクトリを追加していきます。
ドメインやディレクトリを追加していきます。
RAGの対象にするサイトは複数設定可能なようです。
リンクが追加できたらスペースの画面に戻り、「ソース」から「ウェブ」のチェックを外します。
これで設定したドメインやディレクトリのみを対象にした推論が実行されます。
試しに「東京都の統計(https://www.toukei.metro.tokyo.lg.jp/)」を設定して、回答を求めてみましょう。
プロンプト:東京23区で2020年度に人口が一番増えた区を教えてください
すると下のように指定したドメイン/ディレクトリ内のどのページやフィアルを参照したかが表示されます(perplexityではデフォルトでソースが表示される)。
ちゃんとhttps://www.toukei.metro.tokyo.lg.jp/だけから情報を取得しているのがわかります。
なにも指定しないと正確性に欠いたサイトも含めて情報のソースとしてしまうことがあるため、このように正確な情報があるサイトだけをソースにしたRAGが手軽に作れるのはとても便利ですね!
※もちろん出力された情報の正確性が担保されているわけではありませんので、人間によるチェックが必須です
以上、perplexityで特定サイトのRAGを作成する方法の解説でした。