[azure]Azure AI Searchで最小のインデックスを作成する

はじめに

Azure AI FoundryではGUIベースで簡単にRAGを作成することができる。

手順についてはこちら:Azure AI FoundryのチャットプレイグラウンドでRAGを作成する

RAG作成の裏側でインデックスはどのように作られるだろうか?という疑問を解決するために、あえてAzure AI Foundryを利用せず、Azure ポータルからインデックスを作成してみる。

 

登場人物

Azure AI Searchにおいて、必須の要素は「インデクサー」「インデックス」「データソース」の3つである

 

前提条件

以下2つのリソースが作成されていること

  • Azure AI Search
  • ストレージアカウント「Azure BLOB Storage」

 

作成してみよう

データソースの作成

左メニューからデータソースを選択し、「+  データソースの追加」を押下

 

 

データソースの種類はAzure BLOB Storageのまま、「ストレージ名」と「コンテナ名」を選択し、作成

 

インデックスの作成

左メニューからインデックスを選択し、「+  インデックスの追加」を押下

 

インデックス名を指定し、作成

 

 

インデクサーの作成

左メニューからインデクサを選択し、「+  インデクサの追加」を押下

 

前の工程で作成したインデックスデータソースを指定して、保存

 

インデックスの作成を確認する

インデクサ―を作成すると、すぐに処理が始まり、インデックスが作成される。

インデックスの作成結果は、再度インデックスのメニューから作成されたインデックス名のリンクをクリックして確認する。

 

検索エクスプローラーで「検索」を押下

検索結果ウィンドウに、以下のようにidのリストが表示されていればOK

 

最小のインデックスを作ってわかること

  • インデックスはデフォルトでフィールド「id」しか用意されていない。
  • RAGのゴールはデータソースに格納されたドキュメント(テキストファイルやpdfファイル)内のテキストや画像検索を行うことであるが、ドキュメント自体が格納されていない。つまり、ドキュメント内のテキストをインデックスに格納するという処理を追加しなければならない。