
Azure AI Document Intelligence は、高精度の機械学習モデルを使用し、あらゆるドキュメントからテキストや構造などのデータを抽出するサービスです。
Azure AI Search と統合することで、データの検索も容易にでき、より精度のいいチャットボットを構成することも可能です。OCR(光化学文字認識)も搭載されており、画像もある程度なら読み取ることができます。
Azure AI Document Intelligence の利用方法
様々なモデルが用意されていますが、本記事では事前構築モデルを利用して、ドキュメントがどのようにチャンクされていくのかを利用方法と併せて見てみようと思います。
1.Azure Portal を開き任意のリソースグループを作成します。
2.作成したリソースグループを開き、「+作成」を選択し、「Document Intelligence」を選択します。

3.作成を選択します。(一つしかプランがないためそのまま作成を選択)

4.必要項目を入力していきます。
- サブスクリプション:
利用するサブスクリプションを選択します。このサブスクリプションで課金されます。 - リソースグループ:
選択したリソースグループに Document Intelligence のサービスが作成されます。 - リージョン:
どの地域でサービスを作成するかを選択します。 - 名前:
ここで入力した名前がリソースグループ内での表示名となります。 - 価格レベル:
プランを選択できます。
入力ができたら「確認と作成」→「作成」を選択します。
今回は Free プランで作成していきます。(Free プランは利用に上限があるため注意してください。)
5.デプロイが完了したらリソースグループから作成した Document Intelligence を選択します。
6.概要の「Go to Document Intelligence Studio」を選択します。

7.任意のモデルを選択します。モデルは下記の3つが用意されていますが、General documents については、公式ドキュメントにて、事前構築済みドキュメントモデルが非推奨であるとの記載があったため省略します。
- OCR/Read:文章のテキスト、画像内の文字を抽出
- Layout:文章のテキストに加えてドキュメントの構造や表情報なども取得可能
- General Documents(事前構築モデル非推奨)
参考情報:一般的なキーと値の抽出 – Document Intelligence – Azure AI services | Microsoft Learn
本記事では Layout モデルを選択します。
OCR/Read の機能よりできることが多い分、Layout モデルの方が利用料金が高い形となっています。
8.任意のファイルをアップロードして「Run analysis」を選択します。
今回は厚生労働省が配布しているモデル就業規則の PDF をアップロードして「Run analysis」からどのようにドキュメントが分割されるかを参照します。

9.どのようにドキュメントが分割できているかを画面右側の「Content」タブから確認できます。
また「Result」では JSON、「Code」では Python,JavaScript,C# といった code を参照することが可能となっています。


Azure AI Document Intelligence を活用する
活用の例として Azure AI Search に Document Intelligence を組み込んで構成したチャットボットと従来のチャットボットでどのように差が出るか見ていきたいと思います。
■Document Intelligence 有り
プロンプト:家族が亡くなった際に休日は取得できますか?

■Document Intelligence 無し
プロンプト:家族が亡くなった際に休日は取得できますか?

上記画像のように、チャットボットの回答や参照先で違いがありました。
回答としては第30条の忌引休暇の回答が欲しいのですが、参照元に表形式で記載があったため従来のチャットボットでは上手く引用ができておらず、所々引用の歯切れも微妙な結果となりました。
一方、Document Intelligence を搭載したチャットボットでは表形式の参照元をうまくとってきてくれたため、チャットボットの回答もより分かりやすく、引用も構成ごとにまとまっている形式となっています。
まとめ
今回は Document Intelligence の機能、活用方法のご紹介でした。チャットボットの精度向上にもつながる便利な機能ですので、ぜひ活用していただけたら幸いです。
ご興味のある方や導入を検討したい方がいらっしゃいましたら、お気軽に Livestyle までお問い合わせください。