Microsoft 365 で OneDrive や SharePoint の検索をするときに、さっき削除したばかりのファイルが検索結果にまだ出てきてしまうということがあります。これは検索インデックスにしばらく情報が残ってしまうため。とはいえ、通常は数分程度で検索結果からも削除はされます。ちなみに、この現象は Google でも同じように起こります。
私たちが日々 SharePoint などで検索できるよう、検索のための情報が定期的に作成されています。どこにどんな情報があって、そこにはどういった言葉が含まれているのかなどが登録されているのです。この情報は検索インデックスといいます。
このインデックスを定期的に更新するプロセスが検索クロールという処理です。Google などの他の検索エンジンでも検索クロールが定期的に行われています。
Microsoft 365 の場合はテナント全体で共通の検索インデックスがあり、ここには情報を保護するためにアクセス権限の情報も含まれています。
Microsoft 365 内では検索クロールのタイミングは特に公開されていませんが、新しくファイルなどを使いすると早ければ1分くらいで検索結果には表示されるようになるので、かなりの頻度でクロールされているようです。新規作成だけでなく、「消した」という情報のアップデートもクロールのタイミングで行われるため時差が生まれるのです。
さて、冒頭の削除したのに検索結果に表示されてしまうかもしれないという問題ですが、もし検索結果に削除済みのファイルなどが表示されたとしても、実際には実体は削除済みなので検索結果をクリックしてももう存在しないと言われるはずです。
なお削除したコンテンツがどのくらい残っているのかはタイミングによります。実験すると数分で検索結果からも消えてくれることが殆どです。
アクセス権限と検索
SharePoint (および Microsoft Search)での検索結果はログインしているユーザーが持っているアクセス権限が反映されます。そのため閲覧できないコンテンツは検索結果には表示されません。自分には検索結果として表示されているファイルやページなどでも、他のユーザーにはそもそも表示されていないこともあります。
情報を漏えいしないためにも権限管理については、ユーザーといえども基本的な理解はとても重要です。
また、うっかり機密情報をうっかり共有してしまう場合に備えるファイルは秘密度ラベルという設定をすれば暗号化することも可能です。暗号化することで特定のユーザーしかファイルを開くことができないような制限ができます。秘密度ラベルの定義は組織全体で事前設定が必要なので、すぐに利用できない組織もあるでしょうし、すでに利用しているところもあると思います。なおファイルは暗号化すると検索ではヒットしなくなるというトレードオフもあり、うまく使い分けないと生産性は下がります。
秘密度ラベルに関しては弊社で研修も行っているのでご参考まで。
検索インデックスからの強制削除
かなり前はクロールに非常に時間がかかっていたため削除したコンテンツがしばらく残ることもよくありました。そのため、どうしても迅速に検索結果からも削除したいコンテンツがあれば、URLさえわかれば組織の管理者に依頼することで、検索インデックスから当該URLを削除してもらうこともできます。
SharePoint 管理者(※サイトの管理者ではなく、組織全体の管理者相当の管理者) は次の場所から検索インデックス内の特定のURLの情報を削除できます (下記の操作画面はオンプレミスのサーバー時代からあるものです)。ただ、前述した通り、現在は素早く削除情報もインデックスに反映しているようなので、数分程度待てば消えているはずです。どうしても消えていない情報があれば試してみるといいと思います。
補足: ごみ箱について
ごみ箱は最初から検索インデックスの対象外なので、クロールされてもインデックスに含まれることはありません。したがって、検索結果には表示されません。
コメント