カテゴリ「Microsoft Search」の12件の投稿 Feed

2024年10月30日 (水)

SharePoint ドキュメント ライブラリ内に作成するフォルダーは検索でヒットしにくいのをご存じでしょうか?

実はフォルダーは検索エンジンが必ず言語を英語として判定します。そのため英語圏のユーザーは問題ないのですが、それ以外の言語圏では不利になります。

試しに SharePoint Search Query Tool で検証してみましょう。このツールは下記の場所から入手できます。

https://github.com/pnp/PnP-Tools/releases

検証のためにあらかじめ「中秋の名月」というフォルダーを作成しているのですが、これを検索するために「中秋* ContentType=フォルダー」というキーワードで検索します。すると、検索結果からDetectedLanguage という管理プロパティの値が “en” になっていることがわかります。これは英語を意味します。DetectedLanguageはフォルダー、アイテム、ファイルなどを検索エンジンが解析する際の言語判定の結果です。通常はファイルなどであれば、日本語として判定するのですが、フォルダーに関して例外で必ず “en” 判定です(昔から)。

20241030_145801

本来であれば、日本語判定されて日本語として単語分割が行われて、検索インデックスに単語が登録されていくはずなのですが、日本語のフォルダー名を英語判定されていますから英語のルールで解釈しようとするとうまく単語登録ができないはずです。

実際に、単に “中秋の名月” と検索するとヒットしません。そのためワイルドカード検索をするとヒットしやすくなります。例えば、「中秋*」というように「中秋~」で始まるコンテンツを検索するようにするわけです。さらにフォルダーのみを検索したい場合は「ContentType=フォルダー」という検索キーワードを指定すると、簡単に絞り込めます。実際に試しているので次のビデオを確認してみてください。

では、英語でフォルダー名をつければうまく検索できるのかという話がありますが、その通り。わざわざアスタリスクで工夫しなくても、単語でズバッと検索できます。フォルダーの命名ルールが英語なら検索のもどかしさはないはずです。

補足

なお、フォルダーを多用せずに適切にサイト、ライブラリを分けておくことが重要であることは忘れずにいてください。ライブラリ1つで、その中にフォルダーを複数作成するのは利便性があまりよくありません。ファイルサーバーとは考え方が異なります。

弊社のオリジナル研修

なお、Microsoft 365 での効率的なドキュメント管理を考えている方はぜひ弊社のオリジナル研修をご受講ください。エンタープライズ検索の概念や検索の仕組みを一から学べます。オンプレサーバー時代からの検索の知見を含めてあれこれ説明するので、知らない情報がたくさんあるはずです。ブログや書籍にも載せていないものも多いので。

【オフィスアイ株式会社】Microsoft 365 ユーザーのための検索基礎

ファイル管理の研修とセットでご受講いただくと、ファイルを見つけやすくするドキュメント管理戦略にも役立ちます。併せてご検討ください。

【オフィスアイ株式会社】Microsoft 365 を活用した最新のファイル管理手法

2024年5月17日 (金)

Microsoft 365は検索機能を更新し、特定の自然言語ベースの検索サポートを2024年7月1日以降、廃止します。ただし、キーワードベースの検索機能は引き続き利用可能です。とはいえ、もともと日本人はキーワード検索が主流だったのでさほどインパクトはないとは思います。

Updates to natural language-based search in Microsoft 365 - Microsoft Support

ここからは個人的な見解です。もともとMicrosoft Search は Bing.com で培ってきた自然言語検索と SharePointが長年培ってきたキーワード検索とを包括的に使えるようになっていました。Microsoft Search は SharePoint だけでなく、Outlook, Teams などでも利用されてきたのです。ですが、ここにきて自然言語ベースの検索をやめてキーワード検索だけにするという発表があったということは、Microsoft Copilot for Microsoft 365 との差別化が進むということでしょう。Copilotはセマンティックインデックス検索を導入して、プロンプトからユーザーの指示の意図を推測して検索するという全く新しいタイプの検索を行います。従来の自然言語での開発は中止して、Generative AI へと全面投資することではないかと思います。

2024年5月 1日 (水)

Copilot for Microsoft 365 の活用を支援するために “制限された SharePoint 検索” が導入されます。

※ 2024年4月17日現在、この機能はパブリックプレビューとなっています。ロールアウトは2024年4月から開始されています。

Introducing Restricted SharePoint Search to help you get started with Copilot for Microsoft 365 - Microsoft Community Hub

制限された SharePoint 検索とは?

制限された SharePoint 検索は組織全体検索を無効化して、管理者が指定した特定のサイトおよび Microsoft Copilot のみを検索で利用できるようにするための設定です。これによりサイトの権限の見直しと監査を行う猶予を持てます。

Copilot for Microsoft 365 は Microsoft 365 内のコンテンツをもとにユーザーがプロンプトで対話する際に関連するコンテンツを生成したりします。秘密度ラベルを適用するなどの情報漏洩に対する対応が十分でない場合は、Copilot が利用するコンテンツの範囲を制限したいわけです。 Copilot による情報サーチは Microsoft 365 の検索機能を利用するためこれとともに制限するしかない。

この制限された機能を有効にするとCopilot のユーザーだけでなく Copilot を使っていないユーザーにも影響するようになります。

Microsoft 365 ホームページや SharePoint スタートページ、SharePoint ホームサイトから検索すると既定で SharePoint の検索は組織全体検索となりますが、この時の検索範囲が制限されるということです。

この機能は既定ではオフです。PowerShellを使ってオンにする必要があります。検索を許可するサイトは最大で100サイトまでとなっています。

使いどころ

ちなみに、この設定は最初からサイト間の横断的な検索の範囲を限定しようという発想です。いったん狭めてから徐々に広げていくという戦略です。

ですが、すでに検索できていたものが検索できなくなる可能性がありあるため利便性が損なわれる可能性があります。この場合は、全体的な検索は有効にしたまま、特定のサイトのみを検索対象から外すということをしたいこともあると思います。特定のサイトのみを検索対象から外す設定は昔からあり、該当するサイトの管理者またはサイトの所有者はサイトの設定ページから「検索とオフラインの使用制限」設定で "このサイトを検索結果に表示する" オプションを "いいえ" にするだけです。

20240501_114711

2023年5月 2日 (火)

SharePoint で目的のコンテンツが見つからないという時、「検索範囲」というものが存在していることを意識していないことが原因かもしれません

そもそも、どこから検索をはじめても、常にすべてのサイトから検索してくるというのはよく考えれば非効率です。これでは目的のコンテンツ以外もキーワードに引っかかってくるかもしれず、本当に欲しい情報が埋もれがちに。たとえば、現実世界で何か探すとしましょう。もしテレビのリモコンが見つからなければ、利用する可能性の高いリビングでまずは探すでしょう。靴下が片方なければ、ソファーの下、洗濯機の中などありそうなところから探すものです。デジタルの世界も基本は変わらないのです。

より目的のコンテンツを適切に検索できるよう、検索を始めた場所によって検索範囲は適切に絞り込まれるようになっています。例えば、契約書を管理するサイトで検索を始めれば、そのサイト内のみをまずは検索します。これによって契約に関わるコンテンツだけが検索結果に表れるでしょう(検索しやすいよう、情報の性質、種類でサイトが分類されてるのが理想的)。

ということで、SharePoint を含むMicrosoft 365 では検索を開始する場所によって既定の検索範囲というものが決まっています。一般的な検索の開始場所は次の通りです。

  • Office.com (microsoft365.com)
  • SharePoint スタートページ
  • SharePoint ホームサイト
  • OneDrive for Business
  • ハブサイトのホーム
  • ハブサイト以外の各 SharePoint サイトのホーム
  • 各サイトのライブラリやリスト

検索をする場所によって下記の通り範囲が異なります。最上位が最も検索範囲が広く、下に行くほど検索範囲が狭くなっていきます。
なお、アクセス権限は担保されるため閲覧権限をもっていないコンテンツは検索結果に表示されることはありません。

検索場所 検索範囲 検索対象
office.com / microsoft365.com Microsoft 365 全体
  • SharePoint サイト内のコンテンツ(リスト、リストアイテム、ファイル、ページ、ニュースなど)
  • OneDrive for Business のコンテンツ
  • 連絡先(Delve)
  • メッセージ (Outlook のメール, Teams の会話)
  • アプリ
  • Loop
SharePoint スタートページ / SharePoint ホームサイトのホームページ
  • すべての SharePoint サイト
  • すべてのOneDrive for Business
  • SharePoint サイト内のコンテンツ(リスト、リストアイテム、ファイル、ページ、ニュースなど)
  • OneDrive for Business のコンテンツ
  • 連絡先(Delve)
  • Loop
OneDrive for Business 検索範囲は選択できる。
  • すべてのファイル⇒すべてのSharePointサイトとOneDrive
  • 自分のファイル
    ⇒自分の OneDrive for Business 内のみ
  • SharePoint サイト内のファイル(ページやニュースは含まない)
  • OneDrive for Business のファイル
ハブサイトのホームページ ハブサイトおよび関連付けられたすべての SharePoint サイト
  • SharePoint サイト内のコンテンツ(リスト、リストアイテム、ファイル、ページ、ニュースなど)
ハブサイト以外の各サイトのホームページ 今、検索を開始しようとしているサイト内
  • SharePoint サイト内のコンテンツ(リスト、リストアイテム、ファイル、ページ、ニュースなど)
各サイトのリストやライブラリ 現在表示しているリストまたはライブラリ
  • SharePoint サイト内のリストアイテムまたはファイル(フォルダー)
  • サイトページの場合はニュースとページの両方

上の表に書いた通り、各検索場所では検索ボックスに既定で表示される文言(プレースホルダー)が実は異なります。注目していなかった方はぜひ注目するようにしてみてください。

例えば、Office.com で検索するときは単に「検索」と書かれています。20230502_144722

SharePoint スタートページでは「SharePoint 内を検索」

20230502_144827

ハブサイトでは、「サイト全体の検索」20230502_144952

特定のサイトでは「このサイトの検索」20230502_145043

といった具合で、これは既定の検索範囲を示しています。

それぞれを少し詳しくみてみましょう。

Office.com

Office.com (https://www.office.com もしくは  https://www.microsoft365.com) から検索するときにはSharePoint だけでなく、アプリ、メッセージ(Outlook, Teams) などのMicrosoft 365 全体が検索対象となります(ただし、現時点では Viva Engage (Yammer) は含まれない)。SharePoint に限って言えば、サインインしているユーザーが参照できるすべてのサイトが検索対象です。ちなみに、メッセージに関しては、Outlook は自分のメールボックスが対象であり、Teams はチャットやチャネル内のメッセージが検索対象になります。20230419_142548

SharePoint スタートページ/SharePoint ホームサイト

SharePoint スタートページはアプリ起動メニューまたはスイートバーにある SharePoint のロゴをクリックすればアクセスできます。SharePoint ホームサイトは組織の管理者がホームとして指定したコミュニケーションサイトです。

この時注目してもらいたいのが検索ボックスに表示されている文言です。「SharePoint内を検索」となっています。こう表示されていれば、すべての SharePoint サイト(OneDriveも含む)が検索対象です。20230501_122142

これが表示されている場合、検索範囲はテナント内の全 SharePoint サイトと SharePoint 管理下にある情報が対象です。

  • すべてのSharePoint サイト
  • すべてのサイト内のリストやライブラリなどのコンテンツ(ファイルやリストアイテムも含む)
  • すべてのサイト内のニュース
  • すべてのサイト内の画像
  • 連絡先 (Delve で管理しているユーザープロファイル)

もちろん、アクセス権限は考慮されるため、ログインしているユーザーが参照できないコンテンツは検索結果には表示されません。

OneDrive for Business

OneDrive for Business から検索する場合は、すべての SharePoint サイトを対象にしたファイル検索になります。OneDrive for Business と言えばファイル管理が中心です。そのため、検索対象も「ファイル」のみです。

検索するとき検索ボックスに検索範囲が3つ表示されます。

  • 自分のファイル
  • すべてのファイル (既定値)
  • 組織全体

20230501_145201

既定では「すべてのファイル」となっており、検索範囲がすべての SharePoint サイト(OneDrive も含む)となります。したがって、検索結果を確認する際には「場所」の列を確認することが大切です。ここには格納されているサイトとライブラリのパスが表示されます。

Onedrive

「自分のファイル」を選択すると自分の OneDrive for Business 内の検索に限定されます。そのため場所はOneDrive for Business 直下に既定で作成されているドキュメント ライブラリのバスである Documents > で必ず始まります。

なお、検索範囲として「組織全体」を選ぶと SharePoint スタートページの検索画面に画面遷移することになります。たとえば、ファイル以外にページやニュースなどを探したいときや画像の絞り込み検索がしたいときにこれを選びます。もちろん、会話を検索したい場合は、明示的に  www.office.com (または www.microsoft365.com) にアクセスして検索するようにします。

ハブサイトのホーム

ハブサイトのホームページの検索ボックスには既定では「サイト全体を検索」と表示されます。つまり、ハブサイトおよびハブに接続されたサイト群全体を検索対象にしているということです。ハブサイトに子供のハブや孫のハブが接続されている場合は、それも検索範囲です。ただし、子供のハブのホームページで検索する場合は、上位検索はせず(検索範囲を広げず) 自分管理下のハブと孫ハブが検索対象になります。同様に孫ハブで検索すると孫ハブ内しか検索しません。

ハブサイト以外の各 SharePoint サイトのホーム

ハブサイト以外のサイトのホームページで検索した場合は、検索ボックスに「このサイト」と表示されます。この場合は文字通り、今、検索を開始しているサイト内のみが検索範囲だということです。

各サイトのライブラリやリスト内の検索

サイト内のリストやライブラリの各ビューにアクセスした状態で検索を始める場合は、検索ボックスには「このリスト」や「このライブラリ」と表示されます。ですから、いまアクセスしているリストまたはライブラリ内に限定した検索です。

20230501_151051

2023年4月 7日 (金)

Microsoft 365 で OneDrive や SharePoint の検索をするときに、さっき削除したばかりのファイルが検索結果にまだ出てきてしまうということがあります。これは検索インデックスにしばらく情報が残ってしまうため。とはいえ、通常は数分程度で検索結果からも削除はされます。ちなみに、この現象は Google でも同じように起こります。

私たちが日々 SharePoint などで検索できるよう、検索のための情報が定期的に作成されています。どこにどんな情報があって、そこにはどういった言葉が含まれているのかなどが登録されているのです。この情報は検索インデックスといいます。

Photo

このインデックスを定期的に更新するプロセスが検索クロールという処理です。Google などの他の検索エンジンでも検索クロールが定期的に行われています。

Microsoft 365 の場合はテナント全体で共通の検索インデックスがあり、ここには情報を保護するためにアクセス権限の情報も含まれています。

Microsoft 365 内では検索クロールのタイミングは特に公開されていませんが、新しくファイルなどを使いすると早ければ1分くらいで検索結果には表示されるようになるので、かなりの頻度でクロールされているようです。新規作成だけでなく、「消した」という情報のアップデートもクロールのタイミングで行われるため時差が生まれるのです。

さて、冒頭の削除したのに検索結果に表示されてしまうかもしれないという問題ですが、もし検索結果に削除済みのファイルなどが表示されたとしても、実際には実体は削除済みなので検索結果をクリックしてももう存在しないと言われるはずです。

20230407_154904

なお削除したコンテンツがどのくらい残っているのかはタイミングによります。実験すると数分で検索結果からも消えてくれることが殆どです。

アクセス権限と検索

SharePoint (および Microsoft Search)での検索結果はログインしているユーザーが持っているアクセス権限が反映されます。そのため閲覧できないコンテンツは検索結果には表示されません。自分には検索結果として表示されているファイルやページなどでも、他のユーザーにはそもそも表示されていないこともあります。

情報を漏えいしないためにも権限管理については、ユーザーといえども基本的な理解はとても重要です。

また、うっかり機密情報をうっかり共有してしまう場合に備えるファイルは秘密度ラベルという設定をすれば暗号化することも可能です。暗号化することで特定のユーザーしかファイルを開くことができないような制限ができます。秘密度ラベルの定義は組織全体で事前設定が必要なので、すぐに利用できない組織もあるでしょうし、すでに利用しているところもあると思います。なおファイルは暗号化すると検索ではヒットしなくなるというトレードオフもあり、うまく使い分けないと生産性は下がります。

秘密度ラベルに関しては弊社で研修も行っているのでご参考まで。

【オフィスアイ株式会社】Microsoft Purview コンプライアンス入門~Microsoft 365 ファイルおよびメールに対する機密情報保護と情報ガバナンス~ (office-i-corp.jp)

検索インデックスからの強制削除

かなり前はクロールに非常に時間がかかっていたため削除したコンテンツがしばらく残ることもよくありました。そのため、どうしても迅速に検索結果からも削除したいコンテンツがあれば、URLさえわかれば組織の管理者に依頼することで、検索インデックスから当該URLを削除してもらうこともできます。

SharePoint 管理者(※サイトの管理者ではなく、組織全体の管理者相当の管理者) は次の場所から検索インデックス内の特定のURLの情報を削除できます (下記の操作画面はオンプレミスのサーバー時代からあるものです)。ただ、前述した通り、現在は素早く削除情報もインデックスに反映しているようなので、数分程度待てば消えているはずです。どうしても消えていない情報があれば試してみるといいと思います。

  1. SharePoint 管理センターにアクセスする。
  2. [その他の機能]>[検索]の[開く]をクリックする。

    20230407_155129

  3. [検索結果の削除]をクリックする。

    20230407_155157

  4. 削除したいURLを入力して[今すぐ削除]をクリックする。

    20230407_155305




 補足: ごみ箱について

ごみ箱は最初から検索インデックスの対象外なので、クロールされてもインデックスに含まれることはありません。したがって、検索結果には表示されません。