PDFがGoogleやYahoo!で検索されないようにする設定方法とは?
Google も Yahoo! も、検索ができるのは Web サイトの情報だけではありません。PDF ファイルだって検索され、検索結果にヒットし表示されます。不特定多数の方に見てもらいたい内容の PDF ファイルや、見られても問題のない PDF ファイルであれば良いのですが、会社の機密情報・重要情報や個人情報等であれば話は別です。
その大切な PDF ファイル、検索結果に表示されていませんか?
社内で共有するために PDF ファイルをサーバーにアップして置いたりすると、知らない間に PDF ファイルが検索結果に表示され、様々な人に観覧されている可能性があります。もし見られては困るような内容が入った PDF ファイルであれば、検索されないように設定しておきましょう!
PDFファイルが検索されないようにする方法
検索エンジンは様々なファイルをインデックス(データとして記録)して、それを目的に合った人の検索結果に表示させようとします。PDF ファイルもインデックスされることで検索されるのが原因なので、検索されないように検索エンジンに指示してあげれば良いのです。
検索エンジンに「検索しないで!」と指示する方法は3つあります。
- htaccess
- robots.txt
- metaタグ
今回は簡単な『robots.txt』を使う方法をご紹介致します。
『robots.txt』で検索されないようにする
まずはテキストファイルを作成し、名前を「robots.txt」にしてください。
作成したらそのテキストファイルを開いて下記のように記入します。
User-Agent: * Disallow: /pdf/ Disallow: /pdf-sample.pdf
- 「/pdf/」の部分は、「pdf」というフォルダ内にあるファイルを検索エンジンから拒否するという意味です。
- 「/pdf-sample.pdf」の部分は、個別にファイル名を指定して検索エンジンから拒否する方法です。
※フォルダ名やファイル名はご自身の環境に合わせて変えてください。
また下記のように記載すれば、PDF ファイル全てを Google から拒否することができます。
User-agent: Googlebot Disallow: /*.pdf$
記入ができたら robot.txt をサーバーにアップしましょう!
この方法をしても完全に検索されないという保証はありません。観覧されては困るような重要な PDF ファイルは、Google ドライブ等に保存して共有したほうが安全だと思います。