いつ使う?noindexの意味と記述方法について

SEO

noindexというmetaタグがあります。このタグによって、名前の通り、検索エンジンにインデックスされなくなります。どんなシーンでnoindexは使われるのでしょうか?SEOを行うにあたって、正しく理解しておきたいnoindexの意味と記述について解説します。

検索エンジンの仕組み

noindexについて説明する前に、検索エンジンの基本的な仕組みについておさらいしておきましょう。理解しておきたいのは、クローラーとアルゴリズムです。クローラーとは、Web上のファイルを収集してくるロボットのこと。ここで集められた情報はデータ解析がしやすいように処理され、インデックス化されます。ユーザの求めに応じて即座に情報を引き出せるように整理し、索引をつくっておくイメージです。そして、いざユーザから検索ワードが打ち込まれると(検索ワードも形態素解析によって分解されます)、一致する情報を探し出し、よりユーザの意図に沿うであろう順序で結果を表示します。このユーザの意図をより正確に汲む(検索品質を上げる)ために使われているのが、ランキングアルゴリズムと呼ばれるもので、さまざまな要件からWebページに点数をつけるというものです。Googleに代表されるような検索エンジンの提供元は検索結果の品質を上げるため、常にアルゴリズムの見直しに取り組んでいます。

noindexの意味

さて、簡単にいえばここまでで述べたような仕組みで行われている検索ですが、noindexはこのクローラーを制御するためのmetaタグです。クローラー自体の巡回は禁止しないものの、文字通りページに記載された情報がインデックスされないことになります。インデックス化されていないために、検索結果としても表示されないというわけです。

なお、noindexのあとにfollowを入れると、そのページ自体は検索に表示はさせないものの、そのページからのリンクはクローラーに辿らせることができます。

WordPressでの設定

WordPressでも「All in One SEO Pack」というプラグインによって同様の設定が可能です。プラグインをインストールしたら「一般設定」に移り「noindex設定」で必要なチェックを入れることでページをnoindexにすることができます(後述するnofollowもここで同じように設定可能です)。ここでは「アーカイブにnoindexを使用」や「404ページにnoindexを使用」などの細かい設定が可能ですが、「noindexをディフォルト」にすると基本的にすべてのページが検索結果として表示されなくなるので、注意が必要です。

noindexを使うとき

それにしても、noindexとはどのような場合に使用するmetaタグなのでしょうか。SEOの観点からは、検索しても結果に表れないことは不利に見えます。しかし、実際には自社サイトを検索上位にするためにもnoindexは使えるのです。

もっとも分かりやすい例は構築中サイトやテストページ。公開目的で作られていないサイトやページは実務上発生するものですが、Web上に存在している限りはクローラーの訪問を受ける可能性があります。仮にクローラーがやってきたとしてもインデックス化を避けることで、SEOに意味あるページだけをクローラーに効率良く評価させることが可能なのです。また、削除してしまうと「404エラー」が表示されてしまいサイトの構造上問題がある場合や、購入後の「ありがとうございました」のようなサンクスページに関しても、noindexを使って検索対象から外すことが考えられます。

nofollowとの違い

noindexと名前のよく似たもので、nofollowというタグもあります。

こちらの目的もクローラーの制御ですが、noindexと違い「そのページから先のリンクを辿らせない」という効果を持つものです。このタグを加えた場合、該当のページ自体はインデックスされますがそこに貼られているリンク先のページをクローラーが辿ることができなくなります。具体的なケースとしては、信頼性の高くない外部リンクを設置するような場合が考えられるでしょう。

同じ効果をもたらす別の手法

特定のページを検索結果として表示させないためにはnoindex以外にもいくつかの方法があります。

robots.txt

1つがrobots.txtの使用です。これも検索エンジンのクローラーを制御するためのファイルで、訪問して欲しくないWebページの最上位ディレクトリにこのテキストファイルを設置します。通常のテキストファイルなのでメモ帳で簡単に作成・編集することができます。

User-agentでロボットを指定しており、「Googlebot-Image」のように特定のクローラーに対する命令文にすることができます。

noindexとの違いは、クローラー自体の巡回を禁止していることです。noindexのタグを記述してもクローラーの訪問は受けますが、インデックスされません。反対にrobots.txtを設置するとクローラーの巡回がなくなります。

ベーシック認証

一般公開前のWebサイトを検索結果として表示させたくない場合、そもそもアクセスを制限するという方法もあります。ベーシック認証(Basic認証)は代表的な簡易アクセス制限に使われるもので、アクセスしようとするとIDとパスワードの入力が求められます。この設置には「.htaccess」が使用され、ページあるいはディレクトリ単位での制限が可能です。htaccessを利用するのであれば、社内ネットワークのような特定のIPアドレスからのみ接続できるようにすることも考えられるでしょう。

noindexを使用する際の注意点

ここまでで紹介したnoindexは記述もシンプルで便利なタグのように思われます。ただし、気をつけたいのは乱用しないことです。クロールして欲しくないページが大量にあるのであれば、noindexやrobots.txtで制限するのではなく、サイトの構造そのものを考え直す必要があるといえるでしょう。また、SEOの観点からクローリングの最適化を行うことも大切ですが、それぞれのページにSEO対策を施し、品質を上げることが根本的な解決策となります。

なお、noindexとrobots.txtを使用するにあたっては、併用しないよう注意したいところです。もし、該当するWebページがすでにインデックスされている場合、robots.txtを置いてしまうとクローラーがやってこれず、noindexがあっても発見されません。結果としては、インデックスは残り続けることになってしまいます。

加えて、サイト制作中に付与していたnoindexを公開時に削除し忘れるというのもありがちなミスです。これではいつまで経ってもインデックスされないことになり、SEOとして大きなダメージになってしまいます。先に挙げたrobots.txtやベーシック認証とともに、くれぐれも注意しておきたいところです。

noindex使用は意味と目的をよく考えて

noindexは記述もシンプルなので、さまざまな場面で使われることも多いでしょう。ただし、検索結果に表示されないこと自体は、それほどポジティブなことではありません。本文で見たように使用の際には目的をよく考えながら使う必要があるといえるでしょう。

TOP