本日はGoogleの「site:」コマンドについてご紹介します。

SEOを意識したサイトを構築していけばいろんなプログラムを扱うと思いますが、私がよく利用するコマンド、、、それが 「site:」コマンドなのであります!

たぶんだけど、サイトをちょっと勉強したことあれば使った経験があるんじゃないかな?でも、このコマンドでサイト内の問題を見つけることもできたりするんですね。良ければ参考にしてみて下さい。

今回は、「site:」コマンドの復習も兼ねて書いてみますのでご存じない方は御覧くださいね♪

コマンドの実行場所

Google の検索エンジンへコマンドを入力します。

最初のうちは戸惑ってしまうかもしれないけどグーグルの検索エンジンへ直接入力するんだよ。覚えておいてね♪

1. site:example.com

まずは、基本パターンのこれですね!これを知らなければ話が前へ進みません^o^;

ドメインへ「site:」の後ろに記述して検索すると、Googleがそのドメインでインデックスされているページ件数を返してくれます。ドメインはサブドメインでもOKです。

ここでは、例として、ヤフーのサイトを使って説明します。

記述例

site:yahoo.co.jp

このように記述してGoogleで検索すると、2つの情報を得る事ができます。

(1) インデックスされているページリスト
(2) インデックスされているページ件数

(クリックすると画像が大きくなります)

2017年07月24日現在のヤフーのサイトにおけるインデックス数は「約 36,500,000 件 」です。ちなみにこの件数を返すのに0.55秒しかかかっていないので凄まじく高速のコンピュータを利用していることがわかりますねぇ。

しかし、これを見た多くの人は「約 36,500,000 件の検索結果があるんだなぁ」って考えるだけだと思います。だから、なんじゃい!ってことですよね?

それじゃ、どうやってこの膨大にあるGoogleのインデックスを利用できるのかな?って話。これから記述しているのが具体的な「site:」コマンドオプションで、それぞれの使い方に関してコメントしています。

2. site:example.com/folder

大量の結果に切り込む最も簡単な方法として、(”/blog”のように)サブフォルダをつけることが挙げられます。

記載方法は、以下の通りルートドメインの最後にフォルダを記述します。

記述例

site:baseball.yahoo.co.jp/npb/

自分が管理しているサイトで特定のディレクトリ配下の問題点を発見するのに役立つことでしょう。たとえば、上記は、ヤフーのプロ野球 – スポーツナビですが、記事を何件登録しており、何件がインデックスされているかを把握することができるのです。

3. site:sub.example.com

サブドメインをがっつりと調べたい場合はこの形です。

site:コマンドの後ろへサブドメインを入力します。Googleがそのドメインでインデックスされているページ件数をすべて出力するには前述の「1. site:example.com」を利用しますが、このオプションは、特定のサブドメインを指定するときに活躍しますね!

記述例

site:https://auctions.yahoo.co.jp/

4. site:example.com inurl:text

「inurl:」コマンドは、インデックスされているURL内の特定のテキストを検索します。実を言うと私も勘違いしていたんだけどあくまでもURL内の文字列を検索するだけなのでご注意下さいね。

また、フルのURLからサブドメインを見つけるのに、「site:」と「inurl:」をペアにして使うことができます。サブドメインを見つける場合は前述の「3. site:sub.example.com」のコマンドを利用します。

それに対して「inurl:」をつけるとテキストを検索でします。このオプションのすごいところは、単純にページを読み込んでいくだけでなくファイルの名前などもテキスト検索しているところです。ということはどこまでインデックスされているのかがまるわかりというわけですね。

例えば、ページの冒頭から何文字までをインデックスされているかまで分かるってわけです。しかも、複数の文字列の組み合わせも可能だから素晴らしいオプションですよね。

(2017/07/28 加筆修正)

記述例

site:yahoo.co.jp inurl:local

5. site:example.com -inurl:text

[-]を「inurl:」コマンドの前につけると、特定のテキストを除いた検索を行えます。「4. site:example.com inurl:text」の逆バージョンだと考えていただければわかりやすいかと思います。

ちなみにこのオプションを利用する、「inurl:local」を「-inurl:local」にかえると、「local」サブドメインを除いた検索ができます。すごく便利ですよね。

記述例

site:yahoo.co.jp -inurl:local

6. site:example.com -inurl:textA -inurl:textB -inurl:textC

「4. site:example.com inurl:text」と「5. site:example.com -inurl:text」が組み合わさっています。

この例だと example.com の中からtextA textB textC のテキストを含まないURLのみが抽出されます。検索結果は多くの場合、情報量が多いのでこんなオプションの組み合わせがかなり便利です。

ということは以下みたいに「-inurl:」を繋げれば、「beauty.yahoo.co.jp」や「partner.yahoo.co.jp/」みたいなマイナーなサブドメインを見つけれちゃいます。

記述例

site:yahoo.co.jp -inurl:www -inurl:gyao -inurl:travel

7. site:example.com inurl:https

ここで一つ小話をば。検証していないのでなんとも言えませんが「site:」へ直接プロトコルを指定することはできないらしいです。代表的なプロトコルといえば「https:」や「ftp:」などが挙げられることでしょう。

しかし「inurl:」には「https:」を記述することができるんだから、Googleでインデックスされている暗号化されたページを確認する事ができます。まぁ、あんまり必要ないかもしれないけどね。

記述例

site:yahoo.co.jp inurl:https

8. site:example.com inurl:param

ワードプレスのパーマリンク(ページURL)などは顕著に現れますが、わずかにURLが変化するケースがあります。こういったケースでは基本的にはコンテンツとしてみなされませんが、万が一にもインデックスされていたら

URLのパラメータはわずかにページを変更しますが、基本的に価値がない重複ページと認識されます。そんなページがインデックスされているのかどうかを調べたい時に使います。

例えば、不動産情報の全てのページにそれぞれ独自のURLを持っているとしましょう。

記述例

http://981.jp/ftl/searchRes.action?S.bd=170801&S.pr=43
http://981.jp/ftl/searchRes.action?S.bd=170801&S.pr=43&sort=rankAsc

この場合、「sort=rankAsc」の URLは、同じ内容のソート(並び替え)しているURLになります。

「inurl:」でパラメータを指定し、もし印刷用バージョンのページも多くインデックスされている様であれば、ソートページをNOINDEXする、カノニカルタグで正規化する等の対策が考えられます。そうじゃないとパクリ記事とみなされちゃいますもんね!

重複ページについての説明は以下のURLに書いてありますが、英語なので分かる人だけ読んでね。僕には聞かないで^^;

※1:http://www.seomoz.org/blog/duplicate-content-in-a-post-panda-world

このように検索結果で並び順、フィルター、ページ数等のパラメータを使用しているなら、「inurl:」へ引数を渡せば検索できますね。

記述例

site:981.jp inurl:sort

上の例では「inurl:sortは「sort」を含むが、URLパラメータを含まないURLを多く返しています。一般的なワードと重複するパラメータ検索をする場合は注意して下さい。

9. site:example.com -inurl:param

どのくらい多くのページがソートされずにインデックスされているのか、又、どれくらい多くの製品ページをGoogleが色やサイズを選択する事なくインデックスしているのか知りたい場合に使います。

「-inurl:」に除きたいパラメータをつけて検索します。

含めたいパラメータ/含めたくないパラメータを指定し、「inurl:」と「-inurl:」を繋げて用いることも可能です。カートを持つようなECサイトで使うことが多いかもしれませんね。

10. site:example.com テキスト

ここでSEO表示に役立つオプションの満を持して降臨!といいますのもこれはサイト内のテキストを検索することもできるオプションだからです。とはいえ、いくつかのテキストがあったばあいには、正確な結果は得られないそうなので注意が必要ですね。

その為、下記の例では「キンドル 無料」以外も検索されてしまいます。このあたりが惜しいところでしょうか・・・。

記述例

site:yahoo.co.jp キンドル 無料

11. site:example.com “テキスト”

前項(10. site:example.com テキスト)でお伝えしたとおり複合語を検索したときには結果が不適切になるケースがあります。そこで
確実にテキストを検索したいなら、引用符で囲みましょう。前項(10. site:example.com テキスト)の例では「キンドル 無料」以外も含んでいましたが、下記の例では完全一致した単語を含むページが検索されます。これで大丈夫!!

記述例

site:yahoo.co.jp “キンドル 無料”

(2017/08/01 加筆修正)

12. site:example.com/folder “テキスト”

これは、前述した「2」のコマンドとテキストを組み合わせて検索できます。

例えば、重複を探すことを目的とする検索において、ブログや店のページなど範囲を狭めるときに利用できます。

DVDカテゴリのハリーポッターではなく、本カテゴリのハリーポッターを探したい時は、下記の様に記述します。

記述例

site:yahoo.co.jp/books “harry potter”

13. site:example.com this OR that

テキストの条件を絞り込みたい場合は、[or]を使用できます。

この場合では、「this」「that」いずれか(または、両方)を含むインデックスされたページを探す事ができます。

探したいテキストを忘れてしまい不確かな場合に、キーワードをいくつか指定して検索するのに役立ちます。

記述例

site:yahoo.co.jp edward or jacob

14. site:example.com “top * ways”

アスタリスク「*」は、Googleの検索において不特定のテキストに置き換わるワイルドカードとして使用できます。ブログで「Top X」を全て見つけたい時、ブログのフォルダを対象に「Top *」とテキストを絞りこめます。

記述例

site:yahoo.co.jp “top * books”

ワイルドカード「*」は1文字、または、複数文字をマッチさせます。なので、「top * books”」の場合は、「Top 100 Books」「Top Wedding Planning Books」共にマッチします。

15. site:example.com “top 5..40 ways”

数字を特定の範囲で絞りたい場合、「X..Y」を使用します。「X..Y」はXからYの範囲の値にマッチするページを返します。

製品IDから価格等、ページ上の様々なデータの範囲を指定する時に使う事ができます。下記の例ではヤフーtop5~top40までの小説を探す事ができます。

記述例

site:yahoo.co.jp “top 5..40 novels”

16. site:example.com ~word

チルダ「~」は指定したキーワードと関連する文言を検索できます。Googleが関連があると考える文言で、より広く検索できます。

下記の様に、ヤフー内を「management」に関連するキーワードで検索したいとき、コマンドに「~management」を付け加えます。検索結果には、Googleが関連があると考えている「Leadership」「Manage」「Control」等も返されています。

記述例

site:yahoo.co.jp ~management

17. site:example.com ~word -word

特定の文言を除く「-」を用いることで、指定した文言は含まず、指定した文言の概念に関連のあるページを検索できます。

下記の例では、「management」は含まず、「management」に関連する「Leadership」「Manage」「Control」等のみが返されます。

記述例

site:yahoo.co.jp ~management -management

18. site:example.com intitle:”テキスト”

「intitle:」は内のテキストのみにマッチングを絞り込みます。SEOではよく使うコマンドですが、重複ページがないかどうか等の確認に便利です。

記述例

site:yahoo.co.jp intitle:”harry potter”

19. site:example.com intitle:”text * here”

「intitle:」と「12」-「17」を組み合わせてコマンドを使用できます。下記ではページタイトルのテキストのみに限定し、「14」のワイルドカードによる検索をしています。

これにより、タイトル内に「The * Games」のテキストが存在するページを検索できます。

記述例

site:yahoo.co.jp intitle:”the * games”

「intitle:」の後には文言の引用符をつけることを忘れないでください。そうしなければ、Googleは通常のテキスト検索と1KWのみのタイトル検索を行ってしまいます。

例えば、”intitle:text goes here”と記述した場合、タイトル上の”text”とページ内の”goes” と “here”を検索します。

20. intitle:”テキスト”

これは「site:」との組み合わせのコマンドではありませんが、役に立つので含めています。「intitle:」の後に引用符で囲んだテキストを記述する事で、コピーされたサイトを見つける事ができます。

他のサイトが自分のコンテンツをコピーしていると疑った事はありませんか?

これは、コンテンツを盗んだ人をみつけるのに役立ちます。又、記事のタイトルがユニークであることを確認するのに便利な方法でもあります。

記述例

intitle:”fifty shades of grey”

21. “テキスト” -site:example.com

サイトをもう少し絞り込んで検索したい場合、「-site:」を使い、(自サイトも含め)同じドメイン上の同類ページを除外できます。

これは、単純なテキスト検索、又は「20」のように「intitle:」と組み合わせて使えます。自分のサイトを除外し、競合他社の状況確認に使ったりします。

記述例

“amazon kindle” -site:wikipedia.org

22. site:example.com intext:”テキスト”

「intext:」では、文書の本文内のキーワードを検索しtitleタグを検索しません。

本文内のテキスト検索なので、おのずとtitleにも含まれている事がありますが、この場合の検索対象は本文内です。しかし、「intext:」ではURL内のキーワードも検索しているみたいですね。

記述例

site:yahoo.co.jp intext:”best book ever”

23. site:example.com “テキスト” -intitle:”テキスト “

この場合、「22」と同じかなと思ってしまいますが、微妙な違いがあります。

「intext:」の場合は、Googleはtitleタグを無視しますが、具体的なキーワードでは除外されません。検索結果で特定のタイトルのキーワードを除外したい場合は、”-intitle:”を使用します。

記述例

site:yahoo.co.jp intext:”best book ever” -intitle:”best book ever”

24. site:example.com filetype:pdf

「inurl:」コマンドの欠点の一つは、それがURL内の任意の文字列に一致するということです。

例えば、「inurl:PDF」という検索を行うと、「/guide-to-creating-a-great-pdf」という名前のページが検索されます。

「filetype:」を使う事で、ファイル拡張子を指定できます。下記例ではヤフーのエクセルファイルのみ返してくれます。

記述例

site:yahoo.co.jp filetype:xls

25. site:.edu “テキスト”

最後に、トップレベルドメイン(TLD)のみをターゲットにした検索です。※トップレベルドメイン(TLD)の1つで、アメリカ合衆国の教育機関のドメイン。eduは “education” の意味です。

いかがでしたでしょうか。

「site:」コマンドと言っても様々種類があると分かったと思います。サイトの問題点発見や競合調査、検証に使えるのでぜひ試してみて下さい。

Googleコマンドにはその他コマンドが色々とあるのですが、長くなるので次の機会にご紹介したいと思います。