2006年07月27日

Googleで検索されるページにしたい!

ブログを始めて早2ヶ月。
ふとあることに気づいた。
「このページ、Googleから検索されない!!」

以前の記事で検索ワードについて書いたが、
このとき話題としたアクセスはYahoo!ブログ検索Goo blogのブログ検索等、ブログ専門の検索エンジンからのアクセスで、
検索エンジンの雄、Google様からは「immoral stoic」で検索しても「囲碁 下心」で検索しても引っかかりません。

そこで、なんとかGoogleロボットを呼び込むための仕掛けを施してみました。
現段階でもGoogle巡回は来ていないようですが、もしこれを読んでるあなたがGoogle検索からやって来たならば、実験大成功です!

○Googleのページ探索の仕組み

Googleはインターネット上を巡回してページの情報を収集し、その収集結果を元に検索を行なうのですが、
その巡回をどのように行なうかと言うと、我々人間同様、ホームページに貼られたリンクを辿って他の様々なページを渡り歩きます。

すなわち、他のどのホームページからもリンクの貼られない、
「陸の孤島」のようなホームページにはGoogleさんは来ない、ということになります。
(↑※ただの「孤島」でいいじゃん)


○Googleから探索されるには?

そこで、簡単にGoogleさんを呼び込むには、他のサイトからリンクを貼ってもらえばいいわけです。

具体的には、

 ・既にGoogleに登録されている知人のサイトからリンクを貼ってもらう
 ・Yahoo!(※1)などの登録型リンク集に登録してリンクを貼ってもらう
 ・他のブログにトラックバックを送信する

 (※1:Yahoo!は登録型リンク集の代表例として出しましたが、実際のサイト登録には審査が必要なので、もっとちっちゃなリンクサイトのほうが多分お手軽です。)
 (※2:CGIでページ内容を生成するようなところ(掲示板とか)にページのリンクを貼ってもダメ。Googleはhtmlファイル化されているものしか検索しません。)
などの方法があります。


○Googleサイトマップを使う

しかし、「孤高の雑記帳」を謳う当ページとしてはお願いしてリンクを貼ってもらうのはポリシーに反するわけで、別の方法を考えます。
ここで使用するのが「Googleサイトマップ」です。

これは一言で言うと、Googleの巡回経路に自分のサイトを強制的に加える、という機能です。
これを使用すれば、孤島ページでもGoogleを呼び込むことができ、ひいてはGoogleで自サイトに関連する言葉で検索した人を呼び込むことができます。

以下でそのGoogle サイトマップへの登録手順を説明します。
※細かい部分はseesaaブログに特化しています。

@Googleアカウントを作成する(Googleアカウント持っていない人)
 Googleのページ見ながらやってみてください。(適当)

Aサイトの登録
 検索させたいサイトのアドレスを登録します。
 細かいやり方はもう忘れちゃいましたが、これは説明見ながら簡単にできます。

B自分のサイトのトップページにMETAタグを埋め込む
 Aのあと、手順の説明で「METAタグ」を使うか「htmlファイル」を作成するかどちらかを行なってくれみたいなことを言われます。
 (どうも、追加したサイトに対する編集権の確認のようです。勝手に人んちのサイトをGoogleサイトマップに追加しないように。)
 seesaaブログでは最上位階層への任意ファイル追加ができないので、そのようなサービスの方は「METAタグ」埋め込みの方法を使用します。
 「METAタグ」の方法の方を使います〜、みたいな選択をすると、  
<META name="verify-v1" content="qあwせdrftgyふじこlp" />
 みたいな文字列が表示されますので、それを範囲指定でクリップボードにコピーしときます。
 そして、その文字列をトップページのhtmlファイルの<head>〜</head>の中のどこかにペーストします。

 (ここからseesaaブログ用手順)
 マイブログ編集メニューで「デザイン」→「HTML」を選択します。
 通常はここに表示されるリストには「デフォルトHTML」しかないですが、リスト右上の「HTMLの追加」をクリックします。
 HTML編集画面になりますので、HTML名は適当な名称を入力して、HTMLの<head>〜</head>の中にさっきコピーしたメタタグをペーストします。
 で保存。
 リストに先ほど追加したHTMLが追加されているので、それの「適用」にチェックを付けて、再構築します。
 
C自分のページの「サイトマップ」を登録
 今度は自分のページの「サイトマップ」を登録しろと言われます。
 ここで言う「サイトマップ」とは、自分のサイトの目次みたいなもので、xmlファイル形式で記載されたものとされています。(こんな感じ)
 この「サイトマップ」が各サービスでどのように提供されているかはそのサービスに依ると思いますので探す or サポートに問い合わせてみてください。
 (ここからseesaaブログ用)
 seesaaブログではズバリ http://curren-note.seesaa.net/index20.rdf が正解です。(もちろん「curren-note」の部分はそれぞれのユーザー固有のアドレスに置き換えてね!)
 類似品で http://curren-note.seesaa.net/index.rdf ってのもあります(てか公式ページにはこっちについてのヒントしか無い)が、こちらにはGoogleさんは対応されていません。


○結果の確認

以上で恐らく準備完了です。
それでも、実際にGoogleがすぐ巡回してくる訳ではない(巡回経路のどこかに追加されるだけで、それが何日後かは不明)なので、さらなる忍耐が必要です。
site:curren-note.seesaa.net」(「site:ホスト名」って指定は、指定されたホスト名に格納されたページを検索します。)でGoogle検索して、このページが出てくれば完璧OKです。

冒頭でも述べた通り、このサイトも結局まだGoogle巡回されていないので、上記方法が正しいことは証明されていないのですがね...


○追記(H18.10.19)

推論ですが、こちらを追加しました。




posted by curren at 22:33| Comment(1) | TrackBack(0) | 日記 - 一般 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
Googleに登録されました!
...っと言っても、記事書いた翌日には「immoral stoic」で検索するとseesaaブログのページがヒットしちゃって、そこから辿られた可能性があるので、方法が正しいことの実証になってません...
Posted by curren at 2006年07月31日 18:40
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック
×

この広告は180日以上新しい記事の投稿がないブログに表示されております。