SEO対策

SEOとは「Search Engine Optimization」の略で、「検索サイト最適化」となるので
後ろに対策を付けるのはどうかと思うのですが、この言葉が一般的になったので
タイトルには対策をつけました。

つまり
YahooやGoogle等の検索サイト にヒットするために、ホームページを調整しようと言うことです。

長きに渡ってフレッシュゴーゴーがまともに検索サイトに引っかからない事から真剣にSEOについて取り組もうと思ってはじめました。

【robots.txt】

検索に引っかからない理由は主にrobots.txtの書き間違えにありました。
下手にrobots.txtの存在を知ってしまったので、ルートディレクトリに

【robots.txtの中身】
User-agent: *
Allow:/cgi-bin/
Disallow: /cgi-bin/data

としてしまったのです。
これは、すべてのロボットに対し/cgi-bin/dataの中身はキャッシュするなという命令を与えた
「つもり」だったのです、しかしこれがあだになり、検索サイトからフレッシュゴーゴーのヒットが
一気に消えていきました。
びっくりして調べてみると、robots.txtは一つでもAllowがあると前提条件として

Disallow: /

になってしまうからです。
おそらくセキュリティの為でしょうが、検索に引っかかりたくないディレクトリがある場合はまず

allow: /
Disallow: /cgi-bin/data

が必要だったのです。
これに気づいて、robots.txtは削除してどのようにして検索エンジンにインデックス化されるか見守っていきます。

トップページへ

【文字化けについて】

まず、検索結果が文字化けしていたので文字コードを色々変更してみました。
初めは、「国際化」を気取ってUTF-8にしていたのですが、見事に検索結果が文字化けを起こしてしまいました。
これはShift-Jisに戻すことにより解決。
トップページへ

【フレームについて】

次にGoogleのキャッシュをクリックすると「真っ白けっけ!!」、フレームにしていたため
キャッシュである説明文が頭に付くと、フレームが有効にならないのです。

SEOの為にはフレームは厳禁!!ってのは知ってたけど、実際フレームがあったほうが
アクセシビリティが良いので、<noframe>をちゃんと書いたりして使ってたのですが
キャッシュで起こる問題はどうしようもなかったので、フレーム構成を止めました。

トップページへ

【meta name="robots"について】

検索エンジンに色々ヒットしてもらおうとして、わざわざMETAタグにrobots指定を書きました。

<meta name="robots" content="index,follow">

インデックス化を許可し、さらにリンク先のインデックスも許可しました。
ちなみに拒否は「noindex, nofollow」

しかし、一向に検索サイトでヒットしません。
ヒットしても、昔のページがヒットするだけでぜんぜん新しい情報をキャッシュしてくれません。
サーバのログを見てみると

【googleのロボット】
crawl-66-249-66-69.googlebot.com - - [16/Jul/2005:08:56:18 +0900] "GET /robots.txt HTTP/1.1" 200 23
crawl-66-249-66-69.googlebot.com - - [16/Jul/2005:08:56:19 +0900] "GET / HTTP/1.1" 200 1620
crawl-66-249-66-69.googlebot.com - - [16/Jul/2005:18:04:06 +0900] "GET /~flesh_gogo/ HTTP/1.1" 200 15233

このように、googleのロボットが訪れてはいるのですがトップページ以降まったく読んでいません。
msnのロボットはガンガンインデックス化していくのですが、
yahooもまったくダメです(yahooの子会社のinktomisearchはきているのですが・・・検索に出てきません)

【msnのロボット】
msnbot.msn.com - - [12/Aug/2005:22:19:35 +0900] "GET /~flesh_gogo/cgi-bin/blog_read_body.cgi?Serial=20050710173454 HTTP/1.0" 00 907
msnbot.msn.com - - [12/Aug/2005:22:21:11 +0900] "GET /~flesh_gogo/openoffice2.html HTTP/1.0" 200 19145
msnbot.msn.com - - [12/Aug/2005:22:21:43 +0900] "GET /~flesh_gogo/obbs.html HTTP/1.0" 200 44179
msnbot.msn.com - - [12/Aug/2005:22:21:58 +0900] "GET /~flesh_gogo/adventureworld.html HTTP/1.0" 200 5371
msnbot.msn.com - - [12/Aug/2005:22:22:38 +0900] "GET /~flesh_gogo/cgi-bin/blog_read_body.cgi?Serial=20050710173704 HTTP/1.0" 200 876
msnbot.msn.com - - [12/Aug/2005:23:39:13 +0900] "GET /robots.txt HTTP/1.0" 404 284
msnbot.msn.com - - [12/Aug/2005:23:39:14 +0900] "GET /~flesh_gogo/cgi-bin/blog_comment_form.cgi?Serial=20050710173454 HTTP/1.0" 200 521
msnbot.msn.com - - [12/Aug/2005:23:40:25 +0900] "GET /~flesh_gogo/index.html HTTP/1.0" 200 11058
msnbot.msn.com - - [12/Aug/2005:23:40:28 +0900] "GET /~flesh_gogo/openoffice/sozai/switch-3750-02.wmf HTTP/1.0" 200 53082
msnbot.msn.com - - [12/Aug/2005:23:40:32 +0900] "GET /~flesh_gogo/openoffice/sozai/switch-8p.wmf HTTP/1.0" 200 33110
msnbot.msn.com - - [12/Aug/2005:23:40:34 +0900] "GET /~flesh_gogo/openoffice/sozai/phone03.wmf HTTP/1.0" 200 12526

【yahooの子会社inktomisearchのロボット】
lj2535.inktomisearch.com - - [15/Aug/2005:09:04:42 +0900] "GET /robots.txt HTTP/1.0" 404 284
lj2221.inktomisearch.com - - [15/Aug/2005:09:04:43 +0900] "GET / HTTP/1.0" 200 343
lj2535.inktomisearch.com - - [15/Aug/2005:12:06:08 +0900] "GET /robots.txt HTTP/1.0" 404 284
lj2051.inktomisearch.com - - [15/Aug/2005:12:06:09 +0900] "GET /~flesh_gogo/openoffice2.html HTTP/1.0" 200 19522

これはrobots.txtの時のようにいらん事を書いているから、検索エンジンに拒否されてるのでは?と思い
思い切って「meta name="robots"」をはずしました。

するとあっさりGoogleはキャッシュしていきました。

【googleのロボット】
crawl-66-249-71-28.googlebot.com - - [21/Aug/2005:23:15:07 +0900] "GET /~flesh_gogo/obbs.html HTTP/1.0" 200 43940 "-" "Googlebot/2.1 (+http://www.google.com/bot.html)"
crawl-66-249-64-39.googlebot.com - - [22/Aug/2005:00:53:05 +0900] "GET /~flesh_gogo/openoffice2.html HTTP/1.0" 200 24956 "-" "Googlebot/2.1 (+http://www.google.com/bot.html)"
crawl-66-249-71-32.googlebot.com - - [22/Aug/2005:00:53:14 +0900] "GET /~flesh_gogo/adventureworld.html HTTP/1.0" 200 5610 "-" "Googlebot/2.1 (+http://www.google.com/bot.html)"
crawl-66-249-71-69.googlebot.com - - [22/Aug/2005:01:12:37 +0900] "GET /~flesh_gogo/windows.html HTTP/1.0" 200 8068 "-" "Googlebot/2.1 (+http://www.google.com/bot.html)"
crawl-66-249-71-70.googlebot.com - - [22/Aug/2005:02:08:34 +0900] "GET /~flesh_gogo/seo.html HTTP/1.0" 200 3884 "-" "Googlebot/2.1 (+http://www.google.com/bot.html)"

ほんとガックリです。
完全にいらないことをしていました。

トップページへ

【検索結果表示について】

検索して出てきた情報が整理されていないと、あまりそのページに興味を示さないので
どのようにDBにインデックスされているか調べて見ます。

調べる項目は「METAのkeywords」「METAのdescription」「title」「h1」「h2」です。
トップページを以下のように設定しました。

<head>
<META NAME="keywords" content="フレッシュゴーゴー,よしを,二酸化炭素,OpenBlocks,Linux,OpenOffice,日記,写真,地図,マッハタイプ,大阪,天気,兵庫,奈良,ガンダム">
<META NAME="description" content="フレッシュゴーゴー1">
<title>フレッシュゴーゴー - 2</title>
</head>
<body>

<h1>フレッシュゴーゴー3</h1>
<h2><span class="MarkType1">◆</span>
このHPは自然エネルギー推進/OpenBlocks/気まぐれな日記/Windows/OpenOfficeのページです。<BR>
 天気予報システムも搭載予定ですが、どういった表示方法にするか思案中。<BR>
</h2>


【結果:検索ワード>フレッシュゴーゴー】
●MSNの場合 フレッシュゴーゴー - 2
... ゴーゴー,よしを,二酸化炭素,OpenBlocks,Linux,OpenOffice,日記,写真,地図,マッハタイプ,大阪,天気,兵庫,奈良,ガンダム フレッシュゴーゴー1 フレッシュゴーゴー3 ◆ このHPは自然エネルギー推進/OpenBlocks/気まぐれな日記/Windows/OpenOfficeのページです。  天気予報システムも ...

machtype.com/~flesh_gogo キャッシュ ページ 2005/08/19

●google.comの場合

フレッシュゴーゴー - 2 - [ Translate this page ]
フレッシュゴーゴー1. ... リンクも無断でOKです。 改変すると改変後の作品の著作権
がフレッシュゴーゴーに帰属するので注意してください。...
machtype.com/~flesh_gogo/ - 18k - Cached - Similar pages

●google.co.jpの場合 フレッシュゴーゴー - 2
フレッシュゴーゴー1. ... http://machtype.com/~flesh_gogo/ 以下のファイルに関する
著作権はすべて フレッシュゴーゴーに所属します。 これらのファイルを許可無く無断で
複製、転載することを禁止します。 ただし、複製元・転載元を明記するときは、 ...
machtype.com/~flesh_gogo/ - 18k - キャッシュ - 関連ページ

トップページへ

【MSNの場合】

TITLE
Keywords Description h1 h2

こういうフォーマットになっている様である。
キーワードがタイトルの次の先頭になっているので、なんともかっこ悪いです。
次にDescription・h1・h2が来ていますがh1 h2ではなく「先頭の文字」ということも考えられます。

トップページへ

【google場合】

TITLE
Description 本文中の検索ワードがヒットした場所

google.com(英語版)に登録したら、あっという間にインデックスされたのですが
ここで興味深い結果が出ました、本文中には一番上に<h1>タグで指定したタイトルと
一番下に著作権表示があるだけです。

色々なサイトで「<h1>タグは重要だ!!」なんて事が書かれているが、google.comでは
逆に<h1>タグを飛ばして下の著作権表示が表示された。

ちなみに日本語版は英語版の1日後に反映されました。

ここまでで分かったことは「Descriptionをしっかり書こう!!」と言うことです。

トップページへ

【Descriptioをしっかり書こう】

実験台1段
  index.htmlを変更
   ☆このHPは二酸化炭素削減・OpenBlocks・Windowsでの色々・OpenOffice・遊び・パンダ・
    SEO対策・無線LANに興味を持った者による落書きページです☆

  結果
   Google
    フレッシュゴーゴー - 2
    ☆このHPは二酸化炭素削減・OpenBlocks・Windowsでの色々・OpenOffice・遊び・
    パンダ・<br> SEO対策・無線LANに興味を持った者による落書きページです☆
    machtype.com/~flesh_gogo/ - 30k - 2005年8月31日 - キャッシュ - 関連ページ

    狙い通りです^^

  seo.htmlを変更
   ☆このHPは検索サイトに旨く引っかかる為に、孤軍奮闘している記録です。本やうわさに頼らず、実践でがんばってます☆

  結果
   Google
    フレッシュゴーゴー - SEO対策
    ☆このHPは検索サイトに旨く引っかかる為に、孤軍奮闘している記録です。本やうわさ に頼らず、実践でがんばってます☆
    machtype.com/~flesh_gogo/seo.html - 28k - 2005年8月31日 - キャッシュ - 関連ページ

    これで、他のサイトと一味違った検索結果を表示することができますw


トップページへ

【Keywordsはいらない!?】


最近の検索エンジンはBodyタグの中までインデックス化していくので、もはやKeywordsタグは必要ないのでは?
むしろ、検索結果に単語の羅列が表示されるので消したほうがいいかも!?

実験台2段
  
index.htmlを変更
   前々から「要らないかも!?」って思っていたので、すでにindex.htmlにしかなかったので、ここも削除してみます。

トップページへ

【Blogでアクセス数アップって本当!?】

日経新聞などでよくBlogでアクセス数アップ等あるが、本当なのだろうか?
そもそも広告マーケティングツールとしてBlogってありなのか?
僕的にはBlogはコンテンツマネージメントシステム(CMS)をエンドユーザが無料で手に入れることが
できるものだと思っている。

企業としては、広告収入業にしか役に立たないのでは・・・・と思っている。

しかし、アクセス数アップと言う点ではまったくそのとおりである。

なぜかと言うと、ブログは主に日記などで使われているので、その内容は多岐に渡ります。
そうすると、自分が思ってもいない言葉で検索に引っかかります。

たとえば、 フレッシュゴーゴーの検索結果です。

http://www.google.co.jp/search?q=%E3%83%95%E3%83%AC%E3%83%83%E3%82%B7%E3%83%A5%E3%82%B4%E3%83%BC%E3%82%B4%E3%83%BC&hl=ja&hs=skI&lr=lang_ja&client=firefox-a&rls=org.mozilla:ja-JP:official&start=0&sa=N

ZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZ
ゴンノジブンガイチバンニッキ 1ガツ
... はやく人間になりた〜い! フレッシュ高校2年のある日の事。
学校でボヤ騒ぎが起こった。 俺は事件が大好きだ! 他の教室のドアを開き、
「火事だ〜行くぞ〜ゴーゴーフレッシュゴーゴーフレッシュ!」と言いながら ...
elekies.com/shukaku200401.html - 23k - 補足結果 - キャッシュ - 関連ページ
ZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZZ

↑が検索結果として出てきます。
そうです、フレッシュゴーゴーではなくゴーゴーフレッシュなのです^^;
それなのに、SEOをやる前はこのホームページより上位に来ていました;;(↑のページミュージシャンなんですがなかなかよいですw)

ブログ恐るべしですw

トップページへ

【インデックスされるパターンについて】

index /indeks/ -> 索引・指針・指数

New College English-Japanese Dictionary, 6th edition (C) Kenkyusha Ltd. 1967,1994,1998

索引 -> 書物や書類に現われた事項・語句などを抜き出して一定の順序で配列し、
    記載されているページなどがすぐに捜し出せるようにしたもの。インデックス。

Shin Meikai Kokugo Dictionary, 5th edition (C) Sanseido Co., Ltd. 1972,1974,1981,1989,1997

よくインデックスと言う言葉を使ってきましたが、インデックスとは索引のことで
検索サイトで検索すると言うことは索引から目的の文字を検索すると言うことなのです。

実は最近の検索エンジンは非常に賢く、HPの内容を調査し、その中の単語をインデックス化し
DBに保存しているのです。

しかも、文節まで理解しているらしく、
トップページにあるGoogleの窓でmachtype.com内を
「オフィシャルユーザーズガイド」と検索すると1件もヒットしないのですが

http://www.google.co.jp/custom?domains=machtype.com&q=%83I%83t%83B%83V%83%83%83%8B%83%86%81%5B%83U%81%5B%83Y%83K%83C%83h&sa=%8C%9F%8D%F5&sitesearch=machtype.com&client=pub-7606293172709662&forid=1&ie=Shift_JIS&oe=Shift_JIS&cof=GALT%3A%2333CC33%3BGL%3A1%3BDIV%3A%23FFFFFF%3BVLC%3A663399%3BAH%3Acenter%3BBGC%3AFFFFFF%3BLBGC%3A99FFCC%3BALC%3A0033FF%3BLC%3A0033FF%3BT%3A009966%3BGFNT%3A33CCFF%3BGIMP%3A33CCFF%3BFORID%3A1%3B&hl=ja

「アンオフィシャルユーザーズガイド」 と検索すると見事にヒットします。

http://www.google.co.jp/custom?hl=ja&inlang=ja&ie=Shift_JIS&oe=Shift_JIS&client=pub-7606293172709662&cof=FORID%3A1%3BGL%3A1%3BBGC%3AFFFFFF%3BT%3A%23009966%3BLC%3A%230033ff%3BVLC%3A%23663399%3BALC%3A%230033ff%3BGALT%3A%2333CC33%3BGFNT%3A%2333ccff%3BGIMP%3A%2333ccff%3BDIV%3A%230033ff%3BLBGC%3A99FFCC%3BAH%3Acenter%3B&domains=machtype.com&q=%83A%83%93%83I%83t%83B%83V%83%83%83%8B%83%86%81%5B%83U%81%5B%83Y%83K%83C%83h&btnG=Google+%8C%9F%8D%F5&sitesearch=machtype.com

それがどうしたって感じですが、次を見てください。

「ゴーゴー」と検索します。

http://www.google.co.jp/custom?hl=ja&inlang=ja&ie=Shift_JIS&oe=Shift_JIS&client=pub-7606293172709662&cof=FORID%3A1%3BGL%3A1%3BBGC%3AFFFFFF%3BT%3A%23009966%3BLC%3A%230033ff%3BVLC%3A%23663399%3BALC%3A%230033ff%3BGALT%3A%2333CC33%3BGFNT%3A%2333ccff%3BGIMP%3A%2333ccff%3BDIV%3A%230033ff%3BLBGC%3A99FFCC%3BAH%3Acenter%3B&domains=machtype.com&q=%83S%81%5B%83S%81%5B&btnG=Google+%8C%9F%8D%F5&sitesearch=machtype.com

なぜかヒットします。「オフィシャルユーザーズガイド」の事象からするとヒットしないはずなのに
【Blogでアクセス数アップって本当!?】 で書いたとおり「ゴーゴーフレッシュ」でもヒットします。

そうです、Googleはおそらく独自に辞書を持っており「フレッシュ」という単語を理解し
「フレッシュ」と「ゴーゴー」は別の単語だと判断したわけです。

なかなかすごい仕組みですね。
「アン〜」と言うのは、否定か反対語でその後に続くものは一つの単語として判断しているのです。
だから、もしアクセス数アップを狙うなら文中に「オフィシャルユーザーズガイド」と言う単語を入れておけば
OpenOfficeについての使い方を知りたい人をHPに導くことができます。


トップページへ

【robots.txt 再チャレンジ】

robots.txt の下記間違いにより、検索に引っかからなくなった事から、robots.txtを削除したのだが
相変わらずrobots.txtにはアクセスがあるようだ。

ログを調査してみます。

cat /var/log/httpd/access_log | grep robots.txt > robots.log
vi robots.log


【roblots.log】の中から抽出
crawl26-public.alexa.com - - [25/Aug/2005:22:22:35 +0900] "GET /robots.txt HTTP/1.0" 404 284 "-" "ia_archiver"
lj2139.inktomisearch.com - - [26/Aug/2005:09:49:16 +0900] "GET /robots.txt HTTP/1.0" 404 288 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"
crawl-66-249-65-225.googlebot.com - - [26/Aug/2005:18:46:20 +0900] "GET /robots.txt HTTP/1.1" 404 284 "-" "Mediapartners-Google/2.1"
fp2.almaden.ibm.com - - [27/Aug/2005:02:29:52 +0900] "GET /robots.txt HTTP/1.0" 404 284 "-" "http://www.almaden.ibm.com/cs/crawler [bc7]"
192.55.214.54 - - [28/Aug/2005:15:24:16 +0900] "GET /zzrobots.txt HTTP/1.0" 404 286 "-" "Microsoft_Internet_Explorer_5.00.439ex (fjones@isd.net)"
msnbot.msn.com - - [28/Aug/2005:17:42:58 +0900] "GET /robots.txt HTTP/1.0" 404 284 "-" "msnbot/1.0 (+http://search.msn.com/msnbot.htm)"
i60-35-240-74.s04.a007.ap.plala.or.jp - - [29/Aug/2005:13:50:42 +0900] "GET /robots.txt HTTP/1.1" 404 284 "http://machtype.com/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.1.4322)"
www.whois.sc - - [29/Aug/2005:14:41:58 +0900] "GET /robots.txt HTTP/1.1" 404 288 "http://www.whois.sc/" "SurveyBot/2.3 (Whois Source)"


大手の検索サイトはかなりrobots.txtを重要視していることが分かります。

【robots.txt】の中身
User-Agent: *
allow: /

取り合えず、これで様子見ます。
個人情報などが入っているサーバでは、この段階で導入しないでください。

ちなみにrobots.txtについての公式サイトらしきものを見つけました。
http://www.robotstxt.org/

トップページへ

【Yahoo!にインデックスされない!?】

色々手を尽くし、Google・MSNにはインデックスされたのに、Yahoo!にはいっこうにインデックスされません;;
ログを見てrobots.txtをガンガン見に来ているから、robots.txtを再設定したんですが・・・・。

確かに、robots.txtを設置してから、ガンガンアクセスしに来るんですが、それは初代フレッシュゴーゴーの
すでに公開していないファイルばかり、ぜんぜん新しいファイルを見に来てくれません。

まったく不可解です。
一度robots.txtの設定を間違えるともうだめなのかなぁ?

トップページへ

【画像のAltについて】

ホームページで画像を表示するときに使う<img>タグに「alt」と言う物があります。
Altとは「Alternate text」の略で、日本語にすると「代わりのテキスト」となります。

つまり、インターネットの速度がまだ遅かった頃、ホームページの枠組みは見えるのに
画像がまだ出てこないと言う時期がありました。

その時代Altは必須で、ここには「○○」と言う画像があるよ!と表示するために
記述していました。

しかし、ブロードバンド時代が来て、もはや画像を表示するまでの待ち時間がなくなりました。

だが、Altは役割を変えて今も行き続けています。

【現在の主な使われ方】
  ・音声読み上げ時に画像がある場合は「Alt」を読み上げる
  ・サーチエンジンが画像の変わりに「Alt」をインデックスする(最近は画像自体もインデックスしていくが・・・)

つまり、「Alt」はSEOにとって重要なアイテムになっているのです。

実験的にフレッシュゴーゴーの「Machtype」と「Grespect」の画像に
 ・あひるのあかちゃんあいうえお
 ・かきのきくりのきかきくけこ
 ・ささのはさらさらさしすせそ

と、Altに指定しました。
そして「あひる」でGoogle検索してみると↓

  フレッシュゴーゴー - 2
  あひるのあかちゃんあいうえお ・ かきのきくりのきかきくけこ ◆Grespect◆ ささ
  のはさらさらさしすせそ ◆BookMark◆. ホーム ・ マッハメール ・ 日興ビーンズ ・
  impress watch headline ・ asahi.com ・ 連邦 ・ Class A提携店舗検索 ...
  machtype.com/~flesh_gogo/ - 関連ページ


見事に引っかかりましたw
これでAltの重要さが良く分かったと思います。

よく、レイアウト指示書に書かれている文字をそのまま、Altに指定しているホームページがある(Alt='タイトル'等)が
超ナンセンスで、検索に引っかかっても言いように、関連した内容を記述するべきである。

トップページへ

【効果】

Google
  グーグルにインデックスされたとたんにwindows・Openblocks・OpenOfficeにアクセスがやってくるようになりました。
  Googleは技術者系に人気があるようです。

ぐーまに結果
  
2005/08/26
  2005/09/06

【SEO対策リンク集】

SEO対策として、相互リンクがあれば検索上位にくるなどのふれこみに従い3・4つ
登録したのですが、あまり効果がありませんでした。

どっちかというと、リンク集のHPに方に効果があり、登録サイトのトップページに必ず
リンクがあることから、かなり上位にランクインしています。

しかもYahooではスパムと認定されてしまいます。
What is search engine spam? に「Excessively cross-linking sites to inflate a site's apparent popularity」
とあります。

と言うことで、リンク削除しました。


トップページへ