memo log

=備忘録=

忘れないようにメモしたblogです。 ※ 何か手順が載っていたりしますが、責任はとれません。

検索サイトを拒否るメモ

以前やっていたブログサイトで実績はある。
ルールを無視するbot以外は拒否できた。


  •  インデックス登録拒否をする

以下をHTMLの<head>直後にでも入れると拒否してくれる
<meta name="robots" content="noindex">

 content="all"にしたらどうよ。って言われるが、実はallに対応していない検索botがいる。

 Hatena Blogではどこに入れたらいいかという事はよくわかりません。以前のところなら好きにいじれたのですが。

他にも拒否するタグはたくさんある。「METAタグ 拒否」 あたりで検索するといい

 

 以下、Googleのとあるサービスのヘルプページを参考にして欲しい
http://support.google.com/webmasters/bin/answer.py?hl=ja&answer=156449 

要は、このファイルが水戸黄門のお札ような役目を果たす。
これを見たbotは立ち去る(ただしルールに従うbotのみ)

内容は以下3行を書いたテキストファイルを
サイトの直下に置けば良い

  1. User-agent: *
  2. Disallow: /
  3.  

 3行目は空白行で結構です。
(文頭の1,2,3がコピーできてしまうようなら消してください・・・)

あと、Hatena Blogではどこに入れたらいいかという事はよくわかりません。おそらく使用できません。(※その2に補足を記載!)

 

  • その他

まあ、上の2つをやれば大抵避けれるが
blogやサイトに以下の機能があれば一緒に行うと効果がある。

  •  IPアドレスbotを拒否する
    どうもルールを守らない海外検索サイトとか、国内の争っている2拠点のSNSサイトとか色々
  • ping通知(更新通知をオフにする)
  • RSS機能を止める
などなど、詳しくは設定を見なおしてください。
 
では
----
その2に続く

arigs.hateblo.jp