Friday 18 July 2014

ウェブ魚拓を拒否する方法 Blogger

ウェブ魚拓を拒否する方法。(2014/7/18現在)
http://megalodon.jp/pc/page/qa#prohibitcache
を参考にBloggerの場合をまとめた。
下記の1または2により拒否できるとのことだけど、両方やっとけば多少安心か?

(方法1)以下のMETAタグをHEADタグ内に書く
テンプレートHTMLを手作業で編集。
<meta name="robots" content="noindex,nofollow"/>
↑Bloggerの場合は閉じ山括弧の前に / が必要のようです。

自分の場合はエディットしたことが分かるようにコメントを付けます。
<meta name="robots" content="noindex,nofollow"/><!--edit-->

(方法2)ルートディレクトリにrobots.txtを設置して、"Megalodon"が取得不可能なパスを指定する
なお、robots.txtはキャッシュしておりますので、変更が反映されるまで長くて3日かかります。

設定→検索設定→独自のrobots.txt
で設定する。

Bloggerのデフォルトrobots.txtは下記の通り。

User-agent: Mediapartners-Google
Disallow:

User-agent: *
Disallow: /search
Allow: /

Sitemap: http://○○○.blogspot.com/feeds/posts/default?orderby=UPDATED

しかし手作業でrobots.txtを書く場合は入力欄は空白になっているので、上記の記述にMegalodon用の拒否を加えたものを入力する。

User-agent: Mediapartners-Google
Disallow:

User-agent: *
Disallow: /search
Allow: /

User-agent: Megalodon
Disallow: /

Sitemap: http://○○○.blogspot.com/feeds/posts/default?orderby=UPDATED

もし、検索エンジンのクロールも全て拒否して良いならば下記の通り。
設定→基本→プライバシーで『ブログの検索を検索エンジンに許可しますか?』を『いいえ』にすると、自動的に下記のようになるので、これでウェブ魚拓も拒否できるはず。

User-agent: *
Disallow: /search
Disallow: /

No comments:

Post a Comment