まーたどっかのアホ BOT が crawl…

Diary
この記事は約2分で読めます。
この記事は最終更新日より 1 年以上経過しています。
画像やリンクが無効になっている可能性もあるのでご了承下さい。

co.uk の TLD ((TopLevelDomain)) を持つホストから UA ((UserAgent)) に「MJ12bot/v1.0.8」なんて付けてこのブログを
1 時間ちょいかけて 906 アクセスをかましてきた。

サーバーのステータスが変だったから全部調べた。
Munin ((Linux の監視ツール)) のグラフやら Apache ((Web サーバーソフトウェア)) の生ログから該当時間の大量アクセスを抽出等々。
「MJ12bot/v1.0.8 (http://majestic12.co.uk/bot.php?+)」
こいつは一応弾いておいた方がいいかもしれないね。
うちはもうコンテンツ総なめされちったからほっとくけど (笑

.htaccess で弾くなら

SetEnvIf User-Agent “^MJ12bot” BAN
Order Allow,Deny
Allow from all
Deny from BAN

単品ならこんな感じですわな。
SetEnvIf を複数書いて BAN という変数に結びつければアレコレと制御可能です。
「SetEnvIf User-Agent “^MJ12bot” BAN」これ説明すると~
ユーザーエージェントが MJ12bot で始まるアクセスであれば変数 BAN をセットする。
ということになりますです。
そんで、セットされていれば「Deny from BAN」これに引っかかってアクセス不能と。
ダブルクォーテーションで囲われた間だは PCRE ((Perl 互換正規表現)) で評価されるので特殊文字はエスケープする。

セットされた変数を解除するには「!BAN」という感じでエクスクラメーションを付加する。
解除を使うのは多重に定義したルールで例外的に通すよーとかでつかってますわ。

著者プロフィール
ぶっち

本格的に PC へ触れ始めてたのは 1990 年位から。
興味は PC 全般。OS は Windows と Linux などを嗜む。
プログラマやネットワークエンジニアを経てフリーに活動している 2 児の父な 40 代半ばのおじさんです。

ぶっちをフォローする

コメント

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.