いい加減頭にきたので、
HP版の方のアクセス制限を強化しました。
HP版にはもともと、ブログ版よりも遥かに高いアクセス制限がかけてあり、トップページを経由しない場合や、たとえばこのブログ、またHP内のいずれかのページなどの許可されたURLからのリンクでなければエラーを返すようにしています。しかし、不思議なことに以下のようなアクセスがあったりするわけです。
Time:20080726065006 IP:71.41.200.82 ID:1
Time:20080726064957 IP:71.41.200.74 ID:1
Time:20080726064946 IP:71.41.200.82 ID:1
Time:20080726064933 IP:71.41.200.74 ID:1
Time:20080726064911 IP:71.41.200.78 ID:1
Time:20080726064900 IP:71.41.200.82 ID:1
Time:20080726064851 IP:71.41.200.78 ID:1
なんだ、これ?
異なるIP(3種)から交代でアクセスしてきます。UAなどを見るとどうやらアメリカからの検索BOTらしいです。むむ、一応国別拒否で中国や韓国、台湾からのアクセスはシャットアウトしており、アメリカは今のところ拒否はしていなかったのですが、この実態を見るとそれも検討したくなります。
どれも最初にトップページを開いてはおらず、こういうアクセスが可能なのは、ブログに設定してあるリンクをたどってきた、という可能性が一番高いと思われます。
ともかく、一番右のIDがずっと「1」であるということはクッキーが保存されないBOTであることは明らかですが、それを拒否条件にするわけにはいきません。以前このこのブログのアクセスIDチェックモジュールの説明でも書いたとおり、初アクセス(クッキーが空)の場合は暫定的に「1」を設定するようにしてあるからです。
ということで、もう直接UAを判定することにしました。トップページ以外へのBOTらしきUA("bot"あるいは"http"を含む)はすべて拒否にします。トップページだけは、一応入口なので残しました。(甘いかなぁ)
≪ 続きを隠す