Prodused by SAKI

This site is a personal works of "SAKI".
I hope there will be a much of fun contents and funny dreams.
Of coursse that is a future occurrence.
The Watchword is "Picture Yourself".

Count:15415(0/0)Bot:640448(32/33)
HOME>BLOG > 日記 > 開発日記 > アクセスIDでごそごそ

Attention!! Your Access is doubtful of Bot or Crawler.
 当サイトは日本国内からの正当なアクセスがなされることを前提にページを作成しています。
 BOTによるアクセスであると判断した場合は、画像や書庫ファイル、スタイルシートなどを廃した"情報"のみが表示されます。
 もし、そういった心当たりのない方でこのメッセージが表示された場合は、クッキーが保存されない、ユーザーエージェントにBOTを連想させる文字列が含まれている、海外Ploxy経由などの可能性があります。
 できましたら、正当な環境にてアクセスされますようお願いいたします。
 なお、ご不明な点や、どうしても現在の環境でのアクセスをご希望される場合は、メールフォームにて相談して頂ければ善処させていただきたいと思います。

MODE: ゲストモード

USER ID:
PASS:
ADMIN

TOP PAGE
サイトトップに戻ります

はじめに
このサイトの紹介です

更新履歴
このサイトの更新履歴です

掲示板
足跡を残してくれると嬉しい

リンク
他サイトへのリンクページです

INDEX
入口ページに戻ります

ARCHIVES
検索および過去記事

<前月 2024年03月 次月>
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31       

NEW ENTRIES
最近の記事

CATEGORIES
カテゴリ一覧

ACCESS RANK
閲覧回数ランキング

ランキング対象がありません[]

COMMENTS
最近のコメント

POWERED BY

NOTICE
 拙作のBlogn用モジュール(コメントアイコン等)をお求めに立ち寄られた方へ、
サーバー移転時に不都合があり、(旧)ブログの移転作業が頓挫してしまいました。本家「開発コーナー」にて新バージョンを紹介させていただいていますのでご参照くださいませ。

コメントアイコン&絵文字モジュール
表示モード別分岐タグモジュール

 なお、「開発コーナー」では上記のモジュールだけでなく、それ以降にリリースしたモジュール等も掲載させていただいてます。
Prev(新しい記事)< >Next(古い記事)

 う~む、息が切れてしまった。
 ちょいとHP版の方で使っているアクセスカウンタ周りのスクリプトを根本的に見直そうかと思い立ち、作業を始めてしまいました。

ごそごそ

[PIC]

 なにやらいかがわしい感じです。

 ただのアクセスカウンタだけなら、それほど苦労はしなかったのですが、私の場合、同じスクリプトの中で、このブログのモジュールでも試用しているアクセスIDとか、履歴、ページ(コンテンツ)ごとの表示回数などの記録などの処理をさせていることで、最初は気軽に始めた作業も、どんどん大変なことになってきました。

 まぁ、単純に言うと「BOTもCrawlerもみんな通してしまえっ」ということです。

 もちろん、いつでもアク禁にできるようには作るつもりなんですけどね。

 んで、その動機というのが、



続きを読む ≫
 検索サイトで自分のHPを検索すると、このブログばっかりがヒットする。

 んー、世の中猫も杓子もブログな時代、飛び交うCrawlerもRSSリーダーもみんなブログ狙いなわけだから当たり前といえば当たり前なんですけどね。
 私としては、少々悔しいのですよ。

 しかも、

 「いくつかヒットするHP版の方に、全然トップページあるいは入り口ページが無い」

 トップや入り口はフリーで通してるはずなんですけどねぇ。まあ、それならそれで、以前から考えていた仕様を実現させようと思った次第です。

 具体的には、

 各コンテンツ内への入場をフリーにする代わりに、必要以上にサーバーへの負担とはならないよう、ロボットさんたちには画像あるいは書庫ファイル等、比較的サイズの大きいファイルへのアクセスはさせない。
 つまり、転送量について必要最低限に抑える、というものです。もちろん、フォームへのポストなども控えてもらいます。
 所詮HTML部分はテキストデータです。相当文字数の大きなページであっても、ちょこっとしたサイズの画像1つ分の転送量にも及ばないだろう、という発想です。

 そのための手段としては、明らかにBOTさんだと判明しているアクセス元に対しては、出力するHTMLの中から画像関係のタグやリンクなどをスクリプトによって削除あるいは代替文字に置き換えてしまうことを考えています。普通の情報収集や、検索エンジンさん、またRSSリーダー等であれば、別に画像ファイルは必要ないでしょう?

 しかし、そういった極端な手法をするためには、可能なかぎりBOTか否かの判定を厳密に行う必要があるわけで、そのための仕様を模索しながら、同時に動作チェックを行っているわけですね。

 その判定の参考にしているのが、

 ユーザーエージェント内の文字列("Bot" や "Search" などがあるようならまだ良心的。安心して通しましょう)
 クライアントがクッキーを保存するかどうか(保存しない場合は間違いなくロボットさんです/DoCoMo携帯は除く)
 海外からのアクセス(ロボットさん以外でそんなところからいらっしゃるお客さんに心当たりはありません)
 PROXYなアクセス(生理的に、私は串さんは嫌いです)
 挙動不審なアクセス(hidden属性とかで見えないはずのリンクをたどってくるとか~罠を張るわけね。ぐふふふ……実はこれが一番やりたかったのか、私)

 だいたいこんなところです。今回、できるだけ自力でやれるところまでやってみよう、と考えているので、不正IPデータベースとかおそらく探せば見つかるのでしょうが、そういったものには手を広げていません。(でも、そのうち真剣に探そうとは思います)

 この中で、「挙動不審IP」はこれからですが、それ以外については格好はついてきた感じです。今のところバグが怖いので、既存のカウンタスクリプトと閉口して、別ログファイルとか使って動作チェック中です。
 もっとも、些細な(つまり大バカな)ミスで既存のカウンタファイルを上書きしてしまうという醜態を晒してしまいましたが。(あはははっ)

 んで、ぼちぼちと履歴ファイルとかが溜まってくるのに併せて、それらの管理画面関係のスクリプトに手をつけ始めたところです。

 管理? なにを管理するんだ? と考えながら取り掛かると、いろいろと欲が出てきてしまうようで、各アクセスの対象ページごとのランキング付けとか、よく見かける時間帯別アクセスのグラフ化だとか、果ては判別不明だったIPを手作業(Web上)で修正したり、アクセス元の分かっているIDにエイリアス名をつけて表示してみようか、だとか、変なことばかりが浮かんできます。(そうやって自分の首を絞めるわけですね)

 そこで頓挫。(はぁはぁ)

 勢いだけですぐに出来上がる代物でもなかったです。少しペースダウンかな。(おいおい、あの不気味な表示を放置しとくのか?)

 あ、ついでに、このスクリプト、多少の手直しでBlognのモジュールに仕立て直すことを想定しています。完成したら、長年お世話になったカルカンカウンターさんと入れ替えってなことになるかもです。


≪ 続きを隠す

|2009,01,11, Sunday 06:44 PM | comments (0) | trackback (0) |

この記事に対するコメントの受付は終了しています。

コメント

トラックバックURL

http://bvs.saki-net.com/tb.php/145

トラックバック

Prev(新しい記事)< >Next(古い記事)


Copyright © 2008-2009 The Blue and Violet Storys All Rights Reserved.
当ページに掲載しているコンテンツの再利用(再転載・配布など)は、禁止しています。