Log Analysis

[today]

Introduction

自分のWebページを作り始めたのは1995年(1994年?)あたりだと記憶している。 当時在学していた大学のマシンにNCSA httpdをinstallしてみたときだ。 (おそらく在籍していた大学で一番最初に立ち上がったhttpdである) 1996年3月から卒業のため一時休んで、その年の夏1996年8月から 現在の形の改訂版suchi webpageを再開している。 半年後、httpdのログを見たら思いのほかアクセスが多いので、 トップページにカウンタを付けた。1997年4月末である。
カウンタは簡単なperlスクリプトで実装している。 カウンタが起動された日付も同時に記録しログを残すようにした。 (httpdのaccess_logとは別に)awkやperlが好きな人には多いと思うのだが、 あとから集計してみると面白いかと思ったのだ カウンタが10000を超えたのは1998年11月。これを機会に集計のネタを 増やそうと(いったい誰がそんなに見ているのだと疑問に思ったのもあるが) referer(参照元URL)やclient host, Agent情報もログに出力するようにし、 また各コーナーごとにアクセスカウンタを付けるようにした。
結局あまり興味が向かずにそのままになっていたのだが、 Northのログ 解析ページを真似てみた(1999/12)。なお複数ページが 同じカウンタを指していたり、アンテナなどのエージェントチェックなども 行っていないので数値そのものはあまり厳密ではない(2002/08)


〜2002/07


久しぶりにグラフを書いてみた。上旬/中旬/下旬に分けてプロットしてあるので、 10で割るとだいたい1日のアクセス数になる。
perl(awk)とExcelはいろんな意味で対極にあるが、 本当によくできたソフトウェアだというのは共通している。

1999/10と2001/7のmovedページのピークはそれぞれサイトを移動したときにあたる。 旧URLすべてから自動転送されたときにURL変更を促すページだが、 いまだarmonicos.co.jp(1999/09まで)やelysium.co.jp(2001/06まで)経由で 来る人が絶えない。
私にとっての、常時ネットワーク接続とftpやhttpの便利さの衝撃とは、 URLというのはつまりインターネット接続がそのまま、 巨大なファイルシステムへのアクセスが可能になったことを意味し、 帯域の広がりは、ネットワーク上の場所(やURL)を知っていることが ファイルの所有とほぼ等価であることを、 意味しているということだった。
がURLに関しては、これだけの規模でこれだけ長い間運用されていると、 常にどこかで変更されているわけなので、なんとかならないかと思う (URI(URN+URL)というのがそれにあたるのか?)

2001/06末に、サーバのディスク不足をきっかけに一時停止した。 実験を名目に会社のサーバに個人的なファイルを置く時期は過ぎたと判断し、 移転先を探した。なかなか自由に使えるところがなく停止期間が長引いていたところを、 Northが場所の提供を 申し出てくれて、無事2001/07に再開できた。もう1年だ。ありがとうNorth。

2001/07にはsuchi todayの毎日更新などをしていたが、これは検索サイトで suchiと引いたときに、さるエキセントリックな方が最初に出てくるので、 この状況を改善しようと思って行った(無事改善された模様)

todayの2001/12の増加は お笑いパソコン日誌(MS-IMEには「右眼」はあるのに「左眼」がない)、 2002/04の増加はhardでloxseな日々 (ガガガSPの「尾崎豊」)、 からのリンクの影響だ。どちらもさまざまなURLが面白いコメントとともに 紹介されている有名なところで、一読者としてリンクされる以前から 見ていた(よく引用させてもらっている)。 いったいどうやって毎日あれだけ面白いサイトを見つけてくるのか 尊敬していたのだが、一日10人程度しか訪れていなかったこんな辺境まで 目が届いているのだ。さらに尊敬の念を新たにするのだった。

ここ1年、アクセス数の増加から萎縮して、 ネタ元を書くようにしているが(書いていないのは9割が自分で探したもの、 1割は記録忘れで、その旨書いてある)、 実は多少の面倒さも感じている。情報やファイルをURL1つで共有できる 利便性が失われている気がするのだ。 それを伝えるときのためにもう1つURLを記録しておかなければならない。 (厳密に言えばネタもとのネタもとの...まで記録すべきなのかもしれない)。 敬意は誰よりも持っているつもりだが、 そんなアンビバレンツな気持ちがある。 だからもし、私のページにあるリンク (例えば心肺蘇生法の青木先生が杉作J太郎に似ていることなど) を他で紹介することがあったら、 ネタ元などは書かないでかまわないと思っている、 などとAboutページを書きたい気持ちと そんなページを作ることはおこがましいというまた別の アンビバレンツな気持ちもあるのだった。 ところで、2年前にはroot(/)とtoday(/today)がほぼ同じだったのが、 ここ1年で倍近い差がついている。 知らない間にtodayのカウンタがrootを越えていた。 わからないのはここ2ヶ月の増加だ。これだけ多くなってくると、 WWWCやアンテナの更新チェックは誤差の範囲になってきているので、 詳しく調べればわかるのかもしれないが、仕事ではないので まあいいかというアンビバ(以下略)。 情報のまったく少ないMOVIE(/movie)のアクセス数は、 検索エンジンからやってきて途方に暮れている人の数を 想像させる。ほんとすまない気持ちでいっぱいだ。


〜1999/12

[1999/12のグラフ]

こんな感じの perlスクリプトで各ページのカウンタを月毎にまとめた(そのままでは動きません)。 perlは古くからのユーザだが、 凝った使い方は知らない(らくだ本は初めて買った計算機関連の洋書で、 苦労して読んだ(最初だけ)。当時condeaux氏の翻訳はまだ出ていなかった)。 これで出力されたファイルをExcelのピボットテーブル 機能でまとめた。しかし、Excelとperl、 MS暗黒帝国とオープンソフトウェアの代表選手だが、 機能の5%も使ってないが手放せないツールという点では共通している。

でグラフにしてみたが、 最初の一年が300Hit/月程度だったのが、 今や1200Hit/月を越えていることに驚く。 増加傾向にあるのが一番のなぞだ。 多くは検索エンジンからのもので、 インターネット接続人口の増加(検索エンジンクエリの増加)が要因であろう。 思ったよりロボットの訪問は微々たるものである。なお、1999/01あたりに伸びているのは WWWCによるTopとToday更新の定時チェックが入るように なったためで、これは誰がやっているかは判明している (カウンタに厳密さは求めていないので、そのままでいいよ>T)。 現在機械的な訪問は月300-400ぐらいか。REFERERから検索エンジンで何を 検索した結果やってきたのかわかるものが多いが、多くは求めているものは 見つからなかったと思うので申し訳なく思う(例: 宇多田ヒカル &&着メロ, 死体 && 写真)。 それを考えるとbookページのカウントが定期アクセス数に近いと思われる。

ここのbookのカウントはここで カウントされているので、意図しないキーワード検索にもひっかかりにくい。 bookのページはここ一年は年毎にも カウントしている(グラフ)。 各年のページには検索エンジンからやってくる人が多いのは、 感想もなにもないStackのカウントがトップページよりも多いことからも わかる。

movedというページはURL変更のお知らせである。以前のURLのどこに行っても このページが表示され、現在のトップページへのリンクがある。1999/10-12の トップページへのアクセスがそれまでより多くなったのはこれが原因だ。

個人的には一番の時間がかかっているbookページよりも、 todayの方がアクセスが多いんだー、って感じですか。 (更新頻度にもそのまま連動している)。


[Today][Top]
No.