- http://d.hatena.ne.jp/manpukuya/20040411
- http://d.hatena.ne.jp/ZO353/20040409
- http://d.hatena.ne.jp/rakka/20040411
- http://d.hatena.ne.jp/cando/20040411
- http://d.hatena.ne.jp/Chika/20040411
- http://d.hatena.ne.jp/yms-zun/20040412
- http://d.hatena.ne.jp/nostalgiaska/20040411
- http://d.hatena.ne.jp/myun/20040411
- http://d.hatena.ne.jp/nappa/20040412
- http://d.hatena.ne.jp/smoking186/20040412
- http://d.hatena.ne.jp/another/20040413
- http://d.hatena.ne.jp/manpukuya/20040518
- http://d.hatena.ne.jp/manpukuya/20051017
最長不倒のはてなダイアリーユーザーを調べる
はてなの引っ越しは無事に終わったようで、なによりです。今後ともよろしくお願いします。
さて、「はてなダイアリーの登録日数が最も多いユーザーを調査する」(d:id:Imamura:20040321:p1)に続いて、Perlを使ってなにか調べることはできないかと考えていた。
そういえばこのときに、id:CAXさんが、はてなダイアリーを始めてから11カ月にもわたって、一日も欠かすことなく日記をつけ続けているとわかった。これはすごいと思う。このような、鉄人衣笠ばりの連続更新記録を調べられないか。
ということで調べてみた。ベータユーザー登録が始まった2003年1月16日から2004年4月8日までの間で、最も長く連続して日記をつけている人(プライベートモード除く)のランキング。
順位 | ID | 連続して日記をつけた日数 |
---|---|---|
1 | id:izumikeiさん | 連続449日 |
1 | id:komatsuさん | 連続449日 |
3 | id:yms-zunさん | 連続432日 |
4 | id:rakkaさん | 連続420日 |
5 | id:myunさん | 連続393日 |
6 | id:Chikaさん | 連続392日 |
6 | id:nostalgiaskaさん | 連続392日 |
8 | id:jwolfさん | 連続391日 |
8 | id:nappaさん | 連続391日 |
10 | id:mirunaさん | 連続388日 |
ここに出ている方々は、ユーザー登録から一日も欠かさずに日記を書き続けている方ばかりなのではないか。毎日毎日書き続け、たまりにたまったこの日数。すごいです。なおid:manpukuyaの連続更新記録は69日だった。ネタがないときはこだわらずに休んでいるから、こんなものだろう。
集計方法は、ユーザーIDごとに「http://d.hatena.ne.jp/ユーザーID/200404」といったアドレスにアクセスしてHTMLを取得、h2要素(日付の部分)を取り出して、日付が連続している日数の最大値を調べるというもの。ときどきHTMLの取得に失敗して、正しい日数が出てこないことがあったので、念のため5回取得して最頻値を取り出している。
この集計にあたっては、はてなダイアリー全ユーザーの登録日数を調べたわけではない。すでにid:CAXさんが、連続約330日にわたって日記をつけているとわかっている。サレバ、前回の調査で、「ユーザー登録から本日までに日記をつけた日数」が330日より多いユーザーでなければ、この記録を破れないことになる。少し余裕を見て、250日以上日記をつけているユーザーを調査対象にしてみよう。その数は約470人。前回は12,000ユーザーのaboutページを調べたが、今回は一人あたりの調査量が増える代わりに、調べるユーザーの数は少なくなるかっこうだ。
こうして上の順位が出てきたが、ちょっと注意。はてなダイアリーでは、数日にわたる日記をまとめて登録できる。つまり、意図的に連続記録を途切れさせないこともできる。ほかにも、ある日の日記が長くなった時などに、空いている日に登録するという工夫も、一般的に行われている(d:id:wushi:20040330#p4さん参照)。また、日記の内容は見ていないため、「今日はお休みです」とだけ書かれたような日記も、連続更新の扱いになっている。
さらに、過去日記をほかから大量に移植しているユーザーもいる。これに関しては、今回の調査を、はてなダイアリーのベータユーザー登録が始まった2003年1月16日からとして、ある程度排除している。ただしこの場合でも、4月8日の330日前(去年の5月14日)にはてなダイアリーに登録したユーザーが、1月16日までさかのぼって日記を登録している、といった可能性もある。
もちろん、これらの行為がイカンというつもりはまったくない。この調査の信頼性はその程度ですよということで、割り引いて見てほしい。
今回の集計も、Perl初心者としてはいろいろ勉強になった。集計アルゴリズムを考える→仮データでテスト→うまく動かない→また考えて修正→うまく動いた!という連続はパズルのようで、とても楽しいものだ。
- おまけサービス
- 自分の連続登録日数を知りたいという方は、リファをお送りください。そちらのコメント欄でお答えします(ここのコメント欄が爆発するのは避けたいので、登録日数通知のご希望を、ここのコメント欄に書き込むのはご遠慮ください)。なお集計の対象になっているのは、aboutページ(http://d.hatena.ne.jp/ユーザーID/about)で「ユーザー登録から本日までに日記をつけた日数」が、3月下旬の時点で250日以上の方です。
曇り
- 2004年4月11日の記事をまとめ読み:http://ima.hatenablog.jp/entries/2004/04/11