テキスト処理に便利なソフトで日記を統合

Devas
フォルダ内のテキストファイルの中身を一括置換するソフト。

機能は必要にして十分。

KanjiTranslator
テキストファイルの文字コードを一括置換するソフト。

もとの文字コードの自動判別がしっかりしているようで、これも期待通りに働いてくれた。

これらでまかなえないテキスト処理はPerlスクリプトを書いた。これはこれで大変だけど楽しい。

これらを使ってなにをしていたかというと、日記の統合なのだった。

前の日記(id:manpukuya)の本文とコメントを、今のこの日記(id:Imamura)に統合した。そうしたくなった経緯については以下に。

日記の一括登録には「はてなダイアリーライター」こと「はてダラ」と、関連ツールの「csv2hw.pl」を使った。

はてなからダウンロードしてきた日記全体のCSVデータを、「csv2hw.pl」ではてダラ用のデータに分割する。はてダラ用テキストデータは1日1テキストファイルで、中身はタイトルと本文である。

コメントをどうやって取り出すか。

「csv2hw.pl」はCSVファイルの構成が「date,title,body,comment,text」というカンマ区切りになっている中からtitleとtextを取り出し、それを「date.txt」というテキストファイルに出力してくれる。「comment」の部分にダイアリーへのコメントが出力されているのがミソで、dateのあとにカンマをひとつ足してcsv2hw.plにかけるとあら不思議、日ごとのコメントを取り出してくれるのだった。

そこからコメントのテキストファイルに日記としての見出しをつけたり、そのテキストファイルを日記本文のテキストファイルにくっつけたり、そのほかいろいろやってアップロード用のテキストデータができ上がった。そうしたらはてダラで一気にアップロード。

その結果、月ごとのカレンダーがこんな感じになりました。

今日まで
f:id:Imamura:20110829223959p:plain
今日から
f:id:Imamura:20110829223958p:plain

そして日記を統合したことで、ロケット打ち上げの見学に行った記事を紹介する今日のエントリ(d:id:Imamura:20110829:mycom)でid:manpukuyaのURLを紹介しなくてもよくなった。今日これをやりたくて、夕べ遅くまでかかって作業したのだった。これでスッキリ。

続いて、はてなダイアリーを始める前に更新していた個人サイト(http://www.pluto.dti.ne.jp/~imasa/)内の日記的コンテンツも統合したい。そうすれば「長年日記」機能で大昔の日記も定期的にふり返ることができ、精神的に豊かになるだろう。

関連記事

はてダラの機能追加版。

長年日記の効能について。

追記

このあと、さらに昔の日記を統合した。