- Devas
- フォルダ内のテキストファイルの中身を一括置換するソフト。
- Devas - namespace gimite(http://gimite.net/pukiwiki/index.php?Devas)
- 正規表現を使える
- 変換結果をプレビューできる
- 変換前のファイルがバックアップされる
機能は必要にして十分。
- KanjiTranslator
- テキストファイルの文字コードを一括置換するソフト。
- 文字コード変換ツール「KanjiTranslator」(フリーソフト)(http://www.kashim.com/kanjitranslator/index.html)
もとの文字コードの自動判別がしっかりしているようで、これも期待通りに働いてくれた。
これらでまかなえないテキスト処理はPerlでスクリプトを書いた。これはこれで大変だけど楽しい。
これらを使ってなにをしていたかというと、日記の統合なのだった。
前の日記(id:manpukuya)の本文とコメントを、今のこの日記(id:Imamura)に統合した。そうしたくなった経緯については以下に。
- はてな上の日記ログをまとめるための覚え書き - Imamuraの日記(d:id:Imamura:20110415:logmerge)
日記の一括登録には「はてなダイアリーライター」こと「はてダラ」と、関連ツールの「csv2hw.pl」を使った。
- はてなダイアリーライター(略称:はてダラ)(http://www.hyuki.com/techinfo/hatena_diary_writer.html)
- csv2hw.pl: CSV からはてダラ形式への変換スクリプト(http://www.horobi.com/xml/XHatenaML/csv2hw.html)
はてなからダウンロードしてきた日記全体のCSVデータを、「csv2hw.pl」ではてダラ用のデータに分割する。はてダラ用テキストデータは1日1テキストファイルで、中身はタイトルと本文である。
コメントをどうやって取り出すか。
「csv2hw.pl」はCSVファイルの構成が「date,title,body,comment,text」というカンマ区切りになっている中からtitleとtextを取り出し、それを「date.txt」というテキストファイルに出力してくれる。「comment」の部分にダイアリーへのコメントが出力されているのがミソで、dateのあとにカンマをひとつ足してcsv2hw.plにかけるとあら不思議、日ごとのコメントを取り出してくれるのだった。
そこからコメントのテキストファイルに日記としての見出しをつけたり、そのテキストファイルを日記本文のテキストファイルにくっつけたり、そのほかいろいろやってアップロード用のテキストデータができ上がった。そうしたらはてダラで一気にアップロード。
その結果、月ごとのカレンダーがこんな感じになりました。
- 今日まで
- 今日から
そして日記を統合したことで、ロケット打ち上げの見学に行った記事を紹介する今日のエントリ(d:id:Imamura:20110829:mycom)でid:manpukuyaのURLを紹介しなくてもよくなった。今日これをやりたくて、夕べ遅くまでかかって作業したのだった。これでスッキリ。
続いて、はてなダイアリーを始める前に更新していた個人サイト(http://www.pluto.dti.ne.jp/~imasa/)内の日記的コンテンツも統合したい。そうすれば「長年日記」機能で大昔の日記も定期的にふり返ることができ、精神的に豊かになるだろう。
関連記事
はてダラの機能追加版。
- 複数ブログ機能に対応した「はてダラ」 - Imamuraの日記(d:id:Imamura:20110712:hw)
長年日記の効能について。
- 長年日記RSSを作って1年 - Imamuraの日記(d:id:Imamura:20110815:naganen)
追記
このあと、さらに昔の日記を統合した。
- 2000年から2002年までの日記を転記(d:id:Imamura:20111010:diary)
- 1999年の日記を転記(d:id:Imamura:20111229:diary)
- 1997年〜1998年の日記をはてなダイアリーに転記(d:id:Imamura:20130216:drivediary)
追記2
はてなダイアリーが終了するのに合わせて、すでに開設していたはてなブログへインポートした。
- 22年分のはてなダイアリーをはてなブログにインポートした - ただいま村(https://ima.hatenablog.jp/entry/2019/01/29/000000)