――MacJPerlで使う青空文庫用ツール――
2001年1月11日 作成
2001年1月28日 修正
青空文庫
「Perlというプログラミング言語は、テキストをいじくるのに最適」と聞きました。
UNIX生まれで、Windowsでも広く使われていると言います。
ならば、人のすなるPerlを、Macでもしてみんとてするなり。
とは思ったけれど、いきなり「分からないことだらけだな〜」と途方にくれていたところ、賢い仲間が「猫に真珠(Perl) −−−青空文庫のためのMacPerl超入門−−−」を書いてくれました。
これを読みつつ、大野裕さんの「プロ文工作員の道具箱」にある、Perlで書かれたスクリプトを動かして見ました。(スクリプトというのは、簡単に書けるよう工夫された言語で作った、プログラムのことです。)
大野さんは、プロレタリア文学を中心に電子化と公開を進めておられます。
作業の成果を、青空文庫に提供してくださっており、文庫の校正にも当たられています。
この体験の中から生み出された、青空文庫の作業を効率化したり、ファイルの質を高めたりするためのツールが、「プロ文工作員の道具箱」には用意されていました。
ここで先ず、衝撃を受けたのは、「旧字体に置き換えられるか調べるスクリプト」でした。
旧字旧仮名の入力、校正は、困難です。
作業が大変で時間を食う上に、校正済みのファイルにもしばしば旧字、正字に置き換えるべき新字、俗字が残ってしまいます。
これらを目で追って見つけだすことは、プロの校正者にとってもむつかしい作業です。
ところが大野さんのツールを使えば、置き換えなければならない可能性の高い漢字が、自動的にチェックできてしまいます。
旧字旧仮名作品の入力と校正にあたる人にとって、これは必携のツールであると確信しました。
もう一つ興味を惹かれたのは、青空文庫形式テキストのルビや傍点の記号を、T-Timeのタグに変換する機能を組み込んだ、「縦書き(3)」というスクリプトでした。
他のファイル形式に比べて、手間のかかるエキスパンドブック版作りの中でも、特に面倒なルビの多い作品の処理が、このスクリプトを流用することで、省力化できるのではないかと感じました。
大野さんのツールをMacintoshで動くよう手直しし、実際に使ってみると、特に新字、俗字のチェック・ツールは、旧字旧仮名ファイルの信頼性を、大幅に向上してくれると、ますます強く実感するようになりました。
そこで、当初は勉強を中心に考えていたこのページも、実用情報をプラスして構成し直すことに決めました。
青空文庫で旧字旧仮名の作品に取り組んだ方、今、取りかかっておられる方、今後取り組もうと考えておられる方、また、編集や校正の支援ツールがどの程度のことをしてくれるのか、実際に確かめてみたいと思われる方は、是非以下のページに目を通してみてください。
●旧字旧仮名ファイルに残った新字、俗字を洗い出す。
●青空文庫テキストを、エキスパンドブック用に変換する。