特許情報フェアと ispell と LaTeX 表記

今日,皇居そばの北の丸公園,科学技術館で開催中の特許情報フェアに行ってきた。特許システム関係者にとっての大イベントである。ここ数年,忙しくてとても行かれなかったのだ。今回は仕事の一環ということで各社の偵察?を兼ねて,久しぶりの北の丸公園という次第。

昔担当したシステムで係わった懐かしい知人にたくさん出逢った。F 社,N 社,C 社のブースの大きさに驚いたが,ウチだって負けていない。分析だとかよりもデータそのものの質に注力するシステムがいちばんである。

* * *

TeX Q and A で,LaTeX ドイツ語,フランス語 7 ビット表記と ispell スペルチェッカとの相性について議論があった。そのなかで,多言語 TeX のエキスパートでいらっしゃる永田先生のご指摘に触発され,今夜,会社から帰ってから,Utf82TeX と misima の改造に取り組んだ。修正はすぐ終わった。

従来拙作プログラムの TeX 変換は,BibTeX でも受け付けられるというメリットを考慮したため,アクセント付き文字を {\'e} のようにブレースで囲んで出力する仕様であった。ところが,これだと ispell において語の要素として認識されないという。ブレースを外すと LaTeX 用 ispell 辞書でスペルチェックができる。さらにドイツ語ではウムラウト付き文字とエスツェットは \ (バックスラッシュ) すら付けずに表記するのが普通であるとのこと。ドイツ語キーボードでは \ がタイプしづらい位置にあるためだそうである。なるほど,と感銘を受けた。

-g (germany) オプションを入れこんでみた。これは é などの diacritical な文字を \'e というようにブレースなしで出力する。さらにドイツ語 ä, ö, ü, Ä, Ö, Ü, ß を \"a, \"o, \"u, \"A, \"O, \"U, \ss ではなく,単に "a, "o, "u, "A, "O, "U, "s で出力する。こうすれば,ispell でのスペルチェックもオッケーというわけである。まあ LaTeX 原稿を UTF-8 で書いて,その状態でスペルチェックをし,その後変換して (あるいはしないで) タイプセットする流れであれば,必ずしもこの仕様にこだわる必要性はないかも知れない。しかし,変換後に手直しが入りスペルチェックしないとも限らず,もとより,ドイツ語やフランス語の専門家にして TeXnician であるひとの目には,従来の拙作の仕様がどう映ったかを考えると,恥ずかしくなってくる。直さないわけにはいかない。

Java アプリと Emacs Lisp も -g オプションを通すよう修正した。公開はもう少し評価してからにするつもりである。