恩田陸の小説を読んでいたら,「さっき黎二にからんでたでしょ」なる文に行き当たった。当たり前のような日本語である。嫌な予感がして misima に掛けたら,果たして「さつき黎二にからんでたでせ」と不完全な旧仮名変換結果となった。つまり,「からんでたでしょう」の語末の助動詞「う」が欠落し,助動詞「です」未然形で文が閉じられるパターンを見落としていた。「行きましょ」(「ます」)も同じ部類に入る。
本来なら「からんでたでしょ」は飽くまでも口語的表記であって,旧仮名・旧字の古い作家の引用文を簡易に作成するという目的において,そこまで拾う必要があるのか疑問ではある。しかし,茶筌がきちんと解析する範囲はしかるべく変換できないと恥ずかしい。恩田陸は敬愛する作家でもあるし,その作品に出現する以上,口語的とはいえ,この「でしょ・ましょ」は十分な存在意義をもって流通する表記であるともいえる。
「からんでたでしょ」の変換は「からんでたでせう」とすべきだと思われる。もともと「う」が省略される発想がなかったので,この対策は少し手間取ってしまった。語の処理において直前の語が「です・ます」の未然形かどうかを判定して必要に応じ「う」を補わなくてはならない。処理中の語が「う」なら,または「ませ(ん)」タイプの未然形なら重複を招くなどの不正になるので補ってはならない。句読点もなにも「しょ」に続くものがない場合はどうするか。この辺りの判定ロジックを考えるのに時間を要してしまった。
Web 版のみならずインストール版の misima Perl モジュールも更新し,misima-2.3d.tar.gz として公開した。