|
|
misima 旧仮名遣い・旧字変換支援(Ver.2.5) since Nov. 3 2004 misima 辞書最終更新: Aug. 21 2008 |
|||
|
|
|
|
||
|
[特記事項表示/非表示] |
|
ご利用に当たっての注意事項等をまとめます.本システムは旧仮名遣い・旧字に表記変換を行いますが,入力した文章を「論理的」にも,「合理的」にもしません.念のため.作者は右翼ではありません.念のため. |
||
|
- 変換精度
|
旧仮名遣い変換精度は不完全です.変換結果は必ずご自分の目で確かめてください. 本システムにおける旧仮名遣い変換は,日本語形態素解析ソフトウェア茶筌によって得られた単語分割・品詞解析結果に対し,misima 旧仮名遣い辞書変換と本則(『私の國語敎室』)変換とを適用することにより実現しています.変換結果は主に茶筌の解析精度と misima 辞書語数・品質とに依存します.茶筌の形態素解析が不首尾となるために,または単語が茶筌辞書 ipadic,misima 辞書に登録されていないために,入力テキストが正しく変換されない場合があります.また和文そのものが曖昧で多義性を有する,誤字・脱字があるなど,入力テキストの要因で意図した変換結果が得られない場合もあります.複数の解釈が可能な和文も,作者が決めた基準で,一律に,一気呵成に変換します.いずれにせよ,一途なだけで賢くはないヤツ,と思ってください. 和文そのものが捉え方によって全く別の意味になる場合があります.misima は茶筌の解析に従います.茶筌は入力和文を,ユーザが意図したように解釈するとは限りません.例えば,「かぜが吹くといい天気になった」という文に対して,茶筌は「いい」の部分を動詞「いう」(言う)の連用形と解析します(この要因については次の二つの茶筌仕様が関係していると私は考えています.辞書出現頻度設定に従って,形容詞「いい」より動詞「いう」を優先するため.もしくは,読点なく連続する語を,後続語「天気」より先行語「と」に膠着させる原則をもっているため).misima はこの結果,「かぜが吹くといひ天気になつた」と変換します.「かぜが吹くと言って,天気になった」.あり得ます.普通「良い天気」のほうだろ!と思うユーザはがっかりすることになります.機械は一途です.「普通」かどうかなんて関知しません.こういう問題を misima は不可避的に抱えています.ちなみに,「かぜが吹くと,いい天気になった」として読点を付すると,「いい」が明確に形容詞と判断され,misima も「いい」のまま残します.句読点の打ち方,漢字/仮名の使い分け,送りがなの振り方で茶筌の振舞が変化します. |
|
|
- 旧字体
|
旧字変換の対象文字は,府川充男/小池和男著『旧字旧かな入門』(柏書房,2001)をおもに参考にしています.諸橋轍次/渡辺末吾/鎌田正/米山寅太郎著『大修館新漢和辞典』(大修館書店,1981)を参照して,できる限り妥当性を確認しています.しかしながら,「弁」「台」「予」など,意味によって旧字体を使い分ける文字は,一律に置き換えると誤りとなる場合があります.本システムでは熟語レベルで誤変換を訂正するように変換テーブルを調整していますが,モレもあると思います.結果を必ず確認ください. |
|
|
- 入力上の注意
|
本システムの旧仮名遣い変換,用語・用字変換はあくまでも現代仮名遣い,新字正則表記テキストの入力を前提としています.より適切な変換を行うための注意事項を挙げます.これは主に茶筌の誤解析を防止するためです.
要するに,現代の普通の表記で入力することが肝要です.仮に旧仮名遣い・旧字表記の,あるいは和語片仮名表記の文章を入力すると,茶筌が不当な形態素解析を行い,その結果もとの表記を「改悪」してしまう可能性があります.二つ例を次に示します. 仮に「我は戰いにいくであらう」と(中途半端な)旧仮名遣い・旧字で misima に対し入力を行うと,処理の過程で茶筌はこれを次のように解析します.「我(名詞-一般)| は(助詞-係助詞)| 戰(名詞-サ変接続)| い(動詞-自立 いる/一段型/連用形)| に(助詞-格助詞-一般)| いく(動詞-自立 いく/五段・カ行促音便型/基本形)| で(助動詞 だ/特殊・ダ型/連用形)| あらう(動詞-自立 あらう/五段・ワ行促音便型/基本形)」.つまり「戰い」の「い」が「いる(居る)」の連用形に,「あらう」が「洗う」基本形(終止形ないし連体形)と形態素解析されています.茶筌は現代和文の正則テキストを前提としているため,旧仮名遣い・旧字で入力すると,このように期待に反した解析を行うことが多い.misima はこの語分割・品詞解析を受け,「我は戰ゐにいくであらふ」と変換します.その結果,入力されたもとの旧仮名表記を壊してしまいます.「我は戦いにいくであろう」とすれば,「戦い」はこれで一語として「名詞-一般」と,また「あろう」は「あろ(助動詞 ある/五段・ラ行アル型/未然ウ接続形)| う(助動詞 う/不変化型/基本形)」と解釈され,「我は戰ひにいくであらう」と正しい変換結果が得られます. 従って,中途半端な旧仮名遣いの文章を改善するといった目的には misima は利用できません.もし旧仮名遣いの文章を入力し,旧字変換を期待するのであれば,オプションにおいて旧字変換及び単純変換のみをオンに,旧仮名遣い変換はオフに設定して実行してください. また和語の仮名は原則として平仮名で記述する必要があります.通常は「うそを言うな」と平仮名主体で書きます.仮に misima に「ウソヲ言ウナ」と入力すると,茶筌は「ウソ(名詞-一般)| ヲ(名詞-固有名詞-一般)| 言(名詞-一般)| ウナ(名詞-一般)」と――入力した方から見ると――誤った語分割・品詞解析を行ってしまいます.さらに名詞「ウナ」は「フナ」とする契機(misima 辞書及び本則)がないため,期待される「言フナ」にはなりません.「うそを言うな」ならば「うそ(名詞-一般)| を(助詞-格助詞-一般)| 言う(動詞-自立 言う/五段・ワ行促音便型/基本形)| な(助詞-終助詞)」と解析され,「言う」は旧仮名遣い変換本則仕様が適用されて「言ふ」と正しく変換されます. 変換したい引用文が古い法律文や,漢文読み下し調の古文に見えるような片仮名主体の文章であったとしても,平仮名主体の現代仮名遣い・新字の和文で入力し,misima の仮名反転変換オプションをオンにして変換することをお勧めします.そのほうが,私の経験として,期するところに圧倒的に早く到達できるはずです(これは仮名漢字変換ソフトウェアにおいて片仮名主体で和文を入力する時間が計りしれないからです). |
|
|
- TeX 変換
|
misima TeX 変換機能の具体的な利用方法については「misima TeX 変換の活用」を参照ください. |
|
|
- ブラウザ
|
トリッキーなことはやっていませんが,動作しないブラウザがあるかもしれません.私は以下のブラウザで変換操作を確認しています.このうち人名許容もしくは康煕字典別掲の旧字体を含めすべて表示できるものは Mac OS X Safari のみです.
- Apple Safari 1.3/2.0 (Mac OS X 10.3 Panther/10.4 Tiger) リファラーをチェックした結果,弊サイト・フォームからの要求でない場合,処理を行わない仕様になっています.これはテキストサイズ制限,今昔文字鏡変換機能制限の事情によるものです.従って,リファラーを送信しないブラウザでは利用できません. |
|
|
- フォント
|
本プログラムの旧字変換結果を Web ページにコピー・ペーストすると文字化けする場合は,旧字変換のオプションに「JIS第一・第二水準」を指定してください.特にブログなどへの書き込みでは,ブログ管理ソフトの文字コードが UTF-8 を受け付けないと,Unicode 文字(「鷗」などの文字)は「?」に化けてしまいます. ブラウザのフォント環境によっては旧字変換された文字が表示されない場合があります.Unicode フォントが必要です.Microsoft Office をお持ちの Windows ユーザはインターナショナルサポートをセットアップして,Arial Unicode MS フォントをインストールしておくことをお勧めします. ご利用のブラウザで misima 旧字テーブル登録文字の出力が可能か確認できるテストページを用意しました. 本フォームにおけるユーザ辞書サンプルは,一部の文字について旧字体 UTF-8 変換(多く人名許容漢字もしくは康煕字典別掲漢字)をしない定義になっています(UTF-8 出力以外の OTF CID 番号参照出力等の場合は変換対象となります).この設定を嫌う方や,登録旧字体すべてが表示できる Mac OS X Safari をお使いの方は,「UTF-8 康煕別掲漢字 変換する」オプションを選択してご利用ください. |
|
|
- 謝辞
|
本プログラムは,日本語形態素解析システム《茶筌》及び《ipadic》の機能を利用しています.これは奈良先端科学技術大学院大学自然言語処理学講座によって開発されたソフトウェアです.この場を借りて開発者の方々にお礼申し上げます. また本プログラムは,分割された語を旧仮名遣いに変換するロジックに,福田恆存著 『私の國語敎室』における「本則」を原則的に適用しています.この恩恵を受けて,misima 旧仮名遣い変換用辞書の登録内容を「本則」から外れる例外表記に限定でき,辞書登録の手間を大幅に省くことができたものと考えます.著者の業績に敬意を表します. TeX 多言語変換文字拡張機能では,大友氏より提供いただいた変換表を利用しています.深謝申し上げます. |
|
|
- 免責・制限
|
本プログラムの運用結果については,いかなるものであれ,作者ならびにその関係者は一切保証いたしません.利用者の責任においてご活用ください. セキュリティ(送信テキストサイズなど)及び今昔文字鏡機能の利用制限から,利用は本フォームから送信された場合のみに制限させていただきます.どうしてもという場合は個別にメールにてご相談ください. 本プログラムの目的は,もっぱら文献引用です.現代仮名遣い・新字による大量の既存テキストを一括変換して旧仮名遣い・旧字に機械的に仕立てあげ,これを効率的に手直ししていく利用形態を想定しています.日常的に旧仮名遣い・旧字で書こうとされる方にはお勧めできません.そのような方には,IME(仮名漢字変換ソフトウェア)で使用できる旧仮名遣い・旧字向け辞書を導入し,対話的に変換結果を評価しながら表記を確定していく方式のほうが,ツール選択としてより適切であると考えます.さまざまな IME 向けに,個人様で鍛えられた変換辞書がインターネットで入手可能です. |
|
|
- その他
|
misima パッケージの総合的な解説を「misima 旧仮名遣い・旧字変換支援 利用の手引き Ver.2.3g」として公開しています. 本サービスのコンセプト,変換仕様詳細については「misima 旧仮名遣い・旧字変換支援プログラム」及び「misima について」を是非とも参照ください. GNU Emacs/Meadow, ターミナル, コマンドプロンプト, Microsoft Word 2003, 秀丸エディタ, Jedit X エディタ, TeXShop TeX 統合エディタから直接 misima 変換機能が利用できる SOAP Web Service 版 misima SOAP Web Service 2.4 も公開しています.パッケージはダウンロード・サービスから入手できます. ご意見,ご感想をお寄せいただけると幸いです.ご質問にも可能な範囲で対応させていただきます. |
|
更新履歴
|
|