misima 舊假名遣ひ・舊字變換支援プログラム since Nov. 5 2004 [ 本文書を misima で一括變換した舊假名・舊字體版 ] |
||||
|
||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
はじめに |
misima は新(現代)假名遣ひ・新字體による和文テキストを舊(歷史的)假名遣ひ・舊字體(正字體)に變換するプログラムである.ヨーロッパ言語,スラヴ語,希臘語,タイ語などの多國語文字,漢文を LaTeX 形式に變換する機能も備へてゐる.
能書きはさておき使つてみたい方はすぐさまこちらに.[ 現在,限定公開運用となつてをります.]
misima は Web ブラウザ以外のアプリケーションから直截利用することができる.この場合,Web ブラウザで變換した結果をコピー/ペーストするといふ面倒な操作を省くことができる.そのためには,misima SOAP Web Service 2.5 パッケージが必要である.misima SOAP Web Service 2.5 が現在サポートしてゐるアプリケーションは以下のとほり: misima SOAP Web Service 2.5 詳細については『misima 舊假名遣ひ・舊字變換支援 利用の手引き misima SOAP Web Service Ver. 2.5』(PDF 12.2MB) を參照のこと. 利用に際しては,その運用結果についていかなる意味においても無保證である.ご指摘,ご意見あればメールでいたゞけるとありがたい. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
考へ方 |
ときをりインターネットの揭示版などで舊假名・舊字體の文章を見かける.ところが文章の內容以上に「スタイル」に目がいつてしまふ.戰前の言語土壤に成る作家の語りでは自然な身振りであるのに對し,正直なところ,こちらは文體の異化作用が際立つて偏向を帶びて氣味が惡い.これは私の心ない主觀・印象ではある.言語現象は本質的に恣意的・流動的である一方,時代・場所・傳統背景にあつて價値判斷・感情を擔つてゐるとすれば,スタイルそのものが限定的な深い意味をもつ. それにも關はらず,國語國字問題について舊假名・舊字體の正當性・正統性を主張するひとは少なからずゐて,昔からまじめな議論が行はれてゐる.眞劍な意圖のもとに舊假名・舊字體で書かうと努める若いひともたくさんをり,前言とは矛盾するやうだが,國語國字への問題意識において,敬意を表したいのも本心である. 私も荷風や「鴎」外,漱石,芥川はもちろん,三島由紀夫や石川淳が新假名・新字で印刷されてゐるのにはちよつと閉口するはうである.ま,文庫だからしかたないかと.最近中央公論の古い新書版谷崎潤一郞全集を手に入れ,讀むにつけても,舊假名・舊字體のはうが,作者の言語の自然な呼吸が傳はつてくるやうで味はひ深い. しかし現實,現代の「普通の」常識的社會人にとつては,新假名遣ひ・新字體が知的身體の一部になつてをり,直接舊假名・舊字體で國語を記述するのは困難であるし,いまさら乘り換へる意味もない.たとへ國語國字改變が多分に政治的なものであり,また性急・暴擧であつたとの指摘が歷史の反省として正と判斷されるかも知れないにせよ,これが現代日本の文化の辿つた歷程であり,廣く定着してゐる以上これを否定してもしやうがないと考へる.(假名遣ひ,日本語表記についての私自身の考へ方については「misima について」に書いた.) 計算機の世界でも,通常の假名漢字變換プログラム (IME) では現代の新假名・新字體國語表記に最適化されてをり,これに從つて文書を作成するのが效率的であるのは當然である.效率を求めることこそ文化的練磨を阻礙する,との聲も舊假名・舊字體論者から聞こえてきさうだけど. ATOK などの IME にも舊假名・舊字で變換するための辭書があり,インターネット上にも個人による目を見張る辭書の成果も存在するが,先に述べたやうに私は「普通の社會人」であり,現代假名遣ひが身に染み付いてゐて,この期に及んで舊假名・舊字でもつて自身の素直な考へや良心を表現する氣には,いまのところなりさうにない. 舊假名・舊字體による文學作品は,こんな私にとつても亂步の世界のごとき黝く妖しい香氣を放つ.とはいへ直接舊假名・舊字體で記述するには障礙を感ずる.そこで,
の目的で,自分自身のために,あとづけで舊假名・舊字體に變換するプログラムを書いてみた.私の戰術は,以上のやうな次第で,リアルタイムではなくバッチとなつた.これなら過去に書いたテキスト・ファイルも取り扱ふことができる.
同じやうなプログラムがいくつか出囘つてゐるが,
完全は無理にせよもう少しなんとかならないかとの問題意識・關心から,單語の文法解析・辭書に基礎をおいた變換ツールを作らうと一念發起したわけである. さらに
の支援も視野に入れたものにしたいと考へた.とくに TeX OTF パッケージ利用で眞價を發揮できるやう設計したつもりである. 計算機で一定の基準に從つて一氣呵成に變換し,かつ辭書に依存する方式であり,もとよりサラリーマンの日曜大工であつてみれば,多樣な國語表記を完全無缺に變換するのは無理である. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
misima の特徵 |
語の品詞及び活用形を解析した結果で變換判斷を行ふ.「語」の切出しと文法解析のため,日本語形態素解析ソフトウェア『茶筌』を利用する.福田恆存氏の「表記は語に隨ふべし」との言に倣つたつもりである. UTF-8 コードテキストを入力前提としてをり,多國語が混在した和文を扱ふことができる.出力も UTF-8 である.Web のフォームでは入力の文字コードを意識する必要はないが,舊字體出力結果は Unicode フォントがないと化けてしまふことが想定される.最近のブラウザならまづ大丈夫ではないかと思ふ.たゞし,Windows Internet Explorer 6(Microsoft Office を導入したもの:Unicodeフォントが添附されてゐる)はだいたいにおいてうまく出力されるが,「祈」の舊字體など,人名許容もしくは康煕字典別揭漢字の一部が出力されない.Mac OS X Safari のみが私の知る唯一すべてのテーブル登錄舊字體を出力することの可能なブラウザである. 舊字變換において,UTF-8 文字出力だけでなく,TeX OTF パッケージの CID 番號參照形式でも出力できるやうにした.OTF パッケージは齋藤修三郞氏の開發した TeX Virtual Fonts とスタイルファイルである.これにより,DTP において利用が進んでゐる Adobe-Japan1-5 エンコーディング二萬字の廣範圍の文字空間から, JIS,Unicode では定義されてゐない文字(主に異體字)も TeX 文書で使ふことが可能となる.OTF を用ゐ,ヒラギノ Pro や小塚 Pro といつた Adobe-Japan1-5 對應フォントでタイプセットすると,素晴らしい出力が得られるはずである. 舊假名遣ひ・舊字變換のほか,TeX ユーザのために漢文訓讀文訓點變換,くノ字點變換や多言語文字 TeX 命令變換をサポートしてゐる.古典・漢文,主要ヨーロッパ言語,古典希臘語,スラヴ語の混在した文科系論文を書くにあたつて必要と思はれる支援を盛り込んだつもりである. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
機能 |
利用可能な變換機能を以下に示す.オプションで變換有無を指定できる.純粹に舊假名遣ひ・舊字變換のみを望むなら,舊假名遣ひ變換機能,舊字變換機能及び單純變換機能をオンにすることを推奬する.用字・用語變換は意圖せず假名が漢字に變換されることもある.いかなる變換も行はない指定も可能であるが,冗談はやめよう.
舊假名遣ひ變換機能
舊字變換機能
用字・用語變換機能
單純變換機能
繰返し符號變換機能 半濁音(ぱぴぷぺぽパピプペポ)は變換對象外である. 語頭に濁音をもつ場合(「ぢぢ」)の繰返し部は「ゝ」とする. 文獻[6]「をどり字法案」の基準を參考とし,原則として語の疆界を越えて適用はしない.しかしながら,本法案はあまりにも曖昧であり計算機處理上明確に判斷基準とできる性質のものではなく,この要因はそもそも「くりかへし符號」の使ひ方そのものが實表記において統一性を缺いてゐるからにほかならない.議論の餘地はあると思ふが,本システムでは以下の例外を採用してゐる. 一語でも固有名詞及び,日本語として一般化した片假名のみからなる名詞(「ママ」など)には適用しない.
また,以下のパターンについては語の疆界を越えて適用する.
例:「やや」「ぢぢ」「益益」「ただただ」⇒「やゝ」「ぢゝ」「益々」「たゞゝゞ」 「々」文字を「〻(ゆすり點)」にしたければ misima 辭書單純變換定義に登錄すればよい.
假名反轉機能
マーキング機能
TeX 變換機能
本機能の TeX 出力結果の全範圍を LaTeX で處理するためには,以下の各 LaTeX パッケージが必要である.「LaTeX 標準」としたものは teTeX をインストールすれば標準で組み込まれるものである.
- OTF(和文 OpenType 處理) TeX 原稿サンプル(HTML 形式及び TeX ファイル)と,これを misima で變換し TeX OTF パッケージその他で處理した結果 PDF ファイルを揭載しておく.TeX 原稿は UTF-8 テキストなので閱覽するには Unicode フォントが必要である.また,misima を利用した TeX 變換機能の利用については,『misima TeX 變換の活用』も參照いたゞきたい.
無變換指定機能 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
入力テキスト仕樣 |
處理對象となるデータは Unicode UTF-8 でエンコードされた電子テキストとする.辭書も同樣である. 舊假名遣ひ變換を指定する場合,入力テキストは現代假名遣ひ,新字正則テキストでなければならない.舊假名遣ひ,舊字,片假名で入力すると茶筌が誤解析を行ひ,正しく處理できない. 露西亞語等外國語は,茶筌では一文字ごとに分割されて,記號もしくは名詞の一種として扱はれる.本プログラムでは,TeX 多言語文字變換指定がない限り,そのまゝ出力する. 空白文字(スペース,タブ)で區切られた文字列單位または行單位で處理を行ふ.よつて文の途中でスペースや改行が入る場合,その位置によつては,茶筌の形態素解析が失敗して思つた變換ができない可能性がある.とくに HTML などマークアップされたテキストを直接處理するときは注意が必要である. 形態素解析の關係上,連續する空白文字はスペース一個に置き換へる. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
misima 辭書 |
舊假名遣ひ變換,用字・用語變換,舊字變換,單純變換及び TeX 多言語文字變換は,辭書に依存する.辭書は,私が準備した必須のシステム辭書と,利用者が獨自に定義できるユーザ辭書から成る.ユーザ辭書を優先的に參照する.システム辭書もユーザ辭書もフォーマットは同一であり,定義できる內容にも差異はない.ユーザ辭書は任意であり,なくてもよい. 辭書は舊假名變換定義,舊字變換定義,用字・用語變換定義,單純變換定義,TeX 文字變換定義,TeX 異體字文字變換定義から成る. ユーザ辭書は舊假名變換定義,舊字變換定義,用字・用語變換定義,單純變換定義について可能である. TeX 文字變換定義,TeX 異體字文字變換定義について獨自の變換規則を追加したい場合,擴張變換表を作成する.擴張變換表は, misima-2.3 パッケージでローカルにインストールした場合においてのみ定義可能である.標準では /usr/local/etc/misima/contrib ディレクトリ下に下記仕樣に基づくテキストファイルとして格納する.
舊字變換定義 システム辭書における舊字變換對象文字は文獻[4]を參考にした.惡名高い JIS 83 年版で新字體に置き換へられてしまつた文字(森鷗(鴎)外の「鷗(鴎)」などの所謂擴張新字體:丙種・包攝漢字)や Windows JIS 外字(「敎」,「淸」など)も適宜組み入れた.新字—舊字對應表を參照いたゞきたい.また登錄文字は表示テストページで確認できる. 舊字變換の結果は,TeX OTF パッケージ CID 番號參照がもつとも充實してゐる.UTF-8,JIS 第三/四水準にない異體字も登錄してゐる.「近」のしんねうが二點付きのもの,「唐」の縱線が「口」にめがけて突き出た文字など,古風な異體字を私の判斷で拾つてゐる. フォーマット:s 新字 舊字#FFFF#99999#999999
舊假名變換定義 舊假名變換定義は,動詞,形容詞,助動詞については基本形(終止形)で登錄する.
フォーマット:k 9新假名 舊假名
用字・用語變換定義
フォーマット:y 變換前 變換後
單純變換定義
フォーマット:t 變換前 變換後
TeX 文字變換定義
フォーマット:e 變換前 變換後
TeX 異體字文字變換定義
フォーマット:c 變換前 變換後
misima 辭書登錄時の注意事項 misima は同一バッファのテキストに對し數種の變換を一定のシーケンスに從つて行ふ.そのつど變換を受けると辭書に登錄しても無意味となる可能性がある.たとへば,假に舊假名遣ひ變換で「あい」が「あゐ」に變換された後では,單純變換定義で「あい⇒あひ」と登錄しても「あひ」が得られることは永劫にない.各種變換有無を選擇できることが事情をさらに複雜にしてゐる.システム辭書ではこのチューニングを行つてゐるが,ユーザ辭書を追加する際は注意すべきである.今後のシステムの課題であると考へる. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
變換仕樣 |
語の解析
變換處理シーケンス |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
舊假名變換 |
舊假名變換は misima 辭書に從ふか,もしくは舊假名遣ひの規則(「本則」と呼ぶ)に基づく.
辭書變換
本則變換
品詞依存處理
拗音・促音變換處理 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
用字・用語變換 |
茶筌解析結果の語基本形で misima 辭書用字・用語變換定義テーブルを檢索する.ヒットしたとき登錄語で置換する.ヒットしないときなにもしない. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
單純變換 |
對象テキスト行單位でテキスト斷片が misima 辭書單純變換定義に一致するとき登錄テキスト斷片で置換する. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
注意事項 |
本プログラムは,計算機による機械的解析に基づく以上,制約,限界がある.ある程度の分量の文章に適用すると,變換誤りが含まれるものと思つたはうがよい.重要な文書に對しご利用になる場合には,必ず自分の目で變換結果をご確認いたゞきたい. 辭書に定義されてゐないパターンはうまく置換できない場合がある.システム辭書はまだ登錄語數が少ない.順次擴張していくつもりである.變換結果を評價してユーザで追加いたゞきたい.とりわけ動詞が名詞化した語に弱い.「負けず嫌い」などは一語として扱はれるため,「ず」は否定の「ぬ」に由來することが茶筌の解析では判斷できず,本則に從つて「づ」に置換されてしまふ場合がある(「負けず嫌い」そのものは辭書に登錄してある). 漢字の音讀みについて,現代假名遣ひで「しょう」と書かれても,舊假名では「しよう(松)」なのか「しやう(聲)」なのか「せう(小)」なのかはたまた「せふ(妾)」なのか,判斷できないことが多い.ある程度漢字假名混じりの和文でないと,人間が見ても難しいものがある.ましてや機械は追從できない.これら所謂字音假名遣ひは本システムではとくに配慮してゐない.辭書で一律置き換へることは可能であるが,意圖せずして變換される副作用も考慮すべきである.misima 辭書では茶筌に平假名で登錄された漢語の一部を定義してゐるが,私の獨斷で特定してゐるので意圖と合致するか利用者にて結果を確認する必要がある.いづれにせよ,漢語は漢字で入力するのが基本と考へていたゞきたい. 舊假名變換解析の前提となつてゐる茶筌そのものが形態素解析に失敗するために,適切に變換されない場合がある.これは對象の日本語が曖昧か,不適切であるか,もしくは語義の特定において文脈に著しく依存するケースが多い.ちよつとした脫字のために著しく語分割が變はつてしまふことがまゝある.日本語が曖昧な場合の例では,「おう.」といふテキストは,返事の「おう」と動詞「追う」終止形のどちらかは判斷できない.前者が明快に感動詞と解析できれば「おう」と「おふ」を辨別することができるが,茶筌がそこまで解析できない.この場合は,本プログラムは本則に從つて「おふ」(「追ふ」「負ふ」...)にたふす.「すえる」に對し,「饐えた臭い」の「すえる」よりも「腰を据ゑる」の「すえる」のはうをより一般的と解し,システム辭書で「すゑる」に變換するやうな場合もある. 本システムは文脈を判斷できない.日本語は省略の許容範圍が廣く,文脈で一貫性・論理性を確保する傾向が强いと思ふ.表現そのものを單獨で一意に解釋できないことがまゝある.文:「君にはやって見ようがない.」は,「君にはやつて見よう(との氣持ち)がない」とも,「君にはやつて見る手立て(見樣)がない」とも正則として解釋しうる.後者とした場合舊假名遣ひにすると「見やう」とすべきであるが,茶筌は前者で解析するやうで,「見よう」を「見よ(未然)」と「う(助動詞)」に分割する.よつて本システム本則處理も「見よう」のまゝ殘す.文脈からどちらかは判斷がつくわけであるが,システムはそこまで高度にはできてゐない.結果を自分の目で見直すべき所以である. misima 舊假名遣ひ變換機能はあくまでも現代假名遣ひ,新字正則表記テキストの入力を想定してゐる.假に舊假名の文章を入力すると,茶筌が解析できず不當な語分割を行ひ,その結果もとの舊假名遣ひを「改惡」してしまふ可能性が高い.お手持ちの假名漢字變換ソフトウェアが,辭書のチューニングがなされてゐない情態において舊假名遣ひテキストを入力すると,とんちんかんな變換結果を返すのと同じ理窟である.misima は,これはすでに舊假名だな,などといつた高度な判斷はしない.くれぐれも上でしるした仕樣に基づいてゐることをご理解いたゞきたい.そもそも,日常的に舊假名遣ひ・舊字體で書いてゐるひとがこのプログラムを使ふとは思へないが.「舊假名遣ひ・舊字體初心者」が,より一貫性をもたせたい,不正確な部分を檢證したい,などの意圖で半完成の舊假名・舊字體テキストを misima に入力するのだとすれば,もとよりそんな中途半端な舊假名・舊字體表記の習慣はやめたはうがよい. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
をはりに |
misima には Emacs(Meadow)またはコマンドラインから直接利用できる SOAP Web Service 版もある (2005.8.1 公開). Emacs を愛用する方にとつて,使ひ慣れたエディタ環境で文書を作成しつゝ misima を操作できるので,Web ブラウザから使ふよりも壓倒的に便利なはずである.これは,上記 Emacs Lisp と使ひ勝手は同じであるが,ローカルマシンの misima をドライブする後者とは異なり,私のサーバに存する misima に對しネットワーク越しにアクセスする. Java 環境が必要であるが,茶筌,Perl をインストールしなくても misima を利用することができる.詳細は「Emacs から misima を使ふ」を參照してほしい. misima SOAP Web Service 2.5 は,Emacs/Meadow のほか, Microsoft Word, 秀丸エディタ, Jedit X エディタ,TeXShop TeX 統合環境の各アプリケーション用のクライアントも用意してゐる.これらのソフトウェアで文書作成をしつゝ必要なテキスト領域を選擇して筆者のサーバの misima 變換サービスを利用することが可能である.弊サイトのダウンロード・サービスで入手できる. このプログラムのそもそもの利用目的は,私自身のモチーフとして,TeX で古風な文書,漢文の引用や多言語/和文混在の文書の作成を效率よく行ふことにある.文科系 TeX ユーザの利便性を考慮したつもりである.文學硏究論文の作成において,露西亞語をはじめ,西歐古典文獻や中國・日本の古典籍等,多樣な言語文化を本來の姿で引用し,巧みに計算機で文書化することが,昔からの私の課題であつた.計算機の活用がかうした傳統的な印刷術を追ひ求めるのは皮肉といふほかないが,やうやく個人の計算機環境においても一定のレベルで實現できるやうになつた氣がする.この前提として LaTeX のコミュニティで公開されてゐる OTF パッケージや sfkanbun パッケージなどの數多くの優れた業績がある.最後になるが,日頃お世話になつてゐるこれらのパッケージの作者の方々には改めて謝意を申し上げたい. 本プログラムは,日本語形態素解析ソフトウェア『茶筌』の解析結果と,『私の國語敎室』における定式化とに準據することにより,舊假名遣ひ變換を試みたものである.奈良先端科學技術大學院大學情報科學硏究科自然言語處理學講座の方々,福田恆存氏のこれら業績に敬意を表したい.一方で,日本語表記の多樣さゆゑに私自身で茶筌辭書そのものに相當量追加せざるをえなかつたり,茶筌の解析結果を「誤解析」として採用しなかつた部分もある.また『私の國語敎室』は學問的に完全な定式化とはいへず(ことばは變容していくものなのだから當然である),著者が本則の「例外」としてあげた語彙以上のものを misima 辭書に取り込まなければならなかつた.このため變換精度は最終的には misima の責任であり,ユーザ自身で評價いたゞくしかない. このページそのものを本プログラムで處理した結果を參考までに揭載しておく.ブラウザのフォント環境によつては表示されない文字があるかもしれない.變換例など舊假名變換したくない部分は <misima_noop> 無變換指定を行つてゐる(本現代假名遣ひ・新字體版のソースを見ていたゞくとよい). |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
參考文獻 |
[1]奈良先端科學技術大學院大學情報科學硏究科自然言語處理學講座 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
おことはり |
本プログラムは Unicode UTF-8 コードを『今昔文字鏡』の文字番號に變換する機能を有してゐるが,こゝで公開してゐる Web 版ではライセンスの關係で利用できないやうになつてゐる.『今昔文字鏡』の文字番號は株式會社大修館書店の刊行する『大漢和辭典』に基づいてゐる. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
利用 |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
更新履歷 |
|