misima どうして集
since Mar. 20 2007
インデックス
 

-   UID, PASS を聞かれるんですけど.
-   旧字変換結果が文字化けする.
-   旧字変換結果をブログに貼付けて投稿したら「?」に文字化けする.
-   旧字変換結果をテキストエディタにコピペしたら文字化けする.
-   旧字変換で,牛丼の吉野家の吉(つちよし)が出せるとあるが,出ないんですけど.
-   旧字変換--TeX 変換で Unicode 文字が \UTFM{xxxx} となり,OTF パッケージを指定してもエラーになる.
-   旧仮名変換結果がへんな場合がある.
-   TeX くの字点変換を用いて「つるつるかめかめ」を入力しても,「つる\ajKunoji{}かめ\ajKunoji{}」でなく,「つる\ajKunoji{}かめかめ」となるのはなぜ.
-   misima TeX 変換結果で LaTeX タイプセットし,dvipdfmx で PDF を作成したが,仮名文字や \UTFM{xxxx} 文字が Adobe Reader で表示されない.
-   「あなたのフォームからは misima は実行できません」云々というメッセージが出力されて変換できません.
-   インストール版 misima-2.x.tar.gz を自分の PC にインストールしたいのですが.
-   Servlet 版と CGI 版の違いは?
-   Microsoft Word から変換したいのですが.
-   misima SOAP Web Service とは?
問いと答え
 

問い   UID, PASS を聞かれるんですけど.
答え

  現在 misima は限定公開になっています.悪しからず.
***
問い   旧字変換結果が文字化けする.
答え

  ブラウザで Unicode フォントが利用可能になっていないため.Unicode フォントをブラウザで表示させる方法はそれぞれのブラウザ仕様を調べてください.最近の代表的な OS, ブラウザはだいたい Unicode 漢字が表示できるようです.
***
問い   旧字変換結果をブログに貼付けて投稿したら「?」に文字化けする.
答え   Web サイトのブログ管理ソフトの文字コード設定が UTF-8 以外の Shift-JIS,EUC-JP になっている可能性があります.
 この場合,どうしても旧字・旧仮名で書き込みたいのなら,旧字変換の「JIS第一・第二水準」オプションを選択することをお勧めします.
***
問い   旧字変換結果をテキストエディタにコピペしたら文字化けする.
答え   テキストエディタが UTF-8 に対応していないからと考えられます.
 特定の文字が化ける場合は,ご利用の Unicode フォントにグリフの不足があるかも知れません.
***
問い   旧字変換で,牛丼の吉野家の吉(つちよし)が出せるとあるが,出ないんですけど.
答え   特殊異体字出力は TeX 変換だけで可能です.さらに「吉」の前に「▼」を入力する必要があります.
   吉→普通の「吉」
   ▼吉→「\CID{13706}(つちよし)」
***
問い   旧字変換--TeX 変換で Unicode 文字が \UTFM{xxxx} となり,OTF パッケージを指定してもエラーになる.
答え   \usepackage{otf} でお使いの場合,\UTFM 命令は使用できません.\UTFM 命令を使う場合,\usepackage[multi]{otf} を指定してください.
 \usepackage{otf} 指定では \UTF 命令もしくは \CID 命令が利用できます.\UTF 命令にこだわりたい方は,misima の出力結果をさらに sed などで置換してください.
    sed -e 's/\\UTFM/\\UTF/g' misimaout > yourout
 \UTFC (中国語簡体字), \UTFT (中国語繁体字), \UTFK (韓国語) を利用する場合も multi オプションが必要です.\UTFM は日本語のグリフがあるときは日本語の文字,なければ中国語,韓国語の文字を拾うことのできる OTF 命令です.
***
問い   旧仮名変換結果がへんな場合がある.
答え   そういうものです.
 へんなところは適宜手直しください.
 誤変換のテクニカルな要因は,主に日本語形態素解析ソフトウェア茶筌の解析失敗です.misima 辞書が不足している場合もまれにあります.茶筌の解析結果は「解析結果出力」で確認できます.
 解析失敗の根本的要因は,次のいずれかだと考えられます.
  1. 入力文章そのものがあいまい・不正確である.
  2. 省略が多すぎる.
  3. 句読点の付け方が適切でない.
  4. あまり使われない言葉を用いている(茶筌辞書にない).
  5. 現代仮名遣いで一般的でない表記を用いている(茶筌辞書にない).漢字表記がより一般的な言葉を仮名で入力している,旧字・旧仮名で入力している(なんで?)などがこれに該当します.
 茶筌辞書に存在しない語を適切に変換することは偶然に依存します.misima Web 版では茶筌辞書に語を追加登録するインタフェースは備えていません.ここまでチューニングして利用したい方は,misima 本体をインストールして,茶筌辞書を独自に調整してください.(misima インストール版の公開は停止しました)
 「解析結果出力」で形態素解析が首尾よくできているのに誤変換となっている場合は,misima 辞書の不備もしくはロジックの問題です.ユーザ辞書に追加するか,作者にご連絡ください.
***
問い   TeX くの字点変換を用いて「つるつるかめかめ」を入力しても,「つる\ajKunoji{}かめ\ajKunoji{}」でなく,「つる\ajKunoji{}かめかめ」となるのはなぜ.
答え   「つるつる」という語は茶筌辞書に存在し,一語で解析されますが,「かめかめ」は茶筌が二語で解析するため,くの字点変換の対象外となるためです.「解析結果出力」オプションをオンにして確認してみてください.
***
問い   misima TeX 変換結果で LaTeX タイプセットし,dvipdfmx で PDF を作成したが,仮名文字や \UTFM{xxxx} 文字が Adobe Reader で表示されない.
答え   ヒラギノなど Adobe-Japan1.5 対応のフォントを埋込まずに PDF を生成した場合,Adobe Reader の標準セットアップでは Adobe-Japan1.5 独自の文字は表示できません.Adobe Readerのアジア・中央ヨーロッパ言語フォントパックのページから Japanese, Chinese Traditional などのアジア言語フォントをダウンロードし,追加インストールを行ってください.
 OTF パッケージの調整については,TeX Wiki OTF を参照してください.
***
問い   「あなたのフォームからは misima は実行できません」云々というメッセージが出力されて変換できません.
答え   弊サイト変換フォームを自分のコンピュータに保存した HTML,もしくは Google などのキャッシュページから変換しようとしていませんか.
 misima は,HTTP ヘッダにある referer (参照元 URL) に弊サイトの変換フォーム URL が格納されている場合のみ,変換要求を受け付ける仕様になっています.これは次の事情によります.変換要求テキストの最大値に制限を設けないと長大処理でサーバが占有されてしまう可能性があります.これを抑止するため弊サイトのフォームでは JavaScript の手続きにより 8,000 文字の制限を付けております.よって弊サイトのフォーム以外からの要求かどうかを判断するために,referer をチェックしているわけです.
 お使いのブラウザが referer を送信しないような設定,仕様である場合,弊サイトのフォームから送信したとしても,このメッセージが出力されます.
***
問い   インストール版 misima-2.x.tar.gz を自分の PC にインストールしたいのですが.
答え   ローカル PC にインストールして利用できる misima 変換エンジンのパッケージは,現在公開しておりません.Web Servlet 版Web CGI 版,もしくは SOAP Web Service 版をご利用ください.SOAP Web Service パッケージはダウンロード・サービスから取得できます.
***
問い   Servlet 版と CGI 版の違いは?
答え   Web Servlet 版は,ユーザ辞書が利用できませんが,簡易にオプションを指定し同じページに変換結果を挿入するユーザインタフェースを持ちます.オプション処理をブラウザで実行し,変換で必要となるテキストのみ送受信し,すでに常駐している (すぐ処理がはじめられるよう待ち受けている) サーバで処理するため,CGI 版より高速に動作します.
 これに対し,Web CGI 版は,misima のオプションを細かく設定でき,ユーザ辞書を指定できる一方,古典的な CGI で処理しており,プロセス生成,サービス起動,辞書読み込み,ページ生成等のオーバヘッド要因により,Servlet 版に比べ遅いという欠点があります.
 旧仮名遣い変換,旧字変換,用字・用語変換,TeX 多言語標準変換,仮名反転変換は,両方ともに指定できます.ユーザ辞書を指定するのでない限り,原則 Servlet 版の利用をお勧めします.Servlet 版ではよく利用するオプションをブラウザに記憶させておくことが可能です.なお,TeX 多言語変換については,CGI 版は標準オプション,Servlet 版はドイツ語オプション付きの違いがあります.
***
問い   Microsoft Word から変換したいのですが.
答え   Microsoft Word 2003 のための misima 変換用マクロテンプレートが misima SOAP Web Service パッケージに同梱されています.これを用いると,Microsoft Word で作成中の文書テキストを選択し,変換指示を行うと,ネットワーク経由で弊サイトの変換サーバに接続し,変換結果で選択テキストを置換することができます.
 Windows 2000/XP で動作すると思います.このためには別途 Microsoft Office XP Web Services Toolkit 2.0 を Microsoft 配布サイトからダウンロードし,インストールしておく必要があります.詳細は「Microsoft Word から『misima 旧仮名遣い・旧字変換』を使う」ページをご覧ください.
***
問い   misima SOAP Web Service とは?
答え   SOAP とは「石鹸」ないし「ソープランド」とは無関係です.Simple Object Access Protocol の略で,分散処理のための XML ベースの通信プロトコルです.SOAP Web Service は,HTTP 上でアプリケーションのデータを送受信するための規約です.このインタフェースにより Web ブラウザ以外のアプリケーションからインターネット上のアプリケーション・サービスを利用することができます.misima SOAP Web Service はこのインタフェースをサポートすることにより,Microsoft Word, GNU Emacs, Meadow, 秀丸エディタ, Mac OS X Jedit X, TeXShop 等のアプリケーションから misima 変換サービスを実現しています.舞台裏では,各アプリケーション用のクライアント・ソフトウェアが弊サイトの misima サーバにアクセスしますので,インターネット環境がないと利用できません.
 misima SOAP Web Service により上記文書作成アプリケーションから直接 misima 変換を実行できるため,Web ブラウザとの間でコピー&ペーストする等の面倒がなくなります.
 misima SOAP Web Service 用クライアントのパッケージはダウンロード・サービスから取得できます.動作条件,環境設定等の詳細については,各アプリケーション用の説明ページをご覧ください.
 上記以外のアプリケーションでも,それがマクロやプログラミングのためのインターフェースを備えていれば,misima SOAP Web Service のインタフェースに基づく限り,当該アプリケーションからでも弊サイト misima SOAP サーバを利用できる仕組みになっています.misima SOAP Web Service パッケージは Java 言語によるクライアント・クラスライブラリや,コマンドインタフェースで外部 SOAP クライアントを起動する実行プログラムを提供しています.Java クラスライブラリ API 仕様はこちらにあります.詳細は「利用の手引き misima SOAP Web Service Ver. 2.5」(11MB の容量があるので注意!) の 12 章「misima SOAP プログラミング」をご覧ください.ただし,独自に misima SOAP クライアントを作成し運用する場合は,必ず筆者にご連絡ください.
***
更新履歴
 

Mar. 20, 2007 新規作成
Apr. 29, 2007 誤記訂正
Aug. 26, 2007 追記
June 29, 2008 インストール版の廃止,Servlet 版, SOAP 記述追加
Apr. 29, 2011 限定公開の件

counter