ロシア語電子コンコーダンス・サービス
since Oct.8 2001
日本語 (Японский язык) |  ロシア語 (Русский язык)
 

概要

本頁は,ユーザのロシア語テキストへのコンコーダンス KWIC 表を自動的に作成するプログラムである.利用者は自身で準備したコーパスを本サイトのサーバにアップロードしたのち,文字と論理条件からなる条件式を指定し,コンコーダンス作成を指示すると,条件にマッチする単語の出現回数とコンテキストが KWIC 形式で得られる.文学研究,翻訳等でご活用いただければ幸いである.

本サービスの利用方法詳細については「Usconcord ロシア語テキスト・コンコーダンス・パッケージについて:構築例・フォームの利用」を参照のこと.以下,簡単に概念を示す.

利用者側において,コンコーダンスを作成したいコーパスを,X11 Ctext (Compound text),KOI8-R,ISO-8859-5,Windows-1251,CP866 もしくは UTF-8 (Unicode) のロシア語コードで準備する.テキスト行末形式は UNIX (LF),Windos / DOS (CR/LF),Mac (CR) いずれも動作するはずである.X11 Ctext または UTF-8 の場合,西欧語,東欧語などがロシア語と混在していてもよい.プログラム仕様の関係で X11 Ctext で用意すると,コード変換回数が削減される分,高速に動作する.

コーパステキストには適当な行長さで改行コードを入れることを推奨する.1 行 100KB まで処理可能であるので現実問題ないはずである.これを越えるとエラーメッセージを出力して終了する.

X11 Ctext または UTF-8 の場合,西欧語,東欧語などがロシア語と混在していてもよい.プログラム仕様の関係で X11 Ctext で用意すると,コード変換回数が削減される分,高速に動作する.

ファイル・パスとエンコーディングをフォームに指定して送信すると,コンコーダンスの条件入力の画面に遷移する.わたしの運営するサーバの資源にも限りがあるので,アップロードできるコーパスには 2MB の容量制限を設けている.手元にあるブルガーコフの《巨匠とマルガリータ》の KOI8-R 電子テキストで約 800KB なので,2MB で一度にどの程度の分析が可能かはご推察いただきたい.フォームが画面下部に表示されていない場合は再度 index.html をロードいただきたい.

コンコーダンス作成の条件,制約,条件式の記述はプーシキン作品コンコーダンス・サービスと考え方は同じである.利用しているツールも同様である.

本ページのコンコーダンス・サービスのほうがより汎用的ということもあり,このページを構成しているツール一式を,コンコーダンス・パッケージとしてダウンロード・サービスで公開している.容量制限を嫌う方,ご自分でサイトを運営したい方はこちらを入手し,お好みにあった姿でご利用いただきたい.

ユーザのアップロードされた電子テキストは計算機処理終了を選択した時点で,もしくは1時間以上アクセスされない場合消去される.しかしながら,何らかの例外が発生してデータがサーバに残ってしまう可能性がないとも限らず,そもそもインターネット上を流れるのであってみれば,機密性の高い文書はご遠慮いただいた方がよいかもしれない.

本ページで提供する内容は無保証である.利用者の責任においてご活用いただきたい.

ご意見,ご感想はメールでいただけるとありがたい.