staslova [-s|-m|-a] [-c{0|1}] [-l{0|1|2|3|4|5}] [-o{0|1|2}] [-h]\ [-d実行定義ファイル名] [<入力ファイル] [>出力ファイル]
A|B
は A か B の択一であることを示す。
コマンド書式を表 9.2 に示します。
-s | 統計機能のみを実行する。 |
-m | 検索機能のみを実行する。実行定義ファイルにおいて検索条件式が 指定されていない場合は何も出力されない。 |
-a | 統計及び検索機能の両方を実行する。(デフォルト:省略時設定値) |
-c | ケース条件。`-c1'のように指定する。
0:単語を小文字変換を行った上で統計・検索処理を行う。 検索条件式も小文字変換してから試験する。 ゲスト・コードの場合は小文字変換は行わない。 (デフォルト) 1:単語を小文字変換しない。出現した状態・指定式で評価する。 |
-l | 言語分類の優先順位指定。「言語」は日本語 (Japanese)、
キリル文字諸語 (Cyrillic) 及びラテン文字諸語 (Latin) の3種とする。
統計結果出力もこの順で行う。`-l3'のように指定する。
0:Japanese>Cyrillic>Latin (デフォルト), 1:Japanese>Latin>Cyrillic, 2:Cyrillic>Japanese>Latin 3:Cyrillic>Latin>Japanese, 4:Latin>Japanese>Cyrillic 5:Latin>Cyrillic>Japanese |
-o | 検索結果出力レベル。`-o1'のように指定する。
0:条件式にマッチした単語の数 1:マッチした単語とそれぞれのマッチ件数+レベル0 2:マッチした単語を含む行の行番号及び、その行と前後1行(計3行)の 原文断片+レベル1 (デフォルト) |
-h | 簡易ヘルプの表示。 |
-d | 実行定義ファイルを指定する。 |
ks0 | 一般区切り文字定義 (ASCII)
1 カラムから記述し、指定内容との間に 1 個以上の空白を入れること。 複数行に分けて記述してもよい。 そのときは先頭の ks0 をかならず記述すること。 空白とタブは無視する。 省略すると `.'`,'`;'`:' などが単語の一部とみなされる。 (以下考え方は同じ) |
kc0 | 連続区切り文字定義 (ASCII) |
kp0 | セット区切り文字定義 (ASCII) |
ks1 | 一般区切り文字定義 (ISO 8859-1)
いわゆる右部分 x`A0'〜x`FF' の文字を直接記述する。 ここに左部分 (ASCIIと同じ文字 : x`20'〜x`7F') を記述しても無視する。 これはkx1,2,5共通の規則である。 |
kc1 | 連続区切り文字定義 (ISO 8859-1) |
kp1 | セット区切り文字定義 (ISO 8859-1) |
ks2 | 一般区切り文字定義 (ISO 8859-2) |
kc2 | 連続区切り文字定義 (ISO 8859-2) |
kp2 | セット区切り文字定義 (ISO 8859-2) |
ks5 | 一般区切り文字定義 (ISO 8859-5:Cyrillic) |
kc5 | 連続区切り文字定義 (ISO 8859-5:Cyrillic) |
kp5 | セット区切り文字定義 (ISO 8859-5:Cyrillic) |
js | 一般区切り文字定義 (JIS)
漢字を直接記述するか4桁の JIS コード 16 進数で記述するか2とおりが可能 (jc,jp も同様)。 js のみ `漢字 A : 漢字 B' で漢字 A (これを含む) から漢字 B (これを含む)までの範囲指定が可能。 |
jc | 連続区切り文字定義 (JIS) |
jp | セット区切り文字定義 (JIS) |
se | 検索条件式 (単項式または複合式) を記述する。
通常文字は JIS、ISO 8859-1, 2, 5
のサポート・コードとゲスト・コードを直接記述する。
区切り文字で区切って複数の条件式を1行に記述してもよい。 se 行が読み込まれた時点で定義されている区切り文字で チェックがなされ、該当する文字はスペースで置換するものとする。 ただし特殊文字 (`*+#.()\') はチェック対象外とする。 サポート・コードの場合 `-c0' オプションのとき適合試験の前に小文字 変換を行う。 se 行の記述がないと検索機能は無効となる。 |
# | 行先頭の``#''はコメント行を示す。 |
項目 (staslova.h シンボル) | 制限値 |
対象テキスト行及び定義ファイル行の最大長 (MAXLINE) | 4,096バイト |
1単語及び1単項式の最大長 (MAXTOKEN) | 4,096バイト |
seコマンド行の最大数 (MAXSELINE) | 128行 |
検索式の最大数 (MAXCOND) | 512個 |
検索式グループ最大数=かっこの入れ子の最大数 (MAXNEST) | 32個 |
検索式1グループ内の論理演算子の最大数 (MAXSTACK) | 64個 |
1行中及び検索条件式中の単語/単項式の最大数 (MAXWORD) | 256個 |
js区切り文字定義最大長 (MAXJS) | 256バイト |
その他区切り文字定義最大長 (MAXKx, MAXJx) | 各128バイト |