プーシキンの電子コンコーダンス

『オネーギン』に関する論文をすこしずつ書いている。

ある単語の用例を調べるために,久しぶりにプーシキン電子コンコーダンス・サービスを使った。使いにくい。検索条件に該当する単語の用例が KWIC 形式で出力できるのだが,リファレンスがテクストのファイル行番号で出る。なんとも間抜けな仕様である。しかしこれを改善して作品名で表示するには,コーパスの作成段階でインデキシングの工夫を要する。サラリーマンの私には,そこまで作り込む余裕がまるでなかったわけで,設計当初からなんとかしなくてはと考えていた欠点である。

言いわけはよいとしても,これではたしかに使う人がいないはずである。論文ができたら,こちらの改作にとりかかろう。

現在は単語検索しかできないが,脚韻パターン条件や近接・隣接条件でもテクストを検索できるようにする。つまり指定単語条件で詩行の末尾を探索して該当するパターンを表示したり,ある語とある語が指定行以内に同時に出現するテクストの断片を検索したり,統計をとったりできるようにする。ジャンルだけでなく,作品を指定してその範囲内で処理可能にする。結果のリファレンスも,作品名,章,節,行を表示するとともに当該テクスト本体へのリンクを貼る。

とまあ,最近は満員電車のなかで思いを巡らしているんである。