ロシア語形態素解析用辞書・オリンピック開幕前夜

北大の浦井康男教授より,先生が構築したロシア語辞書データをいただいた。浦井先生は日本のロシア語学者のなかで計算機でロシア語テクストを解析するにおいてもっとも先進的な方である。ロシアの文法学者ザリズニャクの文法辞書に基礎を置いたロシア語電子辞書を何年もかけて構築し,コンコーダンス作成やテクスト研究に活用して来られた。その成果の一端はここで書いたとおりである。

この辞書は 40 万の異なり語をキーとする単語・文法データベースである。ロシア語の変化形に対する見出し語や性・数・格,活動体/不活動体区分,品詞,アクセント位置などの文法属性情報を有し,ロシア語形態素解析に有用である。この辞書により私は見出し語ベースで KWIC を生成できるコンコーダンスプログラムを作成したいと思案しているところである。海外の Tagger プログラム (形態素解析器) — 語形や文法の特性に基づくアルゴリズムで解析するものが主流のように私には思われる — の利用も考えたが,より泥臭く語彙を集めたデータベースでやってみようと私は思っている。

* * *

いよいよ明日,北京オリンピックが開幕。清潔漢によるボイコットの呼び声もそれなりにかしましかったけれども,日本選手団が無事北京入りできてよかったよかった。

今日,北京オリンピック男子サッカー・日本チームのグループリーグ戦がはじまるということで,仕事を無理繰り切り上げて帰宅し,前半終了間際からテレビ観戦した。ビール杯片手にわくわく感を味わえるのはうれしい。この小市民ぶりがシアワセなんである。残念ながら日本は,見る限り日本と同様にどうもスピード感の足りない「チョーイマイチ」の米国に敗れてしまった。リードしている状況での米国の選手交代のタイミング,時間の絶妙な使い方に舌を巻く。

ところで Yahoo! ニュースの書き込みを見ていると,この試合で中国人観客が米国のチャンスで歓声を上げていたのが許せないだの,審判が公正でなかっただの,負け惜しみが多くて面白かった。私には審判の目が曇っていたようには思われなかった。それよりも足の止まった日本代表選手の度々の転倒がファール目当てなのが見え見えだったわけで,そっちのほうがよっぽどみっともなかった。負けたことより,こういうセコさが頭に来た。中国人の観客だって,アジア杯やW杯予選に比べると十分「教育」が行き届いていたように見受けられ,開催国の品位として非難されるほどではなかったと思う。

そう,反中ドモの負け惜しみ。米国戦の敗退は日本の実力の結果である。そんなこと,オリンピック予選のときから分っていたことではないか? ころころ変わった代表入り選手の面々からして,まあこんなものではないだろうか。でも,ナイジェリア戦あるいはオランダ戦でのサプライズを期待したい (グループリーグで「サプライズ」ってか!)。サッカー日本代表は,お山の大将に近い野球日本代表と違って,出場国の顔ぶれからしてメダルと無縁の最弱の国であって「失うものは何もない」のだから,ファール取りなんて小賢しいことをしないで,もっとのびのびはつらつ,フェアにプレーしてほしいと思う。間違っても,弱いくせにイタリアみたいな狡猾なサッカーはやめてもらいたい。ましてや,負けたからといってめんたまきんたまを抜かれるわけでもないのだから。