Опыт динамического составления конкордации
к переданному тексту

since Oct.8 2001
Японский язык | Русский язык 

Предисловие

Данная Web-страничка — опыт компьютерного динамического составления конкордации к русским текстам, переданным пользователями. Конкордация (или "конкорданс", по термину литератураведения в последние дни) — это указатель слов и словосочетаний, встречающихся у какого-либо писателя или в какой-либо книге, с отсылками к тексту. Здесь можно получить данные о частоте появления слов, а также список слов и словосочетаний согласующихся с выбранными выражениями. Мне бы хотелось, чтобы эти таблицы могли принести пользу исследователям русской литературы и лингвистики.

Можно использовать данную систему по следующим операциям.:

  1. Готовить корпус для конкордации на русской вычислительной кодировке: X11 ctext (Compound text), KOI8-R, ISO-8859-5, Windows-1251, CP866 или UTF-8. Объем передачи корпуса ограничен 2MB на каждую обработку.
  2. Указывать имя файла корпуса подвергающегося передачи и его кодировку на Web-form.
  3. Передавать файл, щелкая мышью по кнопке "Передача". Появляется экран "Форма условий конкорданса".
  4. Вводить поисковое выражение, характеризующее слова.
  5. Передавать указание на составление конкорданции, щелкая мышью по кнопке "Передача". Получается список конкордации, согласующийся с вашими условиями.
  6. Можно анализировать переданный корпус повторно. Данный файл исключается из системы автоматически в следующих условиях:
    • когда операция анализа кончилась (оператор щелкнул мышью по кнопке "Кончать анализа" на экране результата).
    • когда не было доступу к данному файлу 60 минут.

Способ определения условий для конкордации и WWW-серверные приложения (CGI, Shell script) — те же как на странице: «Опыт динамического составления конкордации к текстам А. С. Пушкина».

Предлагаемые материалы ни в коей мере не претендуют на полноту и совершенство, и автор не несет никакой ответственности за любые результаты, полученные при использовании данных материалов. Это следует признать до начала работы.

Замечания и предложения принимаются по электронной почте.