Обзор программ SemioStatistik и Semantic_Statistik

. четверг, 21 октября 2010 г.
  • Agregar a Technorati
  • Agregar a Del.icio.us
  • Agregar a DiggIt!
  • Agregar a Yahoo!
  • Agregar a Google
  • Agregar a Meneame
  • Agregar a Furl
  • Agregar a Reddit
  • Agregar a Magnolia
  • Agregar a Blinklist
  • Agregar a Blogmarks



Исходный материал
 


Исследование проводится на материале Круга церковного древнего знаменного пения в шести частях (ОЛДП, под редакцией Д.В. Разумовского) — первого и единственного фундаментального собрания певческих книг русской церкви, полностью нотированных знаменами. В шести томах (частях) Круга содержится свыше тысячи пятисот песнопений. Первый том включает песнопения Октоиха. Второй и третий тома содержат обиходные песнопения, а в четвертом, пятом и шестом томе — песнопения певческих книг Праздники, Трезвон и Ирмологий.

Знаменный распев-это основной вид, старейшая и исконная форма русского богослужебного пения. Для записи песнопений используются специальные знаки безлинейной нотации-знамена, которые также иногда называют крюками.
Как вы видите, эта запись отличается от привычной нам 5-ти линейной формы способом записи мелодии, в которой нет четкого соответствия между знаменем и высотой и длительностью звука. Поэтому, перевод из крюковой нотации в линейную не является тривиальной задачей.
Для визуализации песнопений были разработаны специальные шрифты, которые использовались для ввода песнопений  в таблицы Word.



Этапы анализа песнопений

Анализ песнопений включает 3 этапа:

1. Перевод исходного материала в специальный формат, который позволяет проводить различные исследования с помощью вычислительной техники.

2. Статистический анализ. Получение частотных таблиц по знаменам, комбинациям знамен.

3. Семантический анализ. На этом этапе исследуются связи между знаменами, гласы попарно сравниваются, выявляются «общие», а также уникальные знамена.

Перевод песнопения в новый формат


Каждая ячейка таблицы разбирается на элементы следующей структуры:

1) N: порядковый номер

2) S: символ

3) T: текст

4) St: стиль начертания ( жирный/курсив/обычный)

5) VPom: высотная помета

6) DPom: помета длительности

Программа SemioStatistik


Семантический анализ

Исследователи, которые изучают знаменные песнопения, сталкиваются с проблемой проведения ряда работ, связанных с тем или иным подсчетом частоты встречаемости различных символов (комбинаций символов), выявлением закономерностей и особенностей анализируемого текста. Такой тип работ требует постоянного внимания и занимает большое количество времени. Если данный этап автоматизировать, то исследователи смогут получать более точные результаты за меньшее количество времени и меньшие затраты человеческого труда.

Знаменная нотация является самостоятельным языком. Каждому знамени может соответствовать несколько нот, одно знамя может заменяться группой знамен, а значение знамени зависит от его контекста. Существуют специальные азбуки и учебники, по которым можно научиться делать примерный перевод песнопений в ноты, но данный процесс затрудняет наличие в каждом гласе так называемых ‘попевкок’- комбинаций знамен, в которых каждое знамя меняет свое значение, описанное в азбуке. Сложность заключается в том, что точный список этих ‘попевок’ неизвестен. Программа Semantic_Statistik автоматизирует процесс анализа песнопений и позволяет выявлять закономерности такого рода.

Представление знамен в программе

Каждому знамени сопоставляется определенный код (1, 2, …). Это делается исходя их следующих соображений:

1) Для корректного отображения знамен необходим специальный шрифт, иначе пользователь будет видеть латинские и русские буквы и невозможно будет отличить ‘А’ от ‘A’, ‘с’ от ‘c’ и т.д.

2) В том случае, если шрифт установлен, неподготовленному пользователю трудно ориентироваться в графических изображениях.

3) Более простое программное решение.

Возможность просматривать результаты работы программы с помощью шрифтов также реализована.

Построение таблицы 'Формула гласа’

 Под ‘формулой гласа’ понимается закономерность следования знамен друг за другом. На рисунке 1 представлен фрагмент, построенный программой по первому гласу Октоиха (первая часть [Круг,1884-1885]).


В этой таблице показано какое знамя с каким сочетается. Например, для столбца, которому соответствует знамя с кодом 76, цифра 66 в третьей строке обозначает, что после этого знамени 66 раз встречается это же знамя, а знамя с кодом 77 (четвертая строка) встречается 5 раз. Нажав на ячейку с цифрой, можно посмотреть в каком контексте сочетаются эти знамена (они выделены красным цветом). 


В верхней части формы ‘Формула гласа’ выводится информация о количестве различных знамен и количестве встретившихся сочетаний, список можно посмотреть нажав кнопку «конкордансы». Слева выводится конкорданс (сочетание знамен по 2), а справа ᅳ его частота. 


Таблицы можно сохранить в формате *.xls. В этом случае знамена будут представлены в своем исходном виде.

Разметка песнопения

Пользователь может задать определенные правила разметки гласа. Можно создавать группы знамен, которые будут выделяться в тексте другим цветом шрифта или фона.
Например, ввести список знамен с которых обычно начинаются, заканчиваются ‘попевки’, список уже известных ‘попевок’, какие-либо характерные знамена или слова.


Сравнение двух гласов

На этой форме показываются какие общие сочетания знамен у выбранных гласов, какие общие знамена, а какие характерны только для этого гласа.