3 Математическая модель гипертекста
Гипертекст - это нелинейно организованный текст, т.е. текст с нелинейной структурой. Обычному (одномерному) тексту, который можно интерпретировать как одну длинную строку символов, читаемую в одном направлении, противопоставлен многомерный текст. В отдельных точках такого ветвящегося многомерного текста чтение можно продолжать в нескольких различных направлениях в зависимости от информационной потребности. Гипертекст может отличаться от обычного текста порядком следования материала, способом его представления. Элементы гипертекста могут размещаться в виде иерархического дерева или сетевой организации, он может иметь несколько уровней краткого изложения и детализации материала и т. д. Тексты, составленные на естественном языке, хранятся, будучи организованными по новому принципу. При этом приходится отказаться от используемых сейчас подходов к подготовке изданий или других документов и перейти к сложной нелинейной форме организации материала. Для пояснения нелинейной формы построения гипертекстовых изданий рассмотрим одну из известных математических моделей гипертекста.
Используем следующие обозначения.
Пусть М и R - конечные непустые множества:
M = {m1, m2,..., mn}; R = {R1, R2,..., Rk}; .
Элементами множеств М и R будем обозначать объекты и отношения между ними соответственно. Тогда гипертекст в наиболее общем виде (Г0 ) описывается как совокупность следующих четырех компонентов:
Г0 = (T, I, S, Q),
где Т - тезаурус гипертекста; I - информационная составляющая гипертекста. Включает в себя содержание информационных статей Ii , в которые помещаются сведения о всех mi М, т.е.
I = i Ii ;
S - алфавитный (или хронологический) словарь всех наименований mi М; Q - список главных тем гипертекста.
Тезаурус гипертекста состоит из тезаурусных статей. Тезаурусная статья может быть представлена в виде
ti = {mi , Ami },
где ti - тезаурусная статья объекта mi ; Ami - множество объектов, с которыми mi связан отношениями из R с указанием типа отношения.
Например, если объект ma связан с другими объектами из множества М отношениями Ri, Rj,..., Re , то
Ama = {Ri(mi1, mi2, ..., mit), Rj(mj1, mj2, ..., mjs),..., Re(me1, me2, ..., mep) },
(mi1, ..., mit) связаны с объектом ma отношением Ri ,
(mj1, ..., mjs) связаны с объектом ma отношением Rj ,
me1, ..., mep) связаны с объектом ma отношением Re .
Здесь существенно отметить, что в Ami содержатся только ближайшие «родственники» для mi .
Всю совокупность тезаурусных статей, т. е. тезаурус гипертекста, можно представить следующим образом:
Т = {m1, m2, ..., mi, ..., mn), Am1, Am2,..., Ami, ..., Amn}.
Тезаурус гипертекста графически можно представить в виде сети, в узлах которой находятся текстовые описания объектов, а ребра сети указывают на существование связи между объектами и позволяют определить тип связи (рис. 2.4).
Наиболее важным компонентом гипертекста Г0 является совокупность гипертекстовых статей Г:
Г = i Гi , Г Г0 ,
где Гi состоит из описания объекта mi (информационная статья Ii ) и перечня родственных объектов (тезаурусная статья ti ):
Гi = (ti , Ii ).
Выдача информации, ввод новых сведений осуществляются, как правило, Гi -порциями.
Для аналитического осмысления и последующей автоматизации процедуры поиска семантических сведений в гипертекстовом массиве необходимо составить математическое описание этой процедуры. Важность задачи подтверждается также тем, что проблема поиска возникает при внесении новой информации в гипертекст. В этом случае необходимо выделить все родственные объекты, чтобы установить необходимые тезаурусные связи.
Для описания процедуры поиска могут применяться следующие модели:
1) поиск ближайшей по составу и содержанию гипертекстовой статьи:
ρ (Гi , Гc ) min,
где ρ - некоторая характеристика близости состава и содержания гипертекстовых статей; Гc - вводимая статья или статья, которую ищут, Гi Г;
2) поиск гипертекстовых статей с наиболее желательными свойствами:
f(Гi ) max,
где f характеризует некоторые желательные свойства, например наличие одинакового родового объекта, Гi Г;
3) комбинированный случай:
f (Гi ) max, ρ (Гi , Гc ) ≤ρ0 ,
где ρ0 - некоторое ограничение, Гi Г.
Последние три соотношения применяются не только при поиске сведений по запросам абонентов, но и для нахождения ранее сформированных статей с целью установления перекрестных ссылок при поступлении в гипертекст новой информации.
Для корректного обновления гипертекста важное значение приобретает определение элементарных операций над тезаурусом. В семиотике используется следующий подход. В обобщенном виде тезаурус представляется как связка двух параметров: (М, А), где А - отображение MR в М, взвешенное отношениями из R. Пусть заданы тезаурусы:
T1 = (M1, A1), T2 = (M2, A2), ..., Tq = (Mq, Aq).
Определение 1. Тезаурус Т = (М, А ) будем называть объединением тезаурусов Ti, где i = 1, ..., q, и обозначать Т = i Ti, если М = i Mi и для mi M Am i Aim.
Пользуясь данным определением, можно осуществить слияние нескольких независимо подготовленных тезаурусов.
Определение 2. Тезаурус Т = (М, A) будем называть пересечением тезаурусов Ti, i =1, ..., q и обозначать Т = i Ti, если М i Mi и для mi M Am i Aim.
Определения 1 и 2 позволяют манипулировать с пересекающимися независимо подготовленными тезаурусами.
Таким образом, структуру гипертекстового издания можно представить в следующем виде (рис. 2.5).
- Тема 4: Гипертекстовые технологии мультимедийных маркетинговых продуктов
- 1 Функции гипертекстовых электронных изданий
- 2 Принципы построения гипертекстовых изданий
- 3 Математическая модель гипертекста
- 4 Гипертекстовые Web-документы
- 5 Подготовка публикаций в среде Adobe Acrobat
- 6 Технология Help-файлов
- 7 Средства доставки электронных изданий
- 8 Классификация и общие принципы оформления электронных изданий