Разделы

Авто
Бизнес
Болезни
Дом
Защита
Здоровье
Интернет
Компьютеры
Медицина
Науки
Обучение
Общество
Питание
Политика
Производство
Промышленность
Спорт
Техника
Экономика

Структура потребностей в электронных текстах

Жизненный цикл электронного текста

Электронный текст (документ) за время своего существования проходит ряд фаз, складывающихся в его жизненный цикл.

Можно выделить три основных фазы жизненного цикла текстового документа:

* создание;

* активное функционирование в качестве носителя значимой информации;

* "посмертное" существование в качестве (условно говоря) архивного документа.

Разделение между этими фазами может быть достаточно условным. Для текстов, создаваемых в исследовательских целях, в частности, для машиночитаемых версий исторических источников, разделением между активным и архивным документом можно вообще пренебречь, т.к. в принципе любой текст, однажды введенный в компьютер, может быть в любой момент востребован в аналитических целях.

Жизненные циклы электронных текстов могут в значительной степени различаться в зависимости от:

• происхождения (которое накладывает отпечаток на их формальные характеристики);

• назначения или предполагаемого использования (определяющего трансформации текста);

• типа информационной системы, в которой они активно функционируют.

В свою очередь, первые две характеристики предъявляют определенные требования к системному окружению, обеспечивающему функционирование документов 10.

Важно отметить, что для базы данных (во всяком случае, коммерческой) жизненный цикл выглядит иначе: ее созданию предшествует длительный докомпьютерный период разработки, а активное ее существование органично включает постоянное обновление элементов данных, не меняющее ее структурных свойств и не ограничивающее (внешне) ее доступности.

Важное значение имеет предыстория электронного текста, т.е. создается он изначально в электронном виде или является версией традиционного ("бумажного") источника. В последнем случае (наиболее характерном для исторического исследования) возникает новый слой ин формации - изображения исходных документов (графические файлы) - и возможность увязывать в рамках одной системы параллельную работу с документами разной природы (см. главу 9). Та же ситуация возникает, когда в качестве документов выступают не только тексты, но и звук, ви део и т.п., т.е. когда речь идет о системах мультимедиа (они также бу дут обсуждаться в главе 9). Другое следствие способа ввода текста в

 

Приводимая ниже классификация потребностей возможных пользователей систем управления текстами относится к ситуации, когда пользователь имеет дело с большими массивами текстовой информации, полное описание которой ему не по силам держать в голове, или же оно ему просто недоступно.

Итак, пользователю может потребоваться:

1. Локализация (извлечение) конкретного документа.

2. Поиск любой имеющей отношение к интересующему предмету информации. Характер запросов такого рода сильно варьируется в зависимости от степени квалифицированности пользователя и характерных для данной предметной области принципов организации документов. Можно выделить два крайних случая (по степени сфокусированности поиска);

3. поиск целых документов, содержащих тексты по конкретной тематике;

4. поиск "цитаты" (т.е. минимального логически цельного фрагмента текста, отвечающего заданным критериям поиска).

5. Получение ответа на конкретный вопрос (в явном виде та кой ответ может ни в одном тексте не содержаться). Такого рода информационные потребности обычно обсуждаются в контексте экспертных ("интеллектуальных") систем.

4. Аналитический информационный поиск, в самой широкой формулировке подразумевающий сопоставление каких-либо формализуемых характеристик различных текстов (документов или их фрагментов). Например, различные элементы статистического анализа текстов, который является самостоятельным инструментом в исследовательской практике, могут использоваться в целях информационного поиска в ряде современных полнотекстовых систем.

Организация системы управления ресурсами текстовой информации невозможна без предварительного анализа характера потребностей потенциальных пользователей системы, поскольку никакое существующее программное обеспечение не в состоянии обеспечивать любые потребности с равной эффективностью. При этом следует также принимать во внимание, насколько" велик круг потенциальных пользователей, и - что более важно - насколько разнообразны их содержательные интересы. Широкий круг узких специалистов (одной специальности) - идеальная с точки зрения организатора системы ситуация, позволяющая добиться максимальной эффективности, ограничиваясь очень простыми и жесткими решениями. Однако эта модель редко встречается в чистом виде, поэтому в полнотекстовых системах, ориентированных на информационный поиск, как правило, ищутся более общие, и следовательно, более сложные решения.

 

 

Дата публикации:2014-01-23

Просмотров:666

Вернуться в оглавление:

Комментария пока нет...


Имя* (по-русски):
Почта* (e-mail):Не публикуется
Ответить (до 1000 символов):







 

2012-2018 lekcion.ru. За поставленную ссылку спасибо.