2.4. Неструктурированные модели

К этой категории относятся вербальные модели, то есть модели, описывающие реальность в виде текстов н естественном языке. В таких моделях явным образом не представляете структура предметной области — множество сущностей, их свойств, раз личного рода связей между этими сущностями, интересующих Пользователей системы. Эта структура может быть реконструирована на основе анализа содержания заданных текстов, однако не всегда однозначны образом. Автоматизация такого анализа — достаточно сложная задач связанная с технологиями обработки естественного языка (Natural Language Processing).

Существует широкий спектр информационных систем, поддержива­ющих неструктурированные модели предметной области. В простейших из них задачи анализа и понимания естественного языка возлагаются на пользователя. В продвинутых системах большая часть нагрузки, связан­ной с решением этих задач, возлагается на систему.

Здесь уместно вспомнить об интенсионале предметной области. В систе­мах рассматриваемого класса он может быть материализован в форме теза­уруса, описания онтологии предметной области и других инструментов, ко­торые относятся к средствам лингвистической поддержки системы (см. Глава 3, Функции информационных систем В простейших системах он явно не представлен в системе и ей не доступен. Он существует только в интеллектуальном багаже пользователя. Что касается упоминавшихся продвинутых систем, то их возможности по работе с содержанием поддерживаемых в системе доку­ментов основаны именно на интенсиональной модели предметной облас­ти, явным образом представленной в системе.

Представления предметной области в вербальных моделях можно на­звать неструктурированными. Информационные ресурсы таких сис­тем часто называют неструктурированными данными. К числу ин­формационных систем, использующих вербальные модели предметной области, относятся системы текстового поиска. Изучению таких систем посвящена третья часть курса Документальные системы