Глоссарий

Горячие слова по модулю "Документальные системы"

Анализ текста глубинный

Технологии обработки текстов на естественном языке, направленные на извлечение из них той информации, которая была заложена автором.

Дескриптор

В системах текстового поиска слово или словосочетание, отража­ющее какое-либо понятие предметной области текстовой информаци­онной системы и используемое для характеристики смыслового содер­жания хранимых в системе документов и информационных запросов пользователей

Документ

В системах текстового поиска содержательно законченная и уникально идентифицируемая единица информации, представленная на каком-либо естественном языке..

Документ релевантный

Документ в системе текстового поиска, соответствующий информа­ционной потребности пользователя, которая представлена в поисковом запросе..

Документ цифровой

Представление электронного документа, позволяющее оперировать элементами его содержания.

Документ электронный

Документ, хранимый в памяти компьютера и предназначенный для об­работки приложениями и/или для представления пользователю.

Данные неструктурированные

Данные, для которых не может быть определена схема, описывающая их структуру и другие свойства. Примерами таких данных являются текс­товые документы в системах текстового поиска.

Данные неструктурированные

Данные, для которых не может быть определена схема, описывающая их структуру и другие свойства. Примерами таких данных являются текс­товые документы в системах текстового поиска.

Индекс

Вспомогательная структура данных в базах данных, системах тексто­вого поиска, в файловых системах и различных репозиториях, служащая для повышения производительности при выполнении операций поиска информационных ресурсов.

Индексирование данных

Техника, предназначенная для обеспечения быстрого доступа к дан­ным в базах данных, файлах, хранилищах данных и других репозиториях, которая основана на инверсии значений ключа.

Индексирование документа

Процесс назначения документу индексирующих его свойств.

Индексирование данных

Техника, предназначенная для обеспечения быстрого доступа к дан­ным в базах данных, файлах, хранилищах данных и других репозиториях, которая основана на инверсии значений ключа.

Коэффициент точности поиска

Отношение числа выдаваемых системой по запросу релевантных до­кументов к общему числу выданных документов, усредненное по множес­тву запросов.

Критерий поиска

Условие, которому должны удовлетворять данные, являющиеся ре­зультатом поискового запроса. Глоссарий

Критерий смыслового соответствия

Условие принадлежности хранимых в информационной системе доку­ментов к множеству документов, релевантных заданному пользователь­скому запросу..

Машина поисковая web

Сервер с удаленным доступом в среде web, осуществляющий по за­просам клиента поиск релевантных страни.

Неполнота поиска документов

Явление в документальной информационной системе, когда в резуль­тате обработки поисковых запросов выдаются не все релевантные поль­зовательскому запросу документы, хранимые в системе.

Операция определения местонахождения данных, удовлетворяющих заданному критерию поиска.

Поиск контекстный

Поиск документов, содержащих заданный контекст.

Поиск логический

Поиск по критерию, заданному в форме некоторого предиката.

Поиск по ключу

Поиск записей в файлах или в базе данных, кортежей в отношениях и т.д. по заданному значению поискового ключа.

Поиск полнотекстовый

Поиск с использованием содержания полных текстов обрабатывае­мых документов.

Поиск семантический

Поиск документов на основе их смыслового содержания и описания семантики информационных потребностей пользователя.

Полнота поиска

Способность поисковых механизмов информационной системы обес­печивать выдачу всех без исключения хранимых в системе документов, удовлетворяющих критерию, указанному в поисковом запросе.

Представление документа

Структурированное представление содержания документа в системе текстового поиска, используемое в процессе поиска вместо самого до­кумента.

Представление запроса

Структурированное представление информационных потребностей пользователя, направляемое информационной системе для выполнения операции поиска требуемых документов..

Ранжирование документов

В системах текстового поиска упорядочение множества документов, выдаваемых пользователю в результате обработки запроса, по убыва­нию степени релевантности.

Распознавание символов оптическое

Технология оцифровки текстового документа, основанная на исполь­зовании сканеров и программ распознавания..

Свойство документа индексирующее

В системах текстового поиска термы, извлеченные из содержания до­кумента, — слова, словосочетания и т.п., какие-либо более сложные конструкции, вычисленные на основе этих извлеченных термов, либо внешние ассоциированные с документом атрибуты, которые идентифи­цируют данный документ, возможно, не уникальным образом.

Связь обратная релевантности

Функциональная возможность системы текстового поиска, позволяю­щая пользователю возвращать системе оценки релевантности выдавае­мых по запросу документов.

Степень релевантности документа

Мера близости документа пользовательскому запросу, определяемая как значение числовой функции, изменяющейся в интервале [0 .1]

Стоп-слово

Служебное слово (предлог, союз и т.п.), которое встречается прак­тически в любом документе и тем самым не является информативным. Стоп-слова не могут использоваться в качестве индексирующих свойств документов..

Тезаурус

Словарь, описывающий лексические единицы информационного язы­ка, а также смысловые отношения между ними, например отношения си­нонимии и омонимии..

Шум информационный

Ситуация в системе текстового поиска, когда в результате поиска вы­даются нерелевантные пользовательскому запросу документы..

Эксперименты крэнфильдские

Проводившиеся в начале 60-х годов группой К. Клевердона из коллед­жа по аэронавтике в Крэнфильде (Англия) эксперименты по сравнению средств индексирования документов в системах текстового поиска на ос­нове специально разработанных тестов и методологии..

Ядро Дублинское

Набор элементов метаданных, значения которых могут описывать со­держание документов различной природы, например книг или публика­ций в периодических изданиях, web-документов или HTML-страниц web. Дублинское ядро — стандарт консорциума Dublin Core Metadata Initiative, и ANSI.