Глава 8. Поиск информации в web

Содержание

8.1. Инструменты для поиска
8.2. Индексированные каталоги
8.3. Тематические коллекции ссылок
8.4. Онлайновые справочники и энциклопедии
8.4.1. Универсальные
8.4.2. Информационные технологии
8.4.3. Бизнес
8.5. Подбор доменного имени
8.6. Поисковые машины
8.7. Как работает поисковая машина
8.8. Построение индекса
8.9. Поиск по индексу
8.10. Метапоисковые системы
8.11. Степень достоверности содержания Web-документов
8.12. Практические рекомендации по поиску

В главе использованы электронные материалы Интернет-Университета Информационных Технологий http://www.intuit.ru

8.1. Инструменты для поиска

За короткий период существования Web объемы информационных ре­сурсов, доступных в этой глобальной информационной системе, достиг­ли гигантских масштабов. Весьма значительную долю этих ресурсов со­ставляют текстовые документы на различных языках народов мира, представленные в виде HTML-страниц. Поэтому создание доступных пользователям Web средств, реализующих технологии текстового поис­ка, стало крайне необходимым.

В Интернете размещены миллионы сайтов, причем с актуальной информацией соседствует много устаревших ресурсов, мусора и недобросовестной рекламы.

Интернет - это наиболее демократичный источник информации. Каждый может разместить в Сети собственный ресурс и высказать свое мнение. В этом одновременно сила и слабость Всемирной сети. Плюсы наличия столь демократической площадки очевидны.

Однако отсутствие единоначалия и единых требований по оформлению информации приводит к тому, что в Сети мало кто озабочен тем, чтобы избежать дублирования информации или следовать стандартам, принятым на сайте соседа. И здесь наблюдается резкий контраст с корпоративным документооборотом, описанным ранее.

Находить информацию в Интернете, вероятно, было бы очень трудно, если бы не были созданы мощные поисковые инструменты: поисковые машины (поисковики), каталоги (рубрикаторы), рейтинги, метапоисковые системы и тематические списки ссылок, онлайновые энциклопедии и справочники.

Как показывает практика, для поиска разного рода информации наиболее эффективными оказываются различные инструменты. Рассмотрим каждую категорию по отдельности.