Глава 8. Базовые стандарты технологий web

Содержание

8.1. Язык HTML
8.2. Универсальный указатель ресурсов
8.3. Протокол передачи гипертекста
8.4. Универсальный шлюзовой интерфейс

В этой главе использованы электронные материалы [KAGA06].

Как уже отмечалось, Веб замышлялся его создателями как информационный репозиторий с архитектурой клиент-сервер для широкого сообщества пользователей, легко доступный в неоднородной коммуникационной среде Интернет на различных аппаратно-программных платформах. Для создания такой системы необходимо было стандартизовать:

Такие стандарты для Веб были разработаны. Это - язык гипертекстовой разметки HTML (Hypertext Markup Language), универсальный указатель (локатор) ресурсов URL (Universal Resource Locator) и протокол передачи гипертекста http (Hypertext Transfer Protocol). Кроме того, для того, чтобы обеспечить возможности расширения функций Веб-сервера, был разработан стандарт универсального шлюзового интерфейса CGI (Common Gateway Interface). Рассмотрим кратко эти базовые стандарты технологий Веб.

Язык HTML относится к категории языков, называемых языками разметки. Такие языки позволяют позволяют с помощью специальных помет выделять фрагменты зв заданном текстовом документе и определять различные их свойства. Процедура расстановки помет называется разметкой текста.

Одним из широко известных языков разметки является стандартный обобщенный язык разметки SGML (Standard Generalized Markup Language). Спецификации этого языка, как уже отмечалось выше, имеют статус международного стандарта (ISO 8879:1986) и широко используются за рубежом в различных издательских системах и системах управления документами.

Именно на основе SGML основатель Веб Тим Бернерс-Ли - сотрудник CERN - разработал язык HTML. Этот язык включает набор специальных помет, называемых тегами. Теги языка HTML позволяют размечать исходный текст, определяя способ его представления на экране компьютера, и выполнять некоторые другие функции. Теги, как правило, являются парными - имеется открывающий и закрывающий теги. Открывающий тег может иметь обязательные и/или факультативные параметры (атрибуты).

С помощью пары тегов в размечаемом тексте выделяется некоторый его фрагмент, свойства которого описывает данный тег в соответствии с его функцией и с помощью значений параметров, если они предусматриваются для данного тега в синтаксисе языка. Выделяемые парами тегов фрагменты размечаемого текста могут быть вложенными. Другого рода пересечения фрагментов не допускаются. Таким образом, размеченный тегами HTML текст представляет собой последовательность иерархий выделенных тегами фрагментов.

Теги языка HTML позволяют с помощью разметки исходного текста:

Текст, размеченный с помощью тегов языка HTML выглядит как обычный текстовый файл. Этот файл по принятому соглашению должен иметь расширение html или htm. Первое из них используется обычно на платформах различных версий UNIX. Сокращенное расширение htm используется на платформах MS Windows.

Следует еще раз подчеркнуть, что разметка текста средствами этого языка осуществляется не для выделения и идентификации фрагментов его содержания, а для форматной разметки, определяющей представление страницы на экране клиентского компьютера.

Язык HTML имеет статус стандарта консорциума W3C. После принятия первоначальной версии этого стандарта он неоднократно модифицировался. Действующая в настоящее время версия стандарта HTML 4.01 была одобрена W3C в декабре 1999 г.