Язык гипертекстовой разметки HTML и протокол обмена гипертекстовой информацией HTTP

Автор работы: Пользователь скрыл имя, 17 Октября 2011 в 17:18, реферат

Описание

Язык гипертекстовой разметки HTML является одним из компонентов технологии ведения гипертекстовых распределенных баз данных World Wide Web. Все программы- интерфейсы - Mosaic, Netscape, Arena, Cello, Lynx и т.п. являются, фактически, интерпретаторами этого языка. В настоящее время готовится третья версия языка, которая отражает как существующую практику разработки гипертекстовых баз данных, так и является в некоторой степени ориентиром для разработчиков программных средств.

Работа состоит из  1 файл

Реферат по информатике.docx

— 35.23 Кб (Скачать документ)
 
 
 
 
 
 
 

Язык  гипертекстовой разметки HTML и протокол обмена гипертекстовой информацией HTTP 
 
 
 
 
 
 
 
 
 
 
 

Реферат

Язык гипертекстовой разметки HTML является одним из компонентов  технологии ведения гипертекстовых распределенных баз данных World Wide Web. Все программы- интерфейсы - Mosaic, Netscape, Arena, Cello, Lynx и т.п. являются, фактически, интерпретаторами этого языка. В настоящее время готовится третья версия языка, которая отражает как существующую практику разработки гипертекстовых баз данных, так и является в некоторой степени ориентиром для разработчиков программных средств. Данный доклад посвящен краткой характеристике возможностей HTML и его средствам управления обменом гипертекстовой информацией.

Введение

Язык гипертекстовой разметки HTML (HyperText Markup Language) был предложен Тимом Бернерсом-Ли в 1989 году в качестве одного из компонентов технологии разработки распределенной гипертекстовой системы World Wide Web. 
Разработчики HTML пытались решить две задачи:

  • дать дизайнерам гипертекстовых баз данных простое средство создания документов
  • сделать это средство достаточно мощным, чтобы отразить имевшиеся на тот момент представления об интерфейсе пользователя гипертекстовых баз данных.

Первая задача была решена за счет выбора таговой модели описания документа. Такая модель широко применяется в системах подготовки документов для печати. Примером такой системы является хорошо известный язык разметки научных документов TeX, предложенный Американским Математическим Обществом, и программы его интерпретации. 
К моменту создания HTML существовал стандарт языка разметки печатных документов - Standard Generalised Markup Language, который и был взят в качестве основы HTML. Предполагалось, что такое решение поможет использовать существующее программное обеспечение для интерпретации нового языка. Однако, будучи доступен широкому кругу пользователей Internet, HTML зажил своей собственной жизнью. Я думаю, что многие администраторы баз данных WWW и разработчики программного обеспечения для этой системы имеют довольно смутное представление о стандартном языке разметки SGML. В последнее время интерес к SGML стал снова возрастать. Обобщенный язык разметки позволяет создавать документы, которые можно затем использовать для разных целей как то: опубликование в виде обычных текстовых документов, создание архивов документов, и, конечно, опубликование на Internet. 
Вторым важным моментом, повлиявшим на судьбу HTML, стал выбор в качестве элемента гипертекстовой базы данных обычного текстового файла, который хранится средствами файловой системы операционной среды компьютера. Такой выбор был сделан под влиянием следующих факторов:

  • такой файл можно создать в любом текстовом редакторе на любой аппаратной платформе в среде любой операционной системы.
  • к моменту разработки HTML существовал американский стандарт для
  • разработки сетевых информационных систем - Z39.50, в котором в качестве единицы хранения указывался простой текстовый файл в кодировке LATIN1, что соответствует US ASCII.

Таким образом гипертекстовая база данных в концепции WWW - это набор текстовых файлов, написанных на языке HTML, который определяет форму представления информации (разметка) и структуру связей этих файлов (гипертекстовые ссылки). В реальности база данных WWW гораздо более сложная вещь. В ней могут храниться и программы, написанные в соответствии со спецификацией CGI(Common Gateway Interface), и данные обычных баз данных под управлением СУБД, к которым обеспечивается доступ через программы-шлюзы, и Java-applet-ы, и графика и многое другое. Но для простоты изложения HTML можно считать, что база данных WWW - это документы, размеченные HTML. 
Такой подход предполагает наличие еще одной компоненты технологии - интерпретатора языка. В World Wide Web функции интерпретатора разделены между сервером гипертекстовой базы данных и интерфейсом пользователя. 
Сервер кроме доступа к документам и обработки гипертекстовых ссылок осуществляет также препроцессорную обработку документов, в то время как интерфейс пользователя осуществляет интерпретацию конструкций языка, связанных с представлением информации. Инструкции для предварительной подготовки документов сервером записываются в таги комментариев. Различные серверы имеют разные наборы инструкций. Наиболее развитым языком такого описания действий сервера является HTML-Script, который реализован в виде CGI-программы. 
К настоящему времени известна уже третья версия языка - HTML 3.0, которая находится в стадии развития. Если первая версия языка (HTML 1.0) была направлена на представления языка как такового, где описание его возможностей носило скорее рекомендательный характер, вторая версия языка ( HTML 2.0) фиксировала практику использования конструкций языка, версия + ( HTML+) новые возможности, расширяя набор элементов HTML в сторону отображения научной информации и таблиц, а также улучшения стиля компоновки изображений и текста, то третья версия призвана упорядочить все нововведения и согласовать их с существующей практикой. Кроме этого, в третьей версии снова делается попытка формализации интерфейса пользователя гипертекстовой распределенной системы. Кроме того, существуют еще расширения и дополнения перечисленных выше версий языка. Наиболее известны Netscape Extensions и Microsoft Extensions. Широкое распространение Netscape Navigator привело к тому, что версия HTML от Netscape стала на сегодняшний день фактическим стандартом языка.

Принципы  построения и интерпретации HTML

Таговая модель описывает документ как совокупность элементов, каждый из которых окружен тагами. По своему значению таги близки к понятию скобок "begin/end" в универсальных языках программирования, которые задают области действия имен локальных переменных, динамику распределения памяти блока и т.п.. Таги определяют область действия правил интерпретации текстовых элементов документа. В последнее время элементы документа, размеченного при помощи HTML, стало принято называть контейнерами.

Общая схема  построения элемента текста в формате HTML может быть записана в следующем  виде:

"элемент" := <"имя элемента" "список атрибутов">, содержание элемента </"имя элемента">,

Конструкция перед  содержанием элемента называется тагом начала документа, а конструкция, расположенная после содержания элемента, -таг конца элемента. 
Структура гипертекстовой сети задается гипертекстовыми ссылками. Гипертекстовая ссылка - это адрес другого HTML документа, который тематически, логически или каким-либо другим способом связан с документом, в котором ссылка определена. 
Для записи гипертекстовых ссылок в системе WWW была разработана специальная форма, которая называется Universe Resource Locator. Типичным примером использования этой записи можно считать следующую запись:

Этот  текст содержит  
<A HREF="http://polyn.net.kiae.su/altai/index.html">,гипертекстовую ссылку</A>,.

Здесь элемент "A", который в HTML называют якорем (anchor), использует атрибут "HREF", который обозначает гипертекстовую ссылку (Hypertext REFerence), для записи этой ссылки в форме URL. Данная ссылка указывает на документ с именем "index.html" в директории "altai" на сервере "polyn.net.kiae.su", доступ к которому осуществляется по протоколу "http". 
Гипертекстовые ссылки в HTML делятся на два класса: контекстные ссылки и общие. Контекстные ссылки вмонтированы в тело документа, как это было продемонстрировано в предыдущем примере, в то время как общие ссылки связаны со всем документом в целом и могут быть использованы при просмотре любого фрагмента документа. Оба класса ссылок присутствуют в стандарте языка с самого его рождения, однако, первоначально наибольшей популярностью пользовались контекстные ссылки. Эта популярность привела к тому, что механизм использования общих ссылок практически полностью "атрофировался". Однако по мере стандартизации интерфейса пользователя и стилей представления информации, разработчики языка снова вернулись к общим ссылкам и стремятся приспособить их к задачам управления этим интерфейсом. 
Структура HTML документа позволяет использовать вложенные друг в друга элементы. Собственно, сам документ - это один большой элемент с именем "HTML":

<HTML>, Содержание документа  </HTML>,

Сам элемент HTML или гипертекстовый документ состоит  из двух частей: заголовка документа (HEAD) и тела документа (BODY):

<HTML>, 
<HEAD>, 
Содержание заголовка 
</HEAD>, 
<BODY>, 
Содержание тела документа 
</BODY>, 
</HTML>,

Теоретически  обсуждать язык разметки всегда очень  трудно, поэтому приведем просто пример документа на HTML и обсудим на нем  особенности языка:

<HTML>, 
<HEAD>, 
<TITLE>,Это пример документа на языке HTML.</TITLE>, 
<BASE HREF="http://144.206.192.4/html30/">, 
<!-- Author: Pavel Khramtsov -->, 
<!-- Date: 09.08.95 -->, 
</HEAD>, 
<BODY BACKGROUND="back.gif">, 
............ тело документа ............. 
</BODY>, 
</HTML>,

Все что расположено  между <HTML>, и </HTML>, - это документ. Содержание элемента HEAD определяет заголовок  документа, который состоит из двух элементов: TITLE и BASE. Вслед за заголовком начинается тело документа, которое  содержит в своих первых строках  некоторую вводную информацию и  содержание документа, оформленное  в виде списка.  
Каждый документ в системе World Wide Web имеет свое имя, которое указывается в элементе TITLE заголовка документа. Его мы видим в первой строке интерфейса. Вслед за TITLE в заголовке указан элемент BASE. Этот элемент не отображается, однако содержание его атрибута используется при формировании гипертекстовых ссылок. За заглавием следует тело документа, заключенное в таги <BODY>,.....</BODY>,. Приведем простой пример тела документа.

<BODY>, 
<H1>,Простой пример HTML документа.</H1>, 
<HR>, 
Данный пример показывает простейшие способы представления информации на языке HTML: 
<UL>, <LI>, <A HREF="#first">,Разбиение текста на параграфы</A>, 
<LI>, <A HREF="#second">,Выделение заголовков</A>, 
<LI>, <A HREF="#list">,Создание списка</A>, 
<LI>, <A HREF="#graph">,Встроенную графику</A>, 
</UL>, 
Каждая из позиций приведенного выше списка является гипертекстовой ссылкой на раздел данного примера. 
............ 
</BODY>,

Первым Элементом  тела документа является его название, которое задано заглавием первого  уровня - H1. Обычно, для отображения  таких заглавий используют самый  крупный шрифт. Вслед за заглавием  идет список примеров, который оформлен как ненумерованный список UL. Выделение  элементов списка синим цветом показывает, что это гипертекстовые ссылки. которые записаны в виде тагов вида: 
<A HREF="#list">,Создание списка</A>, 
Решетка перед словом "list" означает, что это ссылка на метку внутри документа, которая определена как:

<A NAME="list">,

При выборе гипертекстовой ссылки происходит переход на указанную  в ссылке метку. 
Начало нового параграфа определяется тагом <P>,. Таг конца параграфа не требуется, т.к. при вводе тага <P>, старый параграф кончается, а новый начинается. Конец параграфа определяется и рядом других тагов. Параграф заканчивается, если начинается список например. Выделение заглавий осуществляется тагами заглавий разного уровня. В данном примере все разделы документа выделены как заглавия второго уровня:

<H2>,Выделение  заголовков</H2>,

Следует обратить внимание еще на два тага: <HR>, и <BR>,. Первый вызывает подведение сплошной черты под текстом на всю ширину рабочей области интерфейса, а второй вызывает принудительный перевод строки. В принципе, программа интерфейса пользователя автоматически вписывает текст в окно рабочей области интерфейса, поэтому все концы строк в исходных файлах игнорируются. Но часто бывает полезно перевести строку по месту. для этой цели и используется таг <BR>,. 
Нумерованный список начинается с тага <OL>, и заканчивается тагом </OL>,. От ненумерованного он отличается тем, что перед каждым элементом списка проставляется номер по порядку. В языке существует еще несколько видов списков. 
Встроенный графический образ монтируется в текст при помощи тага <IMG ...>,. Программа интерпретации языка сначала запрашивает собственно текст документа у сервера гипертекстовой базы данных, а за тем по мере просмотра графические образы, которые должны быть подготовлены в форматах GIF или JPEG. Первый формат более предпочтителен. 
В HTML 3.0 для отображения графики, обтекаемой текстом стал применяться другой элемент - FIG. Его преимущество перед IMG заключается в том, что он разрешает обтекание картинки текстом и создание в тексте документа на базе графического образа стека графических ссылок. Следует заметить, что Netscape Extensions для обтекания графики текстом применяется контейнер IMG с атрибутом align, которому можно присвоить значения right или left. Графика в этом случае будет придвинута к соответствующему краю страницы, и текст ее будет обтекать также как и в случае контейнера FIG. 
Однако, HTML позволяет не только отображать информацию и управлять навигацией по гипертекстовым базам данных, но создавать интерфейсы пользователя для доступа к другим программам. Для этой цели в языке предусмотрен механизм форм. Форма - это набор полей документа, в который пользователь может вводить информацию и затем передавать ее через сервер WWW удаленной программе. Для описания формы в языке зарезервированы конструкции типа:

Информация о работе Язык гипертекстовой разметки HTML и протокол обмена гипертекстовой информацией HTTP