Internet - глобальная компьютерная сеть, охватывающая весь мир. Сегодня Internet
имеет около 15 миллионов абонентов в более чем 150странах мира. Ежемесячно
размер сети увеличивается на 7-10%. Internet образует как бы ядро,
обеспечивающее связь различных информационных сетей, принадлежащихразличным
учреждениям во всем мире, одна с другой.
Если ранее сеть использовалась исключительно в качестве среды передачи файлов и
сообщений электронной почты, то сегоднярешаются более сложные задачи
распределеного доступа к ресурсам. Около двух лет назад были созданы оболочки,
поддерживающие функции сетевого поиска и доступа краспределенным информационным
ресурсам, электронным архивам.
Internet, служившая когда-то исключительно исследовательским и учебным группам,
чьи интересы простирались вплоть додоступа к суперкомпьютерам, становится все
более популярной в деловом мире.
Компании соблазняют быстрота, дешевая глобальная связь, удобство для проведения
совместных работ, доступные программы,уникальная база данных сети Internet. Они
рассматривают глобальную сеть как дополнение к своим собственным локальнойсетям.
Фактически Internet состоит из множества локальных и глобальных сетей,
принадлежащихразличным компаниям и предприятиям, связанных между собой
различными линиями связи. Internet можно представить себе в виде мозаики
сложенной из небольшихсетей разной величины, которые активно взаимодействуют
одна с другой, пересылая файлы, сообщения и т.п.
При низкой стоимости услуг (часто это только фиксированная ежемесячная плата за
используемые линии или телефон) пользователимогут получить доступ к коммерческим
и некоммерческим информационным службам США, Канады, Австралии и многих
европейских стран. В архивах свободного доступасети Internet можно найти
информацию практически по всем сферам человеческой деятельности, начиная с новых
научных открытий до прогноза погоды на завтра.
Кроме того Internet предоставляет уникальные возможности дешевой, надежной и
конфиденциальной глобальной связи по всемумиру. Это оказывается очень удобным
для фирм имеющих свои филиалы по всему миру, транснациональных корпораций и
структур управления. Обычно, использованиеинфраструктуры Internet для
международной связи обходится значительно дешевле прямой компьютерной связи
через спутниковый канал или через телефон.
Электронная почта - самая распространенная услуга сети Internet. В настоящее
время свой адрес по электронной почте имеютприблизительно 20 миллионов человек.
Посылка письма по электронной почте обходится значительно дешевле посылки
обычного письма. Кроме того сообщение,посланное по электронной почте дойдет до
адресата за несколько часов, в то время как обычное письмо может добираться до
адресата несколько дней, а то инедель.
В настоящее время Internet испытывает период подъема, во многом благодаря
активной поддержке со стороны правительств европейскихстран и США. Ежегодно в
США выделяется около 1-2 миллионов долларов на создание новой сетевой
инфраструктуры. Исследования в области сетевых коммуникацийфинансируются также
правительствами Великобритании, Швеции, Финляндии, Германии.
Однако, государственное финансирование - лишь небольшая часть поступающих
средств, т.к. все более заметной становится"коммерцизация" сети (80-90% средств
поступает из частного сектора).
ГЛАВА 1
Общая характеристика сети Internet
1.1 История сети Internet
В 1961 году Defence Advanced Research Agensy (DARPA) по заданию министерства
обороны СШАприступило к проекту по созданию экспериментальной сети передачи
пакетов. Эта сеть, названная ARPANET, предназначалась первоначально для изучения
методовобеспечения надежной связи между компьютерами различных типов. Многие
методы передачи данных через модемы были разработаны в ARPANET. Тогда же
былиразработаны и протоколы передачи данных в сети - TCP/IP. TCP/IP - это
множество коммуникационных протоколов, которые определяют, как компьютеры
различных типовмогут общаться между собой.
Эксперимент с ARPANET был настолько успешен, что многие организации захотели
войти в нее, с целью использования для ежедневнойпередачи данных. И в 1975 году
ARPANET превратилась из экспериментальной сети в рабочую сеть. Ответственность
за администрирование сети взяло на себя DefenceCommunication Agency (DCA), в
настоящее время называемое Defence Information Systems Agency (DISA). Но
развитие ARPANET на этом не остановилось; ПротоколыTCP/IP продолжали развиваться
и совершенствоваться.
В 1983 году вышел первый стандарт для протоколов TCP/IP, вошедший в Military
Standarts (MIL STD), т.е. в военные стандарты, ивсе, кто работал в сети, обязаны
были перейти к этим новым протоколам. Для облегчения этого перехода DARPA
обратилась с предложением к руководителям фирмыBerkley Software Design -
внедрить протоколы TCP/IP в Berkeley(BSD) UNIX. С этого и начался союз UNIX и
TCP/IP.
Спустя некоторое время TCP/IP был адаптирован в обычный, то есть в общедоступный
стандарт, и термин Internet вошел во всеобщееупотребление. В 1983 году из
ARPANET выделилась MILNET, которая стала относиться к Defence Data Network
(DDN)министерства обороны США. Термин Internet стал использоваться для
обозначения единой сети: MILNET плюс ARPANET. И хотя в 1991 году ARPANET
прекратила своесуществование, сеть Internet существует, ее размеры намного
превышают первоначальные, так как она объединила множество сетей во всем мире.
Диаграмма1.1 иллюстрирует рост числа хостов, подключенных к сети Internet с 4
компьютеров в 1969 году до 8,3 миллионов в 1994. Хостом в сети
Internetназываются компьютеры, работающие в многозадачной операционной системе
(Unix, VMS), поддерживающие протоколыTCPIP и предоставляющие пользователям
какие-либо сетевые услуги.
Диаграмма 1.1
Диаграмма 1.1 Количество хостов, подключенных к Internet .
Протоколы сети Internet
Основное, что отличает Internet от других сетей - это ее протоколы - TCP/IP.
Вообще, термин TCP/IP обычно означает все, что связано спротоколами
взаимодействия между компьютерами в Internet. Он охватывает целое семейство
протоколов, прикладные программы, и даже саму сеть. TCP/IP - этотехнология
межсетевого взаимодействия, технология internet. Сеть, которая использует
технологию internet, называется "internet". Если речь идето глобальной сети,
объединяющей множество сетей с технологией internet, то ее называют Internet.
Свое название протокол TCP/IP получил от двух коммуникационных протоколов (или
протоколов связи). Это Transmission ControlProtocol (TCP) и Internet Protocol
(IP). Несмотря на то, что в сети Internet используется большое число других
протоколов, сеть Internet часто называютTCP/IP-сетью, так как эти два протокола,
безусловно, являются важнейшими.
Как и во всякой другой сети в Internet существует 7 уровней взаимодействия между
компьютерами: физический, логический, сетевой, транспортный, уровеньсеансов
связи, представительский и прикладной уровень. Соответственно каждому уровню
взаимодействия соответствует набор протоколов (т.е. правилвзаимодействия).
Протоколы физического уровня определяют вид и характеристики линий связи между
компьютерами. В Internet используютсяпрактически все известные в настоящее время
способы связи от простого провода (витая пара) до волоконно-оптических линий
связи (ВОЛС).
Для каждого типа линий связи разработан соответствующий протокол логического
уровня, занимающийся управлением передачейинформации по каналу. К протоколам
логического уровня для телефонных линий относятся протоколы SLIP (Serial Line
Interface Protocol) и PPP (Point to PointProtocol). Для связи по кабелю
локальной сети - это пакетные драйверы плат ЛВС.
Протоколы сетевого уровня отвечают за передачу данных между устройствами в
разных сетях, то есть занимаются маршрутизацией пакетов всети. К протоколам
сетевого уровня принадлежат IP (Internet Protocol) и ARP (Address Resolution
Protocol).
Протоколы транспортного уровня управляют передачей данных из одной программы в
другую. К протоколам транспортного уровняпринадлежат TCP (Transmission Control
Protocol) и UDP (User Datagram Protocol).
Протоколы уровня сеансов связи отвечают за установку, поддержание и уничтожение
соответствующих каналов. В Internet этим занимаютсяуже упомянутые TCP и UDP
протоколы, а также протокол UUCP (Unix to Unix Copy Protocol).
Протоколы представительского уровня занимаются обслуживанием прикладных
программ. К программам представительского уровняпринадлежат программы,
запускаемые, к примеру, на Unix-сервере, для предоставления различных услуг
абонентам. К таким программам относятся:telnet-сервер, FTP-сервер,
Gopher-сервер, NFS-сервер, NNTP (Net News Transfer Protocol), SMTP (Simple Mail
Transfer Protocol), POP2 и POP3 (Post OfficeProtocol) и т.д.
К протоколам прикладного уровня относятся сетевые услуги и программы их
предоставления.
1.2 Услуги предоставляемые сетью
Все услуги предоставляемые сетью Internet можно условно поделить на две
категории: обмен информацией между абонентами сети ииспользование баз данных
сети.
К числу услуг связи между абонентами принадлежат.
Telnet - удаленный доступ. Дает возможность абоненту работать на любой ЭВМ сети
Internetкак на своей собственной. То есть запускать программы, менять режим
работы и т.д.
FTP (File Transfer Protocol) - протокол передачи файлов. Дает возможность
абонентуобмениваться двоичными и текстовыми файлами с любым компьютером сети.
Установив связь с удаленным компьютером, пользователь может скопировать файл с
удаленногокомпьютера на свой или скопировать файл со своего компьютера на
удаленный.
NFS (Network File System) - распределенная файловая система. Дает возможность
абонентупользоваться файловой системой удаленного компьютера, как своей
собственной.
Электронная почта - обмен почтовыми сообщениями с любым абонентом сети
Internet.Существует возможность отправки как текстовых, так и двоичных файлов.
На размер почтового сообщения в сети Internet накладывается следующее
ограничение - размерпочтового сообщения не должен превышать 64 килобайт.
Новости - получение сетевых новостей и электронных досок объявлений сети и
возможностьпомещения информации на доски объявлений сети. Электронные доски
объявлений сети Internet формируются по тематике. Пользователь может по своему
выборуподписаться на любые группы новостей.
Rsh (Remote Shell) - удаленный доступ. Аналог Telnet, но работает только в том
случае, еслина удаленном компьютере стоит ОС UNIX.
Rexec (Remote Execution) - выполнение одной команды на удаленной UNIX-машине.
Lpr - сетевая печать. Отправка файла на печать на удаленном (сетевом) принтере.
Lpq - сетевая печать. Показывает файлы стоящие в очереди на печать на
сетевомпринтере.
Ping - проверка доступности удаленной ЭВМ по сети.
Talk - дает возможность открытия "разговора" с пользователем удаленной ЭВМ.
Приэтом на экране одновременно виден вводимый текст и ответ удаленного
пользователя.
Iptunnel - дает возможность доступа к серверу ЛВС NetWare с которым нет
непосредственнойсвязи по ЛВС, а имеется лишь связь по сети Internet.
Whois - адресная книга сети Internet. По запросу абонент может получить
информацию опринадлежности удаленного компьютера, о пользователях.
Finger - получение информации о пользователях удаленного компьютера.
Кроме вышеперечисленных услуг, сеть Internet предоставляет также следующие
специфические услуги.
Webster - сетевая версия толкового словаря английского языка.
Факс-сервис - дает возможность пользователю отправлять сообщения по факсимильной
связи,пользуясь факс-сервером сети.
Электронный переводчик - производит перевод присланного на него текста содного
языка на другой. Обращение к электронным переводчикам происходит посредством
электронной почты.
Шлюзы - дают возможность абоненту отправлять сообщения в сети, не работающие с
протоколамиTCPIP (FidoNet, Goldnet, AT50).
К системам автоматизированного поиска информации в сети Internet принадлежат
следующие системы.
Gopher - наиболее широко распространенное средство поиска информации в сети
Internet, позволяющее находить информацию поключевым словам и фразам. Работа с
системой Gopher напоминает просмотр оглавления, при этом
пользователюпредлагается пройти сквозь ряд вложенных меню и выбрать нужную тему.
В Internet в настоящее время свыше 2000 Gopher-систем,часть из которых является
узкоспециализированной, а часть содержит более разностороннюю информацию.
Gopher позволяет получить информацию без указания имен и адресов авторов,
благодаря чему пользователь не тратит много времени инервов. Он просто сообщит
системе Gopher, что именно ему нужно, и система находит соответствующие данные.
Gopher-серверов свыше двух тысяч, поэтому с ихпомощью не всегда просто найти
требуемую информацию. В случае возникших затруднений можно воспользоваться
службой VERONICA. VERONICA осуществляет поискболее чем в 500 системах Gopher,
освобождая пользователя от необходимости просматривать их вручную.
WAIS - еще более мощное средство получения информации, чем Gopher, поскольку
оноосуществляет поиск ключевых слов во всех текстах документов. Запросы
посылаются в WAIS на упрощенном английском языке. Это значительно легче, чем
формулироватьих на языке алгебры логики, и это делает WAIS более привлекательной
для пользователей-непрофессионалов.
При работе с WAIS пользователям не нужно тратить много времени, чтобы найти
необходимые им материалы.
В сети Internet существует более 200 WAIS - библиотек. Но поскольку информация
представляется преимущественно сотрудникамиакадемических организаций на
добровольных началах, большая часть материалов относится к области исследований
и компьютерных наук.
WWW - система для работы с гипертекстом. Потенциально она является наиболее
мощнымсредством поиска. Гипертекст соединяет различные документы на основе
заранее заданного набора слов. Например, когда в тексте встречается новое слово
илипонятие, система, работающая с гипертекстом, дает возможность перейти к
другому документу, в котором это слово или понятие рассматривается более
подробно.
WWW часто используется в качестве интерфейса к базам данных WAIS, но отсутствие
гипертекстовых связей ограничивает возможности WWWдо простого просмотра.
Пользователь со своей стороны может задействовать возможность WWW работать с
гипертекстом для связи между своими данными иданными WAIS и WWW таким образом ,
чтобы собственные записи пользователя как бы интегрировались в информацию для
общего доступа. На самом деле этого, конечно, не происходит, новоспринимается
именно так.
WWW - этоотносительно новая система. Установлены несколько демонстрационных
серверов, в том числе Vatican Exibit в библиотекеКонгресса США и мультфильм о
погоде "Витки спутника" в Мичиганском государственном университете. В качестве
демонстрационных также работаютсерверы into.funet.fi (Финляндия); into.cern.ch.
(Швейцария) и eies2.njit.edu (США).
Практически все услуги сети построены на принципе клиент-сервер. Сервером в сети
Internet называется компьютер способный предоставлять клиентам (по мере прихода
от них запросов) некоторые сетевыеуслуги. Взаимодействие клиент-сервер строится
обычно следующим образом. По приходу запросов от клиентов сервер запускает
различные программыпредоставления сетевых услуг. По мере выполнения запущенных
программ сервер отвечает на запросы клиентов.
Все программное обеспечение сети также можно поделить на клиентское и серверное.
При этом программное обеспечение сервера занимаетсяпредоставлением сетевых
услуг, а клиентское программное обеспечение обеспечивает передачу
запросовсерверу и получение ответов от него.
1.3 Гипертекстовая технология WWW, URL, HTML
World Wide Web переводится на русский язык как “Всемирная Паутина”. И, в
сущности, это действительно так. WWW является однимиз самых совершенных
инструментов для работы в глобальной мировой сети Internet. Эта служба появилась
сравнительно недавно и все еще продолжает бурноразвиваться.
Наибольшее количество разработок имеют отношение к родине WWW - CERN, European
ParticlePhysics Laboratory; но было бы ошибкой считать, что Web является
инструментом, разработанным физиками и для физиков. Плодотворность и
привлекательность идей,положенных в основу проекта, превратили WWW в систему
мирового масштаба, предоставляющую информацию едва ли не во всех областях
человеческойдеятельности и охватывающую примерно 30 млн. пользователей в 83
странах мира.
Главное отличие WWW от остальных инструментов для работы с Internet
заключается в том, что WWWпозволяет работать практически со всеми доступными
сейчас на компьютере видами документов: это могут быть текстовые файлы,
иллюстрации, звуковые и видеоролики, и т.д.
Что такое WWW? Это попытка организовать всю информацию в Internet, плюс любую
локальнуюинформацию по вашему выбору, как набор гипертекстовых документов. Вы
перемещаетесь по сети, переходя от одного документа к другому по ссылкам. Всеэти
документы написаны на специально разработанном для этого языке, который
называется HyperText Markup Language (HTML). Он чем-то напоминает
язык,использующийся для написания текстовых документов, только HTML проще.
Причем, можно использовать не только информацию, предоставляемую Internet, но
исоздавать собственные документы. В последнем случае существует ряд практических
рекомендаций к их написанию.
Вся польза гипертекста состоит в создании гипертекстовых документов,если вас
заинтересовалкакой либо пункт в таком документе, то вам достаточно ткнуть туда
курсором для получения нужной информации. Также в одном документе возможно
делать ссылки надругие, написанные другими авторами или даже расположенные на
другом сервере. В то время как вам это представляется как одно целое.
Гипермедиа это надмножество гипертекста. В гипермедиа производятся операции не
только надтекстом но и над звуком, изображениями, анимацией.
Существуют WWW-серверы для Unix, Macintosh, MS Windows и VMS, большинство из
нихраспространяются свободно. Установив WWW-сервер, вы можете решить две задачи:
1. Предоставить информацию внешним потребителям - сведения о вашей фирме,
каталоги продуктов и услуг, техническую или научную информацию.
2. Предоставить своим сотрудникам удобный доступ к внутренним
информационным ресурсам организации.Это могут быть последние
распоряжения руководства, внутренний телефонный справочник, ответына
часто задаваемые вопросы дляпользователей прикладных систем , техническая
документация и все, что подскажет фантазия администратора и
пользователей.Информация, которую вы хотите предоставить пользователям WWW,
оформляется в виде файлов наязыке HTML. HTML - простой язык
разметки, который позволяет помечать фрагменты текста изадавать
ссылки на другие документы, выделять заголовки нескольких
уровней, разбивать текст на абзацы, центрироватьих и т. п.,
превращая простой текст в отформатированный гипермедийный документ.
Достаточно легко создать html-файлвручную, однако, имеются
специализированные редакторы и преобразователи файлов из других
форматов.
Для просмотра документов используются специальные просмоторщики, такие как
Mosaic, Netscape,Internet Explorer, lynx, www и другие. Mosaic и Netscape удобно
использовать на графических терминалах. Для работы на символьных терминалах
можнопорекомендовать lynx.
Архитектура WWW-технологии
От описания основных компонентов перейдем к архитектуре взаимодействия
программного обеспечения в системе WorldWide Web. WWW построена по хорошо
известной схеме “клиент-сервер”. На схеме 1.2 показано, какразделены функции в
этой схеме. Программа-клиент выполняет функции интерфейса пользователя и
обеспечивает доступ практически ко всем информационным ресурсам Internet. В
этом смысле она выходитза обычные рамки работы клиента только с сервером
определенного протокола, как это происходит в telnet, например. Отчасти,
довольно широкораспространенное мнение, что Mosaic или Netscape, которые
являются WWW-клиентами, это просто графический интерфейс в Internet, является
отчасти верным.Однако, как уже было отмечено, базовые компоненты WWW-технологии
(HTML и URL) играют при доступе к другим ресурсам Mosaic не последнюю роль, и
поэтому мультипротокольные клиенты должны бытьотнесены именно к World Wide Web,
а не к другим информационным технологиям Internet. Фактически, клиент—это
интерпретатор HTML. И как типичныйинтерпретатор, клиент в зависимости от команд
(разметки) выполняет различные функции.
Схема 1.2
Схема 1.2 Структура ”клиент - сервер” .
В круг этих функций входит не только размещение текста на экране, но обмен
информацией ссервером по мере анализа полученного HTML-текста, что наиболее
наглядно происходит при отображении встроенных в текст графических образов.
Прианализе URL-спецификации или по командам сервера клиент запускает
дополнительные внешние программы для работы с документами в форматах,
отличныхот HTML, например GIF, JPEG, MPEG, Postscript и т. п. Вообще говоря для
запуска клиентом программ независимо от типа документа была
разработанапрограмма Luncher, но в последнее время гораздо большее
распространение получил механизм согласования запускаемых программ через
MIME-типы. Другуючасть программного комплекса WWW составляет сервер протокола
HTTP, базы данных документов в формате HTML,управляемые сервером, и программное
обеспечение, разработанное в стандарте спецификации CGI. До самого последнего
времени (до образованияNetscape) реально использовалось два HTTP-сервера:
сервер CERN и сервер NCSA. Но в настоящее время число базовых серверов
расширилось. Появился оченьнеплохой сервер для MS-Windows и Apachie-сервер для
Unix-платформ. Существуют и другие, но два последних можно выделить из
соображений доступностииспользования. Сервер для Windows - это shareware, но
без встроенного самоликвидатора, как в Netscape. Учитывая распространенность
персоналок внашей стране, такое программное обеспечение дает возможность
попробовать, что такое WWW. Второй сервер -это ответ на угрозу коммерциализации.
Netscape уже не распространяет свой сервер Netsite свободно и прошел слух,
чтоNCSA-сервер также будет распространяться на коммерческой основе. В
результате был разработан Apachie, который по словам его авторов будетfreeware,
и реализует новые дополнения к протоколу HTTP, связанные с защитой от
несанкционированного доступа, которые предложены группой поразработке этого
протокола и реализуются практически во всех коммерческих серверах.
База данных HTML-документов—это часть файловой системы, которая содержит
текстовые файлы в формате HTML и связанные сними графику и другие ресурсы.
Особое внимание хотелось бы обратить на документы, содержащие элементы экранных
форм. Эти документы реальнообеспечивают доступ к внешнему программному
обеспечению.
Прикладное программное обеспечение, работающее с сервером, можно разделить на
программы-шлюзы и прочие. Шлюзы—этопрограммы, обеспечивающие взаимодействие
сервера с серверами других протоколов, например ftp, илис распределенными на
сети серверами Oracle. Прочие программы—это программы, принимающие данные от
сервера и выполняющие какие-либо действия: получение текущей даты,
реализациюграфических ссылок, доступ к локальным базам данных или просто
расчеты.
Завершая обсуждение архитектуры World Wide Web хотелось бы еще раз
подчеркнуть, что ее компоненты существуютпрактически для всех типов
компьютерных платформ и свободно доступны в сети. Любой, кто имеет доступ в
Internet, может создать свой WWW-сервер,или, по крайней мере, посмотреть
информацию с других серверов.
Основные компоненты технологии World Wide Web
К 1989 году гипертекст представлял новую, многообещающую технологию, которая
имела относительно большое числореализаций с одной стороны, а с другой стороны
делались попытки построить формальные модели гипертекстовых систем, которые
носили скорее описательныйхарактер и были навеяны успехом реляционного подхода
описания данных. Идея Т. Бернерс-Ли заключаласьвтом, чтобы применить
гипертекстовую модель к информационным ресурсам, распределенным в сети, и
сделать это максимально простым способом.Он заложил три краеугольных камня
системы из четырех существующих ныне, разработав:
язык гипертекстовой разметки документов HTML (HyperText Markup Lan-guage);
• универсальный способ адресации ресурсов в сети URL (Universal Resource
Locator);
• протокол обмена гипертекстовой информацией HTTP (HyperText Transfer
Protocol).
Позже команда NCSA добавила к этим трем компонентам четвертый:
• универсальный интерфейс шлюзов CGI (Common Gateway Interface).
Идея HTML—пример чрезвычайно удачного решения проблемы построения
гипертекстовой системы припомощи специального средства управления отображением.
На разработку языка гипертекстовой разметкисущественное влияние оказали два
фактора: исследования в области интерфейсов гипертекстовых систем и желание
обеспечить простой и быстрый способ создания гипертекстовой базы
данных,распределенной на сети.
В 1989 году активно обсуждалась проблема интерфейса гипертекстовых систем,
т.е. способов отображения гипертекстовойинформации и навигации в гипертекстовой
сети. Значение гипертекстовой технологии сравнивали со значением
книгопечатания. Утверждалось, чтолист бумаги и компьютерные средства
отображения/воспроизведения серьезно отличаются друг от друга, и поэтому форма
представления информации тожедолжна отличаться. Наиболее эффективной формой
организации гипертекста были признаны контекстные гипертекстовые ссылки, а
кроме того былопризнано деление на ссылки, ассоциированные со всем документом в
целом и отдельными его частями.
Самым простым способом создания любого документа является его набивка в
текстовом редакторе. Опыт создания хорошоразмеченных для последующего
отображения документов в CERN_е был - трудно найти физика, которыйне
пользовался бы системой TeX или LaTeX. Кроме того к тому времени существовал
стандарт языка разметки—Standard Generalised Markup Language (SGML).
Следует также принять во внимание, что согласно своим предложениям Бернерс-Ли
предполагал объединить в единую систему имеющиесяинформационные ресурсы CERN, и
первыми демонстрационными системами должны были стать системы для NeXT и
VAX/VMS.
Обычно гипертекстовые системы имеют специальные программные средства
построения гипертекстовых связей. Самигипертекстовые ссылки хранятся в
специальных форматах или даже составляют специальные файлы. Такойподход хорош
для локальной системы, но не для распределенной на множестве различных
компьютерных платформ. В HTML гипертекстовые ссылки встроеныв тело документа и
хранятся как его часть. Часто в системах применяют специальные форматы хранения
данных для повышения эффективности доступа.В WWW документы—это обычные ASCII-
файлы, которые можно подготовить в любом текстовом редакторе. Таким образом,
проблема созданиягипертекстовой базы данных была решена чрезвычайно просто.
В качестве базы для разработки языка гипертекстовой разметки был выбран SGML
(Standard Generalised Markup Language).Следуя академическим традициям,
Бернерс-Ли описал HTML в терминах SGML (как описывают язык программирования в
терминах формыБекуса-Наура). Естественно, что в HTML были реализованы все
разметки, связанные с выделением параграфов,шрифтов, стилей и т. п., т.к.
реализация для NeXT подразумевала графический интерфейс. Важным компонентом
языка стало описание встроенных и ассоциированных гипертекстовых
ссылок,встроенной графики и обеспечение возможности поиска по ключевым словам.
С момента разработки первой версии языка (HTML 1.0) прошло уже пять лет. За
это время произошло довольно серьезноеразвитие языка. Почти вдвое увеличилось
число элементов разметки, оформление документов все больше приближается к
оформлению качественныхпечатных изданий, развиваются средства описания не
текстовых информационных ресурсов и способы взаимодействия с прикладным
программнымобеспечением. Совершенствуется механизм разработки типовых стилей.
Фактически, в настоящее время HTML развивается в сторону создания
стандартногоязыка разработки интерфейсов как локальных, так и распределенных
систем.
Вторым краеугольным камнем WWW стала универсальная форма адресации
информационных ресурсов. Universal ResourceIdentification (URI) представляет
собой довольно стройную систему, учитывающую опыт адресации и идентификации
e-mail, Gopher, WAIS, telnet,ftp и т. п. Но реально из всего, что описано в
URI, для организации баз данных в WWW требуется только Universal Resource
Locator (URL). Безналичия этой спецификации вся мощь HTML оказалась бы
бесполезной. URL используется в гипертекстовых ссылках и обеспечивает доступ к
распределеннымресурсам сети. В URL можно адресовать как другие гипертекстовые
документы формата HTML, так и ресурсыe-mail, telnet, ftp, Gopher, WAIS,
например. Различные интерфейсные программы по разному осуществляют доступ к
этим ресурсам. Одни, как напримерNetscape, сами способны поддерживать
взаимодействие по протоколам, отличным от протокола HTTP, базового для WWW,
другие, как например Chimera,вызывают для этой цели внешние программы. Однако,
даже в первом случае, базовой формой представления отображаемой информации
является HTML, ассылки на другие ресурсы имеют форму URL. Следует отметить, что
программы обработки электронной почты в формате MIME также имеют возможность
отображать документы, представленные в формате HTML. Дляэтой цели в MIME
зарезервирован тип “text/html”.
Третьим в нашем списке стоит протокол обмена данными в World Wide Web
-HyperText TransferProtocol. Данный протокол предназначен для обмена
гипертекстовыми документами и учитывает специфику такого обмена. Так в
процессе взаимодействия, клиент может получить новый адрес ресурса на сети
(relocation), запросить встроенную графику, принять и передать параметры и
т. п. Управление в HTTP реализовано в виде ASCII-команд. Реально
разработчик гипертекстовой базы данных сталкивается с элементами протокола
только при использовании внешних расчетных программ или при доступе к
внешним относительно WWW информационным ресурсам, например базам данных.
Последняя составляющая технологии WWW - это уже плод работы группы NCSA --
спецификация Common Gateway Interface. CGIбыла специально разработана для
расширения возможностей WWW за счет подключения всевозможноговнешнего
программного обеспечения. Такой подход логично продолжал принцип публичности и
простоты разработки и наращивания возможностей WWW.Если команда CERN предложила
простой и быстрый способ разработки баз данных, то NCSA развила этот принцип на
разработку программных средств. Надозаметить, что в общедоступной библиотеке
CERN были модули, позволяющие программистам подключать свои программы к серверу
HTTP, ноэто требовало использования этой библиотеки. Предложенный и описанный в
CGI способ подключения не требовал дополнительных библиотек и
буквальноошеломлял своей простотой. Сервер взаимодействовал с программами через
стандартные потоки ввода/вывода, что упрощает программированиедо предела. При
реализации CGI чрезвычайно важное место заняли методы доступа, описанные в
HTTP. Ихотя реально используются только два из них (GET и POST), опыт развития
HTML показывает, что сообщество WWW ждет развития и CGI по мереусложнения
задач, в которых будет использоваться WWW-технология.
ГЛАВА 2
Защита информации в глобальной сети Internet
2.1 Проблемы защиты информации
Internet и информационная безопасность несовместны по самой природе Internet.
Она родиласькак чисто корпоративная сеть, однако, в настоящее время с помощью
единого стекапротоколов TCP/IP и единого адресного пространства объединяет не
толькокорпоративные и ведомственные сети (образовательные, государственные,
коммерческие, военные и т.д.), являющиеся, по определению, сетями сограниченным
доступом, но и рядовых пользователей, которые имеют возможность получить прямой
доступ в Internet со своих домашних компьютеров с помощьюмодемов и телефонной
сети общего пользования.
Как известно, чем проще доступ в Сеть, тем хуже ее информационная
безопасность, поэтому сполным основанием можно сказать, что изначальная простота
доступа в Internet - хуже воровства, так как пользователь может даже и не
узнать, что у него былископированы - файлы и программы, не говоря уже о
возможности их порчи и корректировки.
Что же определяет бурный рост Internet, характеризующийся ежегодным удвоением
числапользователей? Ответ прост -“халява”, то есть дешевизна программного
обеспечения (TCP/IP), которое в настоящее время включено в Windows 95, легкостьи
дешевизна доступа в Internet (либо с помощью IP-адреса, либо с помощью
провайдера) и ко всем мировым информационным ресурсам.
Платой за пользование Internet является всеобщее снижение информационной
безопасности,поэтому для предотвращения несанкционированного доступа к своим
компьютерам все корпоративные и ведомственные сети, а также предприятия,
использующиетехнологию intranet, ставят фильтры (fire-wall) между внутренней
сетью и Internet, что фактически означает выход из единого адресного
пространства. Ещебольшую безопасность даст отход от протокола TCP/IP и доступ в
Internet через шлюзы.
Этот переход можно осуществлять одновременно с процессом построения всемирной
информационнойсети общего пользования, на базе использования сетевых
компьютеров, которые с помощью сетевой карты 10Base-T и кабельного модема
обеспечиваютвысокоскоростной доступ (10 Мбит/с) к локальному Web-серверу через
сеть кабельного телевидения.
Для решения этих и других вопросов при переходе к новой архитектуре
Internet нужно предусмотреть следующее:
Во-первых, ликвидировать физическую связь между будущей Internet (которая
превратится воВсемирную информационную сеть общего пользования) и корпоративными
и ведомственными сетями, сохранив между ними лишь информационную связь
черезсистему World Wide Web.
Во-вторых, заменить маршрутизаторы на коммутаторы, исключив обработку в узлах
IP-протоколаи заменив его на режим трансляции кадров Ethernet, при котором
процесс коммутации сводится к простой операции сравнения MAC-адресов.
В-третьих, перейти в новое единое адресное пространство на базе физических
адресов доступак среде передачи (MAC-уровень), привязанное к географическому
расположению сети, и позволяющее в рамках 48-бит создать адреса для более чем 64
триллионовнезависимых узлов.
Безопасность данных является одной из главных проблем в Internet. Появляются
все новые и новые страшные истории о том, каккомпьютерные взломщики,
использующие все более изощренные приемы, проникают в чужие базы данных.
Разумеется, все это не способствует популярности Internet вделовых кругах. Одна
только мысль о том, что какие-нибудь хулиганы или, что еще хуже, конкуренты,
смогут получить доступ к архивам коммерческих данных,заставляет руководство
корпораций отказываться от использования открытых информационных систем.
Специалисты утверждают, что подобные опасениябезосновательны, так как у
компаний, имеющих доступ и к открытым, и частным сетям, практически равные шансы
стать жертвами компью