Содержание
Глава I. Структура глобальной сети Интернет
В 1969 году Министерством обороны США была создана сеть, которая явилась предшественницей Интернета, -- ARPANET. ARPANET была экспериментальной сетью. Она проектировалась для исследований методов построения сетей, которые были бы устойчивы к частичным повреждениям, получаемым, например, при бомбардировке, и способных в таких условиях продолжать нормальное функционирование. В ARPANET связь между компьютером-источником и компьютером-приемником (станцией назначения) присутствует постоянно. Создатели изначально предполагали, что сеть будет ненадежной, т.е. любая часть сети может исчезнуть в любой момент. Поддержка сети в рабочем состоянии возложена на связывающиеся компьютеры. Основной принцип постоения сети: любой компьютер связывается как равный с равным с любым другим компьютером.
Международной организации по стандартизации (International Standards Organization, ISO) нужны были годы, чтобы создать окончательный стандарт для компьютерных сетей, однако пользователи не ждали, а действовали. Активные пользователи стали инсталлировать программное обеспечение на все возможные типы компьютеров. Через несколько лет Интернет стал единственным приемлемым способом для связи разноплатформенных компьютеров. Такая схема подошла правительству и университетам, которые закупали компьютеры у различных производителей. Каждый закупал те компьютеры, которые ему нравились, и вправе был ожидать, что сможет работать по сети совместно с компьютерами других производителей.
Процесс улучшения сети идет постоянно. Большинство подобных изменений происходит незаметно для пользователей. На самом деле Интернет не просто сеть -- это структура, объединяющая обычные сети. Интернет -- это «сеть сетей». Что включает в себя Интернет? Ответ на этот вопрос меняется со временем. Раньше ответ был бы достаточно прост: все сети, работающие по протоколу IP и объединенные для формирования единой сети своих пользователей. Изначально в Интернет входили различные ведомственные сети, множество региональных сетей, сети учебных заведений и некоторые зарубежные (находящиеся за пределами США) сети.
В конце семидесятых Интернет привлек пользователей других сетей (например, BITNET, DECnet, Fidonet и т, д.), работающих не по протоколу IP. Они решили предоставлять услуги Сети своим клиентам и разработали методы подключения этих сетей к Интернету. Сначала эти подключения, названные шлюзами, служили только для передачи электронной почты. Однако некоторые из них разработали способы передачи и других услуг. Являются ли эти сети частью Интернета? И да, и нет. Все зависит от того, хотят ли они того сами.
Всемирная паутина -- World Wide Web (WWW) появилась намного позже, в 1991 году. Ее автор -- Тим Бернерс Ли из Европейского центра ядерных иссле-дований (CERN), расположенного в Женеве (Швейцария). Мало кому известная, появившаяся за счет энтузиазма, технология обеспечила лавинообразный рост популярности Интернета и появление того океана информации, который мы видим сейчас. Рубежом можно считать 1993 год, когда количество подключенных серверов превысило миллион. После этого пропали последние сомнения в перспективах сети сетей. Более подробно о WWW мы поговорим в четвертом модуле.
Для большинства пользователей мировой сети существует три основных информационных технологии Интернет: электронная почта (e-mail), файловые архивы FTP и World Wide Web. Чтобы воспользоваться этими полезными услугами, необходимо стать пользователем Интернет. В настоящее время существует множество способов подключения к сети. Способ доступа напрямую зависит от потребностей пользователя. Услуги подключения к сети предлагают огромное число провайдеров, но не всегда они могут удовлетворить потребности пользователей.
Как начать работу в сети? Какое оборудование для этого нужно? Постораемся подробно и осмысленно рассмотреть эти вопросы. Начнем обсуждение с выбора телекоммуникации, соединяющего пользователей между собой и/или с поставщиком Интернет-услуг. Наиболее распространенные способы соединения обычного пользователя с поставщиком сетевых услуг (провайдером) - это по коммутируемым линиям. Доступ по коммутируемым линиям телефонных сетей является пока самым доступным, дешевым и распространенным. Существует два способа подключения: dial-up connection (соединение с провайдером через телефонного оператора с максимальной пропускной способностью 56Кбит/c) и DSL (digital subscriber line - цифровая абонентская линия). Пропускная возможность DSL высока и в настоящее время этот способ подключения пользуется большой популярностью. Скорость загрузки электронных ресурсов сегодня не зависит от качества компьютера, а напрямую определяется характеристиками модема и коммутируемой линии. Следует сразу же отметить, что линии цифровой (иногда аналого-цифровой) телефонной связи существенно лучше привычной аналоговой телефонии.
Радикальным улучшением обозначено применение сотовой, спутниковой или оптоволоконной связи. Последняя сегодня реализует пропускную способность до 1 Гбит/сек. В перспективе получат распространение услуги Radio-Ethernet. Использование этого вида услуг на уровне абонентского доступа дает возможность удобного выхода в сеть Интернет через радиоканал в 2 Мбит/сек., который хотя и находится в совместном использовании несколькими абонентами, дает каждому достаточно удобный доступ, причем с возможностью голосовой связи. Абонент постоянно подсоединен к сети, запрос на нужную информацию посылается и обслуживается немедленно. Понятно, что для упомянутых здесь решений на совершенно другом (чем обозначено выше) уровне решается вопрос о выборе аппаратных приемно-передающих и компьютерных средств. Но при всем том для индивидуального пользователя в образовательных технологиях пока уместно ориентироваться на использование коммутируемых каналов и, отчасти, сотовой телефонии. При этом иногда удается добиваться гарантированной скорости передачи до 64-128 Кбит/сек. по линии основного и 1980 Кбит/сек. по линии первичного доступа.
Прежде чем говорить о информационных ресурсах Интернета, следует разобраться, каким образом можно подключиться к Всемирной сети. Ниже приведены основные способы, рис..
Рис. . Основные способы доступа к Интернету
Прямой (непосредственный) доступ к Интернету позволяет использовать самый полный спектр услуг Глобальной сети. Непосредственный доступ представляет собой прямой коннект локальной сети предприятия с Интернетом в качестве домена. Организация, имеющая прямой доступ, пользуется Сетью с высокой скоростью и высокой эффективностью постоянно, круглые сутки и практически 356 дней в году. Непосредственное соединение можно установить путем подключения локальной сети или рабочей станции к оптоволоконной магистрали или выделенному каналу связи при помощи соответствующего сетевого оборудования. Существует множество фирм, предлагающих такого рода доступ. Практически все серверы Интернета подключены к Всемирной сети с помощью именно этой технологии.
1.1.1. «Доступ по вызову» (Dial-up Access)
«Доступ по вызову» - это связь с Интернет-провайдером по коммутируемым телефонным каналам при помощи модема. Для того чтобы в течение месяца получать полный спектр услуг Интернета, достаточно иметь компьютер с установленной системой Microsoft Windows и любой модем (желателен со скоростью не ниже 14 400 bps). Достоинством такого вида доступа является относительно низкая стоимость услуг. Недостатками Dial-up соединения можно считать низкое качество и скорость канала передачи данных, высокую вероятность разрыва связи в самый неподходящий момент, длительное время, затрачиваемое пользователем на дозвон до провайдерского пула и авторизацию, и, наконец, занятость телефонной линии на протяжении всего сеанса работы в Интернете.
1.1.2. Доступ по протоколам SLIP и РРР
Использование такого вида доступа подразумевает наличие специального программного обеспечения, поддерживающего протоколы SLIP (Serial Line Internet Protocol) и РРР (Point to Point Protocol). Договорившись с поставщиком услуг о том, что работа в Интернете будет проходить именно по этим протоколам, предприятие подключается к Сети. После этого, как и при непосредственном доступе, в распоряжении предприятия абсолютно все ресурсы Глобальной сети, более того, оно входит в нее составной частью само, а не через сервер провайдера Интернета.
При работе со SLIP и РРР нет необходимости прокладывать в офис оптоволоконную магистраль, можно использовать выделенную коммутируемую телефонную линию, что гораздо дешевле. Единственным непременным условием для работы является то, что на компьютере должен быть установлен высокоскоростной модем.
SLIP является сетевым протоколом, позволяющим использовать для прямого выхода в Интернет обыкновенную телефонную линию и модем. Однако для работы потребуется специальное программное обеспечение. SLIP работает совместно с протоколом ТСР/IР как протокол более низкого уровня. Принимаемую через модем закодированную информацию SLIP анализирует и преобразует в IP-пакет, который передается программной оболочке более высокого уровня, например приложению класса клиент/сервер, которое, получив его, преобразует этот пакет соответственно директивам протокола TCP.
На отправку данная система работает так: SLIP получает от программы клиент/сервер сгенерированный ею IP-пакет, затем выбирает из него всю ценную информацию, преобразует ее в символьный код и отправляет в Интернет.
РРР - это более современная и совершенная версия протокола SLIP. Это более эффективный, быстрый и функциональный протокол. Соответственно, РРР более дорог, чем его аналог. Различий в алгоритмах обработки информации между ними практически нет. SLIP и РРР подходят для прямого подключения к Интернету, как локальных сетей, так и домашних компьютеров, используемых в качестве сервера. Такой доступ несоизмеримо дешевле непосредственного, но и намного дороже доступа по вызову. Тем не менее, здесь играет значительную роль скорость модема и пропускная способность телефонной линии. Именно эти факторы зачастую делают использование SLIP и РРР невозможным.
Существует еще один протокол, который называется CSLIP (Compressed SLIP), созданный фирмой Lawrence Berkley Labs для телефонных линий с малой пропускной способностью. CSLIP - это модификация SLIP. Выигрышь в скорости создается за счет универсального алгоритма сжатия заголовков IP-пакетов. На низкоскоростных линиях этот протокол позволяет увеличить эффективность связи почти в 6 раз и немного компенсировать ее слабые возможности.
Недостатком CSLIP является невысокая его надежность. Протокол сжимает заголовки IP-пакетов, начиная со второго и используя при этом информацию о заголовке из первого, несжатого пакета. Создается логическая последовательность IP-информации, и если одна из ее составляющих теряется, то есть один из пакетов последовательности был передан некорректно, CSLIP прерывает передачу и добросовестно начинает все заново. При плохой связи можно потерять на использовании CSLIP больше, чем при применении SLIP и РРР.
1.1.3. Доступ UUCP
Доступ UUCP (Unix-to-Unix CoPy) предназначен для пользователей платформ UNIX. UUCP используется для обмена файлами между двумя компьютерами. Возможности, предоставляемые данным видом доступа, ограниченны лишь работой с электронной почтой и новостями. Суть подключения UUCP сводится к тому, что на самом деле никакого Интернета на машине пользователя не будет. Доступом к Интернету владеет только провайдер, которой и предоставляет услуги UUCP. Компьютер пользователя соединяется в устанновленное время сервером провайдера и отправляет и принимает электронную почту. Дальше уже сетевые программы удаленного ПК будут пересылать корреспонденцию пользователя во Всемирную сеть.
1.1.4. Подключение по технологии «coax at home»
Технология «coax at home» позволяет получать доступ к Интернету, используя каналы кабельной телевизионной сети. В упрщенном виде такая структура строится следующим образом: используется подключение стандартного оборудования кабельного телевизионного центра, предназначенного для вещания, к Интернету через специальное устройство передачи данных, называемое головным модемом. Модем подключается посредством маршрутизатора к высокоскоростному каналу Интернета. После этого абоненту достаточно лишь установить на своем компьютере любую сетевую карту, поддерживающую протокол 10 Base-T или 100 Base-T, подключить ее к кабельному модему, а тот, в свою очередь, к расположенному в квартире антенному выходу. Основной элемент клиентской компьютерной системы в схеме кабельной сети - это кабельный модем, который представляет собой двунаправленный аналогово-цифровой преобразователь данных, использующий в процессе передачи информации принцип наложения на несущую частоту модулированного аналогового сигнала. Фундаментальное отличие данного аппарата от обыкновенного модема заключается в том, что кабельный модем не требует установки каких-либо драйверов, поскольку он подключается к компьютеру посредством сетевой карты и является абсолютно прозрачным для системы: машина считает, что она работает в локальной сети. Следовательно данному модему совершенно безразлично, какая операционная система проинсталлирована на пользовательском ПК. Необходимо лишь, чтобы эта система поддерживала возможность установки сетевой карты и настройки локальной сети. Для работы в Интернете абонент может применять любое стандартное программное обеспечение.
Главные преимущества доступа к Интернету по методу «coax at home» - это высокая стабильность соединения, отсутствие непредвиденных разрывов связи, а также то, что на протяжении всего сеанса работы во Всемирной сети телефонная линия остается свободной.
1.1.5. Выбор поставщика информационных услуг
Существует и другая сторона проблемы выхода в сеть Интернет: какой способ соединения предпочтителен с точки зрения выбора поставщика информационных услуг, или, точнее звена во всей цепи сетевого взаимодействия, к которому резонно подсоединиться.
В первом приближении существуют четыре основных различных способа соединения, причем большинство из них могут быть реализованы и для больших компаний, и для индивидуальных пользователей. Ниже приводится краткая характеристика существующих возможностей подключения к Интернет:
· Прямое подключение (direct connection) к Интернет. Подключение к магистральным каналам (backbone) Интернет осуществляется через специальный компьютер - шлюз (gateway). При этом способе возможен полный доступ ко всем услугам сети, но он считается достаточно дорогим в реализации и поддержке. Такой способ подключения приемлем для больших организаций.
· Соединение через предоставленный шлюз. При этом способе предполагается аренда чужого шлюза для полного доступа ко всем услугам сети. Такой способ может быть удобен для студентов, но вне вуза будет трудно найти организацию, которая позволит пользоваться своим шлюзом.
· Использование прямого (direct) Интернет-провайдера. При этом подключении компьютер пользователя соединяется со специальным шлюзом компании, обеспечивающей ограниченный или полный доступ к услугам Интернет. Отличие этих компаний от on-line-служб в том, что их роль состоит только в предоставлении шлюза в Интернет. Чаще всего Интернет-провайдеры такого типа пользуются выделенными соединениями по высокоскоростным каналам для обеспечения высокого качества сервиса. Пример прямого Интернет-провайдера - UUNET Technologies.
· Использование косвенного (indirect) Интернет-провайдера. В этом случае привлекают on-line-службу (типа Delphi или CompuServe) для получения доступа к некоторым или ко всем услугам Интернет. Данный способ доступа подходит для большинства частных лиц, хотя не все сервис-провайдеры предлагают все возможности Интернет.
Итак, каждый пользователь сам может подобрать для себя оптимальный вариант подключения к сети в зависмости от необходмых услуг, времени доступа и финансовых затрат.
1.2.1. Универсальный адрес сетевого ресурса
Широкое использование компьютерных сетей неспециалистами на сегодня стало возможно благодаря разработке простых в применении средств доступа к многообразным ресурсам Интернет. В первую очередь это относится к появлению специальных программ-клиентов WWW, называемых браузерами, обладающих “дружественным” графическим интерфейсом (т.е. способом взаимодействия пользователя с программой).
Схема адресации в иерархически организованной файловой системе, характерной для таких популярных операционных систем, как DOS и Unix, позволяет однозначно идентифицировать заданный файл путем указания его времени и уникального адресного пути к нему.
Пример:
В DOS C:DOSPROGRFILE1.TXT |
(Запись с именем file1.txt расположена в корне на диске C, в директории DOS, поддиректории PROGR) |
|
В Unix /users/data/Letters.html |
(Запись с именем Letters.html расположена в корне, в директории users, поддиректории data) |
|
Важная для избежания ошибок при организации доступа к файлам разница в этих схемах состоит в использовании разных слэшей - прямого (/) в Unix и обратного () в DOS, а также чувствительность к верхнему и нижнему регистру, свойственная только Unix. За основу схемы адресации ресурсов в Сети принята нотация Unix, которая претерпела естественные расширения за счет приписывания к существующей схеме слева имени протокола доступа к заданному ресурсу, где расположен ресурс; а справа после служебных символов (#, ?) имени метки внутри файла или элементов поискового ресурса. В примерах
· http://www.dvgu.ru/users/data/Lessons.htm#Page1
· http://www.dvgu.ru/cgi-bin/proc?corn
содержится обращение по протоколу http к компьютеру с доменным именем www.dvgu.ru с попыткой доступа в первом случае к области файла Lessons.htm с меткой Page1, а во втором - реализация поискового запроса к программе proc с термином для поиска "corn" на том же сервере.
Отметим, что именно в таком виде и вводятся строки запроса на ресурсе в специально отведенном поле браузера, после чего нажатием клавиши Enter инициируется соединение и загрузка.
Итак, в основу построения адреса ресурса в Сети оказались заложены следующие понятия и принципы:
Расширяемость - новые адресные схемы должны были легко вписываться в существующий синтаксис URI (Uniform Resource Identifier - универсальный индикатор ресурса).
Полнота - по возможности, любая из существующих схем должна описываться посредством URI.
Читаемость - адрес должен быть легко читаем человеком, что вообще характерно для технологии WWW.
Расширяемость была достигнута за счет выбора определенного порядка интерпретации адресов, который базируется на понятии “адресная схема”. Идентификатор схемы стоит перед остатком адреса, отделен от него двоеточием и определяет порядок интерпретации остатка.
Полнота и читаемость порождали коллизию, связанную с тем, что в некоторых схемах используется двоичная информация. Эта проблема была решена за счет формы предоставления такой информации. Символы, которые несут служебные функции, и двоичные данные отображаются в URI в шестнадцатеричном коде и предваряются символом "%".
Прежде, чем рассмотреть различные схемы представления адресов, приведем еще один пример простого адреса URI:
http://lemoi.phys.dvgu.ru/wst/index.html
Перед двоеточием стоит идентификатор схемы адреса - "http". Это имя отделено двоеточием от остатка URI, который называется "путем". В данном случае путь состоит из доменного адреса машины, на которой установлен сервер HTTP, и пути от корня дерева сервера к файлу "index.html".
Кроме представленной выше полной записи URI существует упрощенная. Она предполагает, что к моменту ее использования многие параметры адреса ресурса уже определены (протокол, адрес машины в Сети, некоторые элементы пути).
При таких предположениях автор гипертекстовых страниц может указывать только относительный адрес ресурса, т.е. адрес относительно определенных базовых ресурсов.
1.2.2. Схемы адресации сетевых ресурсов
В RFC-1630 (Request for Comment - документы с таким названием содержат в себе материалы по Интернет-технологии, которые доведены до уровня стандарта или близки к этому уровню) рассмотрено восемь схем адресации Интернет и указаны две, синтаксис которых находится в стадии обсуждения.
Схема HTTP. Это основная схема для WWW. В схеме указываются ее идентификатор, адрес машины, TCR-порт, путь в директории сервера, поисковый критерий и метка.
Следует отличать понятие TCR-порта от физического разъема на задней стенке системного блока компьютера. В Интернет принято идентифицировать конкретную прикладную программу с определенным числом, или портом (это понятие абсолютно не связано с названием физического устройства ввода-вывода компьютера). Всякий раз передаваемый по сети от одного компьютера к другому пакет данных содержит информацию о том, какой именно протокол содержит информацию о том, какой именно протокол используется и с какой прикладной программой машины пытается установить связь. Номер порта и обозначает эту прикладную программу.
Приведем несколько примеров URI для схемы HTTP:
http://lemoi.phys.dvgu.ru/wst/test.html
Это наиболее распространенный вид URI, применяемые в документах WWW. Вслед за именем схемы (http) следует путь, состоящий из доменного адреса машины и полного адреса HTML-документа в дереве сервера HTTP.
В качестве адреса машины допустимо использование и IP-адреса:
http://144.206.160.40/test/test.html
Если сервер протокола HTTP запущен на другой, отличный от 80 порт TCP, то это отражается в адресе:
http://l44.206.130.137:8080/primorye/index.html
При указании адреса ресурса возможна ссылка на точку внутри файла HTML. Для этого вслед за его именем может быть указана метка внутри документа:
http://lemoi.phys.dvgu.ru/wst/test.html#first
Символ # отделяет имя документа от имени метки. Другая возможность схемы HTTP - дача параметров. Первоначально предполагалось, что в качестве параметров будут передаваться ключевые слова, но по мере развития механизма сервисных программ (скриптов) в качестве параметров стала передаваться и другая информация.
http://lemoi.phys.dvgu.ru/wst/isindex.html?keyword1+keyword2
В данном примере предполагается, что документ "isindex.html" - документ с возможностью поиска по ключевым словам. При этом в зависимости от поисковой машины (программы, реализующей поиск) знак "+" будет интерпретироваться либо как "AND", либо как "OR". Вообще говоря, "+" заменяет " " (пробел) и относится к классу неотображаемых символов. Если необходимо передать такой символ в строке параметров, то следует передавать в шестнадцатеричном виде его ASCII-код.
Схема FTP. Данная схема позволяет адресовать файловые архивы FTP из программ-клиентов World Wide Web. При этом программа должна поддерживать протокол FTP. В данной схеме возможно указание не только имени схемы, адреса FTP-архива, но и идентификатора пользователя и даже его пароля. Наиболее часто используется для доступа к публичным архивам FTP:
ftp://dvo.ru/pub/movie.avi
В этом случае записана ссылка на архив "dvo.ru" с идентификатором "anonymous" или "ftp" (анонимный доступ). Если есть необходимость указать идентификатор пользователя и его пароль, то можно это сделать перед адресом машины:
ftp://nobody:password@dvo.ru/users/local/pub
Здесь параметры отделены от адреса машины символом "@", а друг от друга - двоеточием. В некоторых системах можно указать и тип передаваемой информации, но данная возможность не стандартизирована. Следует также учитывать, что употребление идентификатора пользователя и его пароля не рекомендовано, так как данные передаются незашифрованными и могут быть перехвачены. Реальная защита в WWW осуществляется другими средствами и построена на других принципах.
Схема Gopher. Данная схема используется для ссылки на ресурсы распределенной информационной системы Gopher. Схема состоит из идентификатора и пути, в котором указывается адрес Gopher-сервера, тип ресурса и команда Gopher:
gopher://gopher.dvgu.ru:70:/7/kuku
В этом примере осуществляется доступ к gopher-серверу gopher.dvgu.ru через порт 70 для поиска (тип 7) слова "kuku". Следует заметить, что gopher-тип, в данном случае 7, передается не перед командой, а вслед за ней.
Схема MAILTO. Данная схема предназначена для отправки почты по стандарту RFC-822 (стандарт почтового сообщения). Общий вид схемы выглядит так:
mailto:samardak@dvgu.ru
Схема TELNET. По этой схеме осуществляется доступ к ресурсу в режиме удаленного терминала. Обычно клиент вызывает дополнительную программу для работы по протоколу telnet. При использовании этой схемы необходимо указывать идентификатор пользователя, допускается использование пароля. Реально доступ осуществляется к публичным ресурсам, и идентификатор и пароль являются общеизвестными, например их можно узнать в базах данных Hytelnet.
telnet://guest:password@apollo.dvgu.ru
Схема FILE. WWW-технология используется как в сетевом, так и в локальном режимах. Для локального режима используют схему FILE.
file:///C/text/html/index.htm
В данном примере приведено обращение к локальному документу на персональном компьютере MS-DOS или MS-Windows.
Существует еще несколько схем, которые на практике используются редко или находятся в стадии разработки, поэтому останавливаться на них не будем.
Из приведенных выше примеров видно, что спецификация адресов ресурсов URI является довольно общей и позволяет адресовать практически любой ресурс Интернет. При этом число ресурсов может расширяться за счет создания новых схем. Они могут быть похожими на существующие, а могут и отличаться от них. Реальный механизм интерпретации идентификатора ресурса, опирающийся на URI, называется URL (Uniform Resource Locator), и пользователи WWW имеют дело именно с ним.
1.2.3. Регистрация имени домена
Домены в различаются различаются по уровням иерархии, например в “lemoi.phys.dvgu.ru” lemoi - домен третьего уровня, phys - второго, dvgu - первого, а ru - верхнего. Создавая домен, необходимо зарегистрировать его в руководящей организации, тогда имя домена будет включено в имя ее домена. Домены верхнего уровня классифицируют организации по типам (используется в США): gov (government - государственные), edu (educational - образовательные), org (organization - организации), net (главные центры поддержки сети), mil (военные группы), int (международные), com (commercial - коммерческие), <country code> (любая страна, географическая единица). В 2004 году были приняты новые типы доменов верхнего уровня:
biz - домен для крупных и средних компаний, продвигающих свой бизнес;
info - информационный домен, который может быть использован для представления своей продукции или услуги в Интернет;
name - индивидуальный домен для представления персоналий в Интернете;
coop - домен для организаций стремящихся к кооперации;
aero - домен для авиакомпаний;
museum - домен для музеев.
Чтобы присоединиться ко всем, кроме государственного домена, необходимо иметь аргументы, соответствующие предъявляемым строгим требованиям. Включение в домен com гораздо проще, однако все-таки нужно правильно определить, к какому из доменов верхнего уровня относится организация.
Имя домена должно иметь смысл, легко запоминаться и вводиться с клавиатуры, а также не использоваться другой организацией в Интернете.
Выбранное подходящее имя регистрируется. Обычно для этого из области Registration Web-страницы InterNIC (http://www.internic.net/) получают текстовый бланк и заполняют его в любом редакторе или текстовом процессоре или заполняют форму WWW, используя программу просмотра Web.
Необходимо сообщить InterNIC о себе некоторые данные. Во-первых, кто будет контактировать с ней по административным, техническим или финансовым вопросам, касающимся домена. Во-вторых, имена и IP-адреса серверов DNS (Domain Name Service), поддерживающих домен.
Заполненная форма отсылается электронной почтой в InterNIC. Через некоторое время поступают два ответа: первый - подтверждение получения запроса, второй - разрешение на использование имени домена.
1.3.1. Введение в TCP/IP
Протокол в сетевых технологиях определяется как четко регламентированный свод правил, которые одинаково применимы для различных систем (программ, шлюзов, пакетов данных и др.), участвующих в передаче информации. Благодаря протоколам, взаимодействие этих систем происходит по заранее установленному сценарию.
С целью лучшего понимания понятия протокола, рассмотрим один пример, который не имеет отношения к компьютерным сетям. Предположим, что в некотором регионе расположены два предприятия А и Б, которые сотрудничают друг с другом, рис. 10. Делавая активность предприятий базируется на многочисленных договоренностях и соглашениях, таких, например, как регулярные поставки продукции одного предприятия другому. Исходя из этой договоренностьи начальник отдела продаж предприятия А каждый месяц должен посылать сообщение начальнику отдела закупок предприятия В о том, сколько и какого товара они могут поставить в этом месяце. В ответ на это сообщение начальник отдела закупок отправляет заявку на нужный объем продукции во внутренний отдел производства. Такой порядок взаимодействия между начальниками или директорами в данном случае соответствует понятию «протокол уровня директоров». У начальников есть секрктари, через которых отправляются все сообщения.
После того как сообщения поступили секретарям, начальников не не интересуют способы отправки и дальнейшего передвижения письма - обычной или электронной почтой, факсом или курьером. Выбор способа передачи лежит на секретарях, которые решают этот вопрос, не уведомляя об этом начальство, так как их протокол взаимодействия завязан только на передаче сообщений, поступающих сверху, и не касается содержания этих сообщений. После отправки письма, секретари считают свою работу выполненной. Однако хороший секретарь может еще проверить получил ли адресат сообщение.
При решении разных проблем начальники могут взаимодействовать по другому сценарию, но это не отразится на работе секретарей, для которых не важно, какие сообщения отправлять, а важно, чтобы они дошли адресату. Другими словами, мы имеем два уровня - уровень начальников и секретарей, и каждый уровень имеет собственный протокол, который может быть изменен независимо от протокола другого уровня. Так как протоколы независимы друг от друга, то это дает возможность использовать многоуровневый подход.
Перейдя от примера к реальной сети, можно увидеть схожую картину. По мере движения пакета данных по сети на разных последовательных этапах его взаимодействия с другими сетевыми элементами отрабатывают протоколы разных уровней. Полная совокупность таких протоколов, используемых для успешного взаимодействия разных элементов в рамках сети данного типа, называют семейством или стеком. Интернет работает под семейством протоколов TCP/IP, которое имеет многоуровневую структуру. TCP/IP расшифровывается как Transmission Control Protocol/Интернет Protocol (Протокол управления передачей данных/Протокол Интернет).
Структура протоколов TCP/IP имеет четыре основных уровня и приведена на . рис.
Рис.. Стек TCP/IP
Самый нижний (уровень IV) соответствует уровню доступа к сети, который работает на основе популярных стандартных протоколах физического и канального уровня, таких, как Ethernet, Token Ring, SLIP, PPP и других. Протоколы этого уровня отвечают за пакетную передачу данных в сети на уровне аппаратных средств.
Следующий уровень (уровень III) обеспечивает межсетевое взаимодействие при передаче пакетов данных из одной подсети в другую. В качестве протокола в стеке задействован протокол IP.
Следующий уровень (уровень II) является основным и работает на базе протокола управления передачей TCP. Этот протокол необходим для надежной передачи сообщений между размещенными на разных машинах прикладными программами за счет образования виртуальных соединений между ними.
Все обозначенные выше уровни можно отнести к «уровню секретарей» из примера, описанного выше. Пользователя («начальника») больше всего интересует правильная работа самого верхнего уровня (уровень I), или «уровня начальников», который называется на языке стека TCP/IP прикладным.
Так как стек TCP/IP существует достаточно давно, то он включает в себя большое количество протоколов и сервисов прикладного уровня. Наиболее важными и популярными являются следующие протоколы: протокол передачи файлов FTP, протокол Telnet, протокол Gopher для доступа к ресурсам всемирного пространства GopherSpace, и самый известный протокол HTTP для доступа к удаленным гипертекстовым базам данных во всемирный паутине.
Классифицируем протоколы по характеру выполняемых задач.
Транспортные протоколы предназначены для управления передачей данных между двумя машинами:
· TCP (Transmission Control Protocol). Этот протокол поддерживает передачу данных, которая основана на логическом соединении между передающим и принимающим компьютерами.
· UDP (User Datagram Protocol). Этот протокол обеспечивает передачу данных без установления логического соединения. Другими словами данные отправляются без предварительно установленного соединения между компьютерами получателя и отправителя.
Протоколы маршрутизации предназначены для обрабатки адресов данных и определения наилучших путей до адресата. Кроме того, они обеспечивают разбиение больших сообщений на несколько маленьких сообщений, которые затем передаются последовательной цепочкой и компонуются в единое целое на компьютере-получателе:
· IP (Internet Protocol). Протокол обеспечивает фактическую передачу данных.
· ICMP (Internet Control Message Protocol). Протокол обрабатывает сообщения состояния для IP протокола, например, ошибки и изменения в сетевых аппаратных средствах, которые влияют на маршрутизацию.
· RIP (Routing Information Protocol). Один из нескольких протоколов для определения наилучшего маршрута доставки сообщения.
· OSPF (Open Shortest Path First). Альтернативный протокол для определения маршрутов.
Протоколы поддержки сетевого адреса используются для идентификации машины с уникальным номером и именем.
· ARP (Address Resolution Protocol). Протокол определяет уникальные числовые адреса машин в сети.
· DNS (Domain Name System). Протокол для определения числовых адресов по именам машин.
· RARP (Reverse Address Resolution Protocol). Протокол для определения адреса машин в сети, но способом, обратным ARP.
Прикладные сервисы представляют собой пользоватеьские программы, которые используются для получения доступа к различным услугам.
· ВООТР (Boot Protocol). Протокол загружает сетевую машину, читая информацию для начальной загрузки с сервера.
· FTP (File Transfer Protocol). Протокол передачи файлов между компьютерами.
1.3.2. Сетевое взаимодействие «клиент-сервер»
В основу взаимодействия компонентов информационных сервисов Сети в большинстве случаев положена модель «клиент-сервер». Как правило, в качестве клиента выступает программа, которая установлена на компьютере пользователя, а в качестве сервера - программа, установленная у провайдера. В данном контексте под провайдером понимаем организацию или частное лицо, которые ведут (поддерживают) информационные ресурсы.
При этом возможны два варианта организации самой информационной системы, которая обеспечивает доступ к информационному ресурсу. Большинство систем Интернет построены по принципу взаимодействия "каждый с каждым", например система World Wide Wed, т.е. каждый пользователь может напрямую взаимодействовать с каждым сервером без посредников. Такой подход позволяет упростить всю технологическую схему построения системы, однако приводит к порождению большого трафика в Сети. Альтернативный вариант построения системы, например системы Usenet, когда пользователь может взаимодействовать только со «своим» сервером и не может обратиться к произвольному серверу в Сети. Однако доступ он получает ко всей информации, которая присутствует в данной информационной системе, так как серверы обмениваются ею между собой.
В ряде случаев возможен выбор между первым способом реализации информационного обслуживания и вторым, например, это возможно в службе доменных имен DNS. Администратор сервера может настроить его для работы через другой сервер или непосредственно с программами-клиентами. Аналогично настраиваются и специальные серверы-посредники для различных информационных серверов Интернет. Несколько таких схем
показано на рис.12.
Рис.12. Различные схемы «Клиент-Сервер» для информационных сервисов Интернет
Принципиальным различием между схемой с посредником и схемой Usenet является то, что при посреднике работа по доступу к ресурсу перекладывается на его плечи. При этом он будет устанавливать соединение с каждым сервером в сети. По схеме Usenet это делать не обязательно, так как информацию в принципе можно получить с любого сервера.
1.3.3. Недостатки протоколов
Проблемы защиты информации являются "врожденными" практически для всех протоколов и служб Интернет.
Система имен доменов (Domain Name System - DNS) представляет собой распределенную базу данных, которая преобразует имена пользователей и хостов в IP-адреса и наоборот. DNS также хранит информацию о структуре сети компании, например количестве компьютеров с IP-адресами в каждом домене. Одной из проблем DNS является то, что эту базу данных очень трудно "скрыть" от неавторизованных пользователей. В результате, DNS часто используется хакерами как источник информации об именах доверенных хостов.
FTP (File Transfer Protocol) обеспечивает передачу текстовых и двоичных файлов, поэтому его часто используют в Интернет для организации совместного доступа к информации. На FTP-серверах хранятся документы, программы, графика и любые другие виды информации. Некоторые FTP-серверы ограничивают доступ пользователей к своим архивам данных с помощью пароля, другие же предоставляют свободный доступ (так называемый анонимный FTP-сервис). Если вы используете опцию анонимного FTP для своего сервера, то должны быть уверены, что на нем хранятся только файлы, предназначенные для свободного распространения.
Sendmail - популярная в Интернет программа электронной почты, использующая для своей работы некоторую сетевую информацию, такую как IP-адрес отправителя. Перехватывая сообщения, отправляемые с помощью Sendmail, хакеры могут использовать эту информацию для нападений, например для спуфинга (подмены адресов).
SMTP (Simple Mail Transfer Protocol) - протокол, позволяющий осуществлять почтовую транспортную службу Интернет. Одна из проблем безопасности, связанная с этим протоколом, состоит в том, что пользователь не может проверить адрес отправителя в заголовке сообщения электронной почты. В результате хакер может послать в вашу сеть большое количество почтовых сообщений, что приведет к перегрузке и блокированию работы вашего почтового сервера.
Telnet - сервис Интернет, при осуществлении которого пользователи должны регистрироваться на сервере Telnet, вводя свое имя и пароль. После аутентификации пользователя его рабочая станция функционирует в режиме «тупого» терминала, подключенного к внешнему хосту. С этого терминала пользователь может вводить команды, которые обеспечивают ему доступ к файлам и возможность запуска программ. Подключившись к серверу Telnet, хакер может сконфигурировать его программу таким образом, чтобы она записывала имена и пароли пользователей.
Как уже говорилось, стек TCP/IP представляет собой набор протоколов, которые используются в Интернет и интрасетях для передачи пакетов между компьютерами. При передаче информация заголовков пакетов может подвергнуться нападению хакеров. Например, хакеры могут подменить адрес отправителя в своих пакетах, после чего они будут смотреться как пакеты, передаваемые авторизованным клиентом.
1.3.4. Программное обеспечение для работы в сети
Для использования информационных ресурсов Интернета необходимо определенное программное обеспечение. Для просмотра html-документов необходима программа, динамически обрабатывающая код HTML и отображающая web-страницы. Такая программа называется браузером (от англ. browser). Выделяют два основных класса браузеров: браузеры с поддержкой отображения графических элементов web-страниц и браузеры без такой поддержки. Большинство современных браузеров работают с графикой, включая flash анимацию и видео.
Самыми популярными браузерами являются Microsoft Internet Explorer и Netscape Navigator, предназначенные для работы в среде Microsoft Windows. Менее распространены Opera, Arache (работает под управлением DOS) и текстовый браузер для UNIX-совместимых платформ под названием Lynx.
Следует отметить, что браузеры имеют разные встроенные интерпретаторы HTML, из-за чего один и тот же html-документ может отображаться в них по-разному. Ощутимые различия наблюдаются не только между клиентским программным обеспечением разных производителей, но и между двумя версиями одной и той же программы. Самые существенные расхождения в алгоритмах обработки кода HTML имеются в двух наиболее популярных браузерах, созданных компаниями, которые никак не могут договориться между собой, чтобы достичь соответствия в отображении их продукцией интернетовских web-страниц. Речь об Интернет Explorer и Netscape Navigator.
Глава II. Интернет-технологии
2.3.1. Язык HTML
Сервис World Wide Web объединяет каналы передачи связной информации по всему земному шару. Язык HTML (HyperText Markup Language) предоставляет простой формат для предоставления этой информации. Для безконфликтной работы необходимо, чтобы все программы, совместимые с WWW, могли поддерживать язык HTML. Сервис WWW использует HTTP протокол, который позволяет передавать кодированную информацию между клиентом и сервером.
Уже не раз в учебнике упоминалось, что гипертекст и гипермедиа являются для WWW фундаментальными технологиями. Если развивать идею гипертекста и включить в него графику, аудио и видео файлы, анимацию, то мы получим, так называемое, гипермедиа.
Язык разметки гипертекста HTML берет свое начало от языка стандартной обобщенной разметки (Standard Generalized Markup Language - SGML). Язык SGML используется для создания структурированных документов, а также языков для их разметки. SGML можно считать глобальным стандартом для описания языков разметки гипертекста, таких, как HTML. Документы SGML являются программно- и аппаратно-независимыми, они не привязаны к какой-либо конкретной программе, компьютеру или устройству вывода. SGML был одобрен ISO (International Standard Organization - Международная организация стандартов) в 1986 г. и является стандартом для многих коммерческих и государственных систем создания документов.
Документ HTML представляет собой обычный текстовый файл, который заключен между последовательностью команд форматирования.
Язык разметки HTML обычно используют для представления:
· новостей, почты, рекламы, текстов;
· меню с опциями;
· результатов запросов к базам данных;
· простых структурированных документов со встроенной графикой;
· обзоров имеющейся информации.
Для описания html-документа используется тэговая модель, которая описывает документ как совокупность тегов-контейнеров, внутри которых заключаются информационные объекты (контент). Язык гипертекстовой разметки - это система для разметки текста с помощью команд форматирования. Нечто, заключенное в <угловые скобки>, называется тэг, считается командой и не отображается.
Например, <Т> используется для начала отображения курсива и </Т> для окончания. Некоторые команды требуют наличия начального и конечного тэгов, как например как например <BR> (разрыв), этого не требуют. Интерпретация тэгов не зависит от регистра символов; <BR> и <br> интерпретируется одинаково.
Следующие шесть строк появляются практически во всех Web-страницах:
<HTML>
<HEAD>
</HEAD>
<BODY>
</BODY>
</HTML>
Поскольку тэги HTML не чувствительны к регистру, вы можете использовать любую схему преобразования букв в прописные. Некоторые атрибуты тэга чувствительны к регистру, и тогда они будут отображаться так, как этого требует стандарт.
· <HTML> и </HTML> отмечают начало и конец страницы.
! |
Как писать рефераты Практические рекомендации по написанию студенческих рефератов. |
! | План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом. |
! | Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач. |
! | Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты. |
! | Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ. |
→ | Виды рефератов Какими бывают рефераты по своему назначению и структуре. |