Курсовая работа
по
На тему: «Организацияхранения и поиска информации в сети Internet»
Введение
Интернет каксредство информации в России пока не может конкурировать с традиционными СМИ,но имеет в этом отношении большие перспективы и сможет в дальнейшем выступатьнаравне с другими информационными ресурсами.
В настоящеевремя свыше 500 млн. человек более или менее регулярно пользуются
Интернетом, ачерез два года их число, по мнению экспертов, превысит 1 млрд., иными словами,более 16% населения Земли. Разумеется, такая колоссальная аудитория не моглаостаться невостребованной – Интернет давно превратился в огромнуюинформационную площадку.
Во всем мире,а теперь и у нас в стране, наличие работающего Web-сайта становится признакомстабильной, профессиональной работы фирмы. Интернет давно уже стал не толькосредством общения, но и полем для серьезной коммерческой деятельности.Практически каждая зарубежная фирма имеет в Сети свое представительство,виртуальный офис. Суммарный оборот компаний, ведущих торговлю в Интернет,достигает миллиардов долларов. В России также все большее число компанийиспользует Интернет для продвижения своих товаров и услуг. В этом легкоубедиться, просмотрев рекламные издания. Рядом с привычными номерами телефонови факсов все чаще и чаще встречаются адреса электронной почты и Web-сайтов.Скоро отсутствие адреса в Интернет будет затруднять работу так же, какотсутствие факса. Тот, кто займет себе место сейчас, существенно выиграет вбудущем. Это оперативность и актуальность. Традиционные средства массовойинформации при всей их наглядности и привычности уже не способны обеспечитьнадлежащий уровень оперативности, требуемый современному человеку. Поэтому всебольше и больше людей обращаются в Интернет, чтобы получить самую свежуюинформацию: об услугах и ценах, погоде, курсах валют, просто новости. На Web-сайтеможно менять информацию несколько раз в день. В печатных изданиях надозаказывать рекламу минимум за неделю, а то и больше. А в Интернет всеоперативно: новые товары или услуги, новая скидка или новый поставщик – завтраоб этом узнают клиенты. Нет необходимости ждать, пока выйдет очередной выпускпечатной рекламы. Информация на сайте будет всегда актуальной, самой свежей.Именно это ценят, именно это привлекает в Интернет миллионы пользователей.
1.Хранение данных в сети Internet
1.1 Гипертекстовыедокументы, виды файлов
Подгипертекстовым документом понимают документ, содержащий так называемые ссылкина другой документ. Реализовано все это через протокол передачи гипертекстаHTTP (HyperText Transfer Protocol).
Информацияв документах Web может быть найдена по ключевым словам. Это означает, чтокаждый обозреватель Web содержит определенные ссылки, через которые образуютсятак называемые гиперсвязи, позволяющие миллионам пользователей Internet вестипоиск информации по всему миру.
Гипертекстовыедокументы создаются на базе языка HTML (HyperText Markup Language). Этот языквесьма прост, управляющие коды его, которые, собственно, и компилируютсяобозревателем для отображения на экране, состоят из текста ASCII. Ссылки,списки, заголовки, картинки и формы называются элементами языка HTML, которые позволяютщелчком мыши перейти к просмотру другого документа.
Существуетдва способа создания гипертекстовых документов. Можно воспользоваться одним изWYSIWYG HTML-редакторов (например, Netscape Composer, основы работы с которомрассмотрены в разделе «Обработка текста на ЭВМ», Microsoft FrontPage, HotDog,или др.), для работы с которыми не требуется специальных знаний о внутреннейструктуре создаваемого документа. Этот способ позволяет создавать документы дляWWW без знания языка HTML. HTML-редакторы автоматизируют созданиегипертекстовых документов, избавляют от рутинной работы. Однако их возможностиограничены, они сильно увеличивают размер получаемого файла и не всегдаполученный с их помощью результат соответствует ожиданиям разработчика. Но,безусловно, этот способ незаменим для новичков в деле подготовки гипертекстовыхдокументов.
Альтернативойслужит создание и разметка документа при помощи обычного редактора plain-текста(таких, как emacs или NotePad). При этом способе в текст вручную вставляютсякоманды языка HTML. Создавая документы таким способом, вы точно знаете, чтоделаете.
Как ужеотмечалось, HTML-документ содержит символьную информацию. Одна ее часть – собственнотекст, т.е. данные, составляющие содержимое документа. Другая – теги(markup tags), называемые также флагами разметки, – специальныеконструкции языка HTML, используемые для разметки документа и управляющие егоотображением. Именно теги языка HTML определяют, в каком виде будет представлентекст, какие его компоненты будут исполнять роль гипертекстовых ссылок, какиеграфические или мультимедийные объекты должны быть включены в документ.Графическая и звуковая информация, включаемая в HTML-документ, хранится вотдельных файлах. Программы просмотра HTML-документов (браузеры) интерпретируютфлаги разметки и располагают текст и графику на экране соответствующим образом.Для файлов, содержащие HTML-документы, приняты расширения.htm или.html.
Прописные истрочные буквы при записи тегов не различаются. В большинстве случаевтеги используются парами. Пара состоит из открывающего (start tag) изакрывающего (end tag) тегов. Синтаксис открывающего тега:
Прямые скобки,используемые в описании синтаксиса, означают, что данный элемент можетотсутствовать. Имя закрывающего тега отличается от имени открывающего лишь тем,что перед ним ставится наклонная черта:
Атрибуты тегазаписываются в следующем формате:
имя [= «значение»]
Кавычки призадании значения аргумента не обязательны и могут быть опущены. Для некоторыхатрибутов значение может не указываться. У закрывающего тега атрибутов небывает.
Действиелюбого парного тега начинается с того места, где встретился открывающий тег изаканчивается при встрече соответствующего закрывающего тега. Часто пару,состоящую из открывающего и закрывающего тегов, называют контейнером, ачасть текста, окаймленную открывающим и закрывающим тегом, – элементом.
Последовательностьсимволов, составляющая текст, может состоять из пробелов, табуляций, символовперехода на новую строку, символов возврата каретки, букв, знаков препинания,цифр, и специальных символов (например, +, #, $, @), за исключениемследующих четырех символов, имеющих в HTML специальный смысл: (больше), & (амперсенд) и " (двойная кавычка). Еслинеобходимо включить в текст какой-либо из этих символов, то следуетзакодировать его особой последовательностью символов.
К специальнымсимволам можно отнести и неразрывный пробел. Использование этого символа – одиниз способов увеличить расстояние между некоторыми словами в тексте. Обычныепробелы использовать для этих целей нельзя, так как группа подряд идущихпробелов интерпретируется браузером как один.
1.2 Графическиефайлы, их виды и особенности
В настоящеевремя использование полноцветной качественной графики реалистичных цветов накомпьютерах класса ПК выглядит совершенно обыденным. Хотя не так давно это былопривилегией издательских систем, которые обычно строились на платформахMacintosh или графических станций Silicon Graphics. Пользователи ПКдовольствовались же в крайнем случае графикой с цветом, глубиной максимум 8бит/пиксел (256 цветов) при довольно слабой разрешающей способности 320Х200 илиже 16 цветами при разрешении 640Х480.
Сейчас, сразвитием архитектур видеоадаптеров и удешевлением видеопамяти на различныхмикросхемах, среднестатистическому пользователю вполне доступны системы наплатформе ПК, успешно работающие с реалистичными (TrueColor) изображениямиглубиной 24 бита / пиксел (более 16 млн. цветов).
В связи стехническим прогрессом возникла потребность в перенесении на платформу ПК иадаптации различных форматов кодирования и хранения графической информации сдругих платформ (например Macintosh, где подобные разработки развиваются втечение уже второго десятка лет), или же разработка собственных,ориентированных на ПК графических форматов, полностью учитывающих всеособенности архитектуры их видеоадаптеров.
Более того, впоследние 5 лет в связи с молниеносным распространением Internet и, вчастности, технологий World Wide Web, стала вставать проблема другого рода –разработка форматов изображений достаточно компактных для передачи в сети сминимальными задержками и аппаратно независимых, так как к сети подключеныкомпьютеры самых различных архитектур.
В связи сэтим, хотелось бы кратко рассмотреть несколько распространенных графическихформатов и кратко охарактеризовать их возможности. Все эти сведения сведены внижеследующую таблицу:Формат Макс. глуб. цвета Макс. число цветов
Макс. размер изображения,
пиксел
Методы
сжатия Кодирование нескольких изображений BMP 24 16'777'216 65535x65535 RLE* - GIF 8 256 65535x65535 LZW + JPEG 24 16'777'216 65535x65535 JPEG - PCX 24 16'777'216 65535x65535 RLE - PNG 48 281'474'976'710'656
2147483647x
2147483647 Deflation (LZ77) - TIFF 24 16'777'216 всего 4'294'967'295 LZW, RLE и другие* +
Кроме этогоследует отметить, что наиболее компактными являются форматы JPEG, GIF, PNG,которые, к тому же, платформенно-независимы. Формат BMP является стандартнымформатом Windows, однако большого распространения не получает из-за непомерныхразмеров файлов, особенно при сохранении графики с глубиной цвета 24бит/пиксел. Касаемо формата TIFF следует заметить, что он, как и JPEG, GIF,является частично платформенно-независимым, однако слишком объемен дляиспользования в сети и, что еще хуже, слишком сложен для интерпретации. Крометого любые программные изделия, в том числе и просмотровщики графических файлов,содержащие код для кодирования / декодирования данных по алгоритму LZWдолжны распространяться по соответствующему лицензионному соглашению компанииUnisys Corp., владельца алгоритма, что дополнительно удорожает эти продукты.
Дальнейшеерассмотрение мне хотелось бы обратить к межплатформенным форматам, принятым вInternet в качестве стандарта де-факто: JPEG, GIF, PNG.
Сразу хочузаметить, что формату PNG (Portable Network Graphic) не будет уделено многовнимания, хотя, возможно, он его и заслуживает. Это является следствием того,что формат этот появился не так давно и несмотря на все свои достоинства еще неполучил всеобщего признания.
Итак,фактически перед человеком или компанией, которая намерена размещать на своихдисках большое количество изображений и, возможно, предоставлять их дляиспользования в Internet, встает дилемма: что выбрать GIF или JPEG.
Формат GIF,разработанный компанией CompuServe, и изначально предлагавшийся именно какформат для обмена изображениями в сети является форматом с достаточно высокойстепенью сжатия изображения. Кроме того, GIF обладает дополнительнымивозможностями, которые делают его использование в сети привлекательным. Первая– это возможность изменения порядка вывода на экран строк изображения, сзаполнением промежутков между ними временной информацией. Визуально этовыглядит так, что по мере загрузки из сети (что происходит нередко скатастрофически низкой скоростью) изображение на экране появляется как бы «внизком качестве», а затем, по мере подгрузки дополнительной информации,восстанавливает пропущенные строки изображения. Таким образом, пользователь ещедо окончания процесса загрузки может получить представление о содержимомизображения и прервать загрузку ненужного файла большого размера. Втораявозможность заключается в хранении в одном файле боле чем одного изображения,что делает возможной элементарную покадровую анимацию. Еще одной отличительнойособенностью GIF является то, что один из цветов можно объявить «прозрачным», итогда при выводе изображения те его части, которые выкрашены этим цветом небудут выводиться на экран и под ними будет виден фон, на который изображениенакладывается. Самым же большим недостатком GIF является то, что он можетхранить изображение, состоящее максимум из 256 цветов, что в последнее времястановиться все менее и менее приемлемым. Вместе с этим, пользователей GIFпреследует такая же неприятность, что и в случае с форматом TIFF: GIF такжеиспользует LZW-сжатие, а следовательно, каждое изображение можетраспространяться только при наличии соответствующего лицензионного соглашения.
Формат JPEGявляется TrueColor-форматом, то есть может хранить изображения с глубиной цвета24 бит/пиксел. Такой глубины цвета достаточно для практически точноговоспроизведения изображений любой сложности. Более глубокое представление цвета(например 32 бит/пиксел) реально оказывается практически неотличимым от данногопри просмотре на современных мониторах и при распечатке на большинстведоступных принтеров. Такая глубина цвета может оказаться полезной разве тольков издательской деятельности. JPEG в общем обладает более высокой степеньюсжатия изображений, нежели GIF (подробнее этот аспект описан в главе «Практикииспользования JPEG»), но не обладает возможностью хранить несколько изображенийв одном файле. Недавно была разработана модификация формата JPEG, получившаяназвание Progressive JPEG, что приблизительно можно перевести на русский языккак «постепенный JPEG», который предназначен для тех же задач, что ичересстрочное отображение GIF-изображений. Это сделало формат JPEG еще болеепривлекательным в качестве сетевого стандарта. Однако, и в JPEG присутствуютсвои недостатки. В отличие от GIF, который может эффективно сжимать изображенияпрактически любого содержания, JPEG ориентирован прежде всего на реалистичныеизображения, то есть изображения фотографической направленности, и качествосжатия значительно ухудшается при обработке изображений с четко очерченнымилиниями и границами цветов.
Такимобразом, нельзя до сих пор сделать окончательного выбора в пользу одного илидругого формата. Однако, мне формат JPEG представляется более интересным сточки зрения оригинального алгоритма сжатия и больших возможностей для развитияв перспективе. Также формат JPEG следует считать однозначно более гибким: онпозволяет выбирать между хорошим качеством изображения или хорошей степеньюсжатия и находить приемлемый компромисс для каждого конкретного случая. Поэтомувсе дальнейшее исследование посвящено именно этому формату.
1.3 Поисковыесистемы и правила поиска информации
УдобствоИнтернета в том, что в нем можно найти практически любую информацию, даже когдамы не знаем точно, где она находиться. Если адрес страницы с интересующим насматериалом неизвестен и страницы с подходящими ссылками тоже нет, приходитьсяразыскивать материалы по всему Интернету. Для этого применяют поисковые системыИнтернета – специальные web-узлы, позволяющие найти нужный документ.
Существуетдва основных метода поиска в Интернете. В первом случае вы ищите web-страницы, относящиеся копределенной теме. Поиск производится путем выбора тематической категории ипостепенным ее сужением. Подобные поисковые системы называют поисковымикаталогами.Они удобны, когда вам нужно вые познакомиться с новой длясебя темой или добраться до широко известных «классических» ресурсов по даннойтеме. Второй способ поиска используется, когда тема носит узкий, специфическийхарактер или нужны редкие, малоизвестные ресурсы. В этом случае вы должныпредставлять себе, какие ключевые слова должны встретиться в документе поинтересующей вас теме. Эти слова надо выбрать таким образом, чтобы они, скореевсего, имелись в нужных документах, не имеющих отношения к выбранной теме.Системы, позволяющие выполнять подобный поиск, называют поисковыми указателями.Поисковые каталоги отличаются от поисковых указателей не только методом поиска,но и способом формирования. Любая поисковая система Интернета состоит из двухчастей. Специализированная web-страница, доступная всем желающим и позволяющаявыполнять поиск, опирается на большую, постоянно пополняемую и обновляемую базуданных, которая содержит сведения о ресурсах Интернета.
Способпополнения этой базы данных зависит от типа поисковой системы, поисковыхкаталогов самое главное – это точность отбора. Каждый найденный ресурс долженбыть полезным. Тематика страницы определяется или проверяется вручную. Из-заэтого объем поисковых каталогов относительно невелик. Когда объем приближаетсяк миллиону страниц, объем ручного труда настолько велик, что дальнейший росткаталога останавливается.
Поисковыеуказатели, напротив, ориентированы на широту охвата. С определением слов,имеющихся на web-странице, вполне справляется автоматика, данных поисковогоуказателя может охватывать многие миллионы web-страниц. При этомвыполнять поиск в указателе труднее, чем в каталоге, потому что одни те жеключевые слова могут встречаться на web-страницах, посвященным разным темам.
Информационно-поисковыесистемы размещаются в Интернете на общедоступных серверах. Основой поисковыхсистем являются так называемые поисковые машины, или автоматические индексы.Специальные программы-роботы (известные также как пауки) в автоматическомрежиме периодически обследуют Интернет на основе определенных алгоритмов,проводя индексацию найденных документов. Созданные индексные базы данныхиспользуются поисковыми машинами для предоставления пользователю доступа кразмещенной на узлах Сети информации. Пользователь в рамках соответствующегоинтерфейса формулирует запрос, который обрабатывается системой, после чего вокно браузера выдаются результаты обработки запроса. Механизмы обработкизапросов постоянно совершенствуются, и современные поисковые системы не простоперебирают огромное число документов. – Поиск ведется на основеоригинальных и весьма сложных алгоритмов, а его результаты анализируются исортируются таким образом, чтобы представленная пользователю информация внаибольшей степени соответствовала его ожиданиям.
В настоящее время в развитии поисковых систем наблюдается тенденция объединенияавтоматических индексных поисковых машин и составляемых вручную каталоговИнтернет-ресурсов. Ресурсы этих систем удачно дополняют друг друга, вобъединение их возможностей вполне логично.
Темне менее исследования возможностей поисковых машин, даже самых мощных из них,таких как AltaVista или HotBot, показывают, что реальная полнота охвата ресурсов Всемирнойпаутины отдельной такой системой не превышает 30%. Поэтому не стоитограничиваться использованием какой-либо одной из них. Если вам не удалосьотыскать интересующую вас информацию с помощью одной системы, попробуйтевоспользоваться другой.
Каждаяпоисковая Система имеет свои особенности и, и качество полученного результатазависит от предмета поиска и точности формулировки запроса. Поэтому, приступаяк поиску информации, прежде всего, нужно четко представлять себе, что именно игде вы хотите найти. Например, зарубежные системы поражают числомпроиндексированных документов. Для поиска в области профессиональных знаний,особенно информации на иностранном языке, такие системы, как AltaVista, HotBot или Northern, подходят наилучшимобразом.
Однакодля поиска информации на русском языке, особенно в российской части Интернета,лучше приспособлены русские поисковые машины. Во-первых, они специальноориентированные именно на русскоязычные ресурсы Сети и, как правило, отличаютсябольшей полнотой охвата и глубиной исследования эти ресурсов. Во-вторых,российские системы работают с учетом морфологии русского языка, то есть в поисквключаются все формы искомых слов. Российские системы лучше учитывают и такуюисторически сложившуюся особенность российских Интернет-ресурсов, каксосуществование нескольких кодировок кириллицы.
2.Обзор и характеристика поисковых систем сети Internet
2.1 Rambler
Для поискарусскоязычной информации в Интернете лучше использовать русские поисковыесистемы. В этом опыте и в следующих других мы будем искать информацию с помощьюнескольких систем, предназначенных для поиска в русскоязычной части Интернета.Как вы увидите, принципиально они не отличаются от всемирных поисковых систем.Так как мы уже рассмотрели несколько систем, и вы знаете общие принципы поискаинформации в Интернете, то в дальнейших опытах мы не будем подробноостанавливаться на всех тонкостях. Так как эти системы общаются с вами нарусском языке, то вы сможете самостоятельно изучить их, используя знания,полученные вами при выполнении предыдущих опытов.
Выполнимпоиск с помощью системы Рамблер. Как вы увидите, эта система обладает удобнойсистемой поиска и выдачи найденной информации.
Вы можетевыполнить поиск как во Всемирной паутине, так и в группах новостей, а также вкаталоге этой системы и в товарах. Кроме простого запроса имеется возможностьработы с детальными запросами. Но мы выполним простой запрос, как и для другихрусских поисковых машин.
Ø Введитев поле ввода запроса слова поиск Интернет. Мы хотим найти документы,одновременно содержащие слово «поиск» и слово «Интернет».
Ø Нажмитекнопку Найти!. Мы получили список найденных страниц.
Списокнайденных страниц удобно организован. Вначале расположены ссылки на страницы,наиболее соответствующие критериям поиска. Наиболее полно удовлетворяют запросудокументы, в которых искомые слова часто повторяются и стоят недалеко друг отдруга. Кроме того, в кратком фрагменте текста найденного документа выделеныобнаруженные ключевые слова.
В системеРамблер можно посмотреть слова, которые наиболее часто используются в запросахпользователей. Кроме того, Рамблер ведёт список наиболее популярных Российскихузлов Интернета. Так как вся информация в системе представлена на русском языкемы надеемся, что вы сможете самостоятельно в дальнейшем познакомиться свозможностями данной поисковой машины.
2.2 Yandex
Поисковаясистема Яndех располагается по адресу www.уаndех.ru. Она была официальновведена в эксплуатацию 23 сентября 1997 года.
Чтоже такое Яndех? Вот как отвечают на этот вопрос создатели системы. Яndех – это полнотекстоваяинформационно-поисковая система (ИПС), учитывающая морфологию русского ианглийского языков. Система Яndех предназначена для поиска информации вэлектронных текстах различной структуры и разных способов представления(форматов). Яndех (произносится «яндекс») расшифровывается как «языковый индекс»или, в английском написании, Yandex – Yet Another INDEX. Также можно рассматривать Яndех как частичный переводслова Index с английского на русский язык («I» означает «Я»).
Воснове поисковой системы Yandex. Ru лежит системное ядро, общее для всех продуктов спрефиксом Яndex (Яndex. Site, Яndex. Lib, Яndex. Dict, Яndex.СD). Первые продукты серии Яndex (Яndex. Site, Яndex. Dict) были представленыширокой публике 18 октября 1996 года на выставке Netcom’96. Поисковая машина для«русского Интернета». явилась естественным продолжением линии Яndex. Как уже говорилось, вхорошем вопросе содержится половина ответа. Искать и находить нужное в ворохетекстов в Интернете – умение не только поисковой системы, мо и пользователя,задающего запрос. Яndex не требует от пользователя знания специальных команд для поиска.достаточно набрать вопрос («где найти дешевые компьютеры» или «нужны телефоныМосквы и Московской области»), и вы получите результат – список страниц, гдевстречаются эти слова. Независимо от того, в какой форме вы употребили слово взапросе, поиск учитывает все его формы по правилам русского языка. Например,если задан запрос идти, то в результате поиска будут найдены ссылки надокументы, содержащие слова «идти», «идет», «шел», «шла» и т.д.
Яndex работает не только сязыковыми запросами, но и позволяет выполнять поиск только на определенныхсерверах ИЛИже исключить из поиска заведомо ненужные серверы. Появиласьвозможность поиска изображений по подписям к ним и по именам файлов. Такжестали доступными для поиска такие объекты, как сценарии, апплеты и стили (поискосуществляется по названию). Удобная работа с новыми возможностями предлагаетсяна странице расширенного поиска, где сложный язык запросов сведен к заполнениюполей в форме. Кроме стандартной сортировки результатов – по релевантности (тоесть по степени соответствия запросу), можно отсортировать документы по датеобновления. Интересной особенностью системы является возможность поиска вЯндексе в любом месте Интернета. Для этого нужно загрузить с сайта bar.уаndех.ru программу пол названиемЯндекс. Бар и установить ее. После этого в окне браузера появится новая панель.Она предназначена для ввода запроса на поиск (без необходимости открыватьстраницу Яндекса) и выполнения ряда других функций.
По внешнемувиду Яндекс представляет собой типичный портал, на главной странице которогоможно найти ссылки на материалы практически любой тематики. Но это неединственное его лицо, для «серьезных» пользователей, которые не хотят тратитьвремя на загрузку ненужной в данный момент информации, существует другойЯндекс. Его страница впечатляет скромностью дизайна и скоростью загрузки. Адресэтой эссенции поисковой машины – www.ya.ru.
2.3 Yahoo
Базы данных:в ведении находится служба поиска Internet-ресурсов, новостей, карт, рекламныхинформаций, спортивная информация, бизнес, номера телефонов, персональные WWW-страницы,и email-адреса (отдельная база данных).
Содержание:Основная директория содержит: адреса (URLs) лля Internet-ресурсов и краткоеописание для этих связей.
Поиск: ВсеYahoo страницы предлагают не только простое поисковое окно, но и опции для этогопоиска, а так же поиск Usenet или Email-адреса. Поиск может ограничиватьсяуказанием определённого промежутка времени. Boolean операторы (и, или) ипоследовательный поиск также поддержаны. Отметим: если поиск в Yahoo! не привёлк положительному результату, то процесс поиска автоматически переходит на AltaVista, которая продолжает поиск, и в случае положительных результатовавтоматически возвращает найденную информацию в Yahoo!.
Если Yahoo!не может установить связь достаточно быстро с Alta Vista, то в этом случаеYahoo! будет обеспечивать страницу связи с набором инструментов поиска. Послетого как одна из этих связей выбирается, ключевые слова передаются к поисковоймашине на ваше усмотрение.
Средством,облегчающим поиск, является наличие «tip search» (TS) – поиск с помощью «намека»:Yahoo! Является подчиненным справочником, что означает, что система не имееттак много страниц, как поисковые машины, однако задание наиболее общих ключевыхслов позволит найти необходимую тему на странице высокого уровня (перваястраница, которая возникает перед пользователем при посещении сайта) дляорганизации или компании.
Результаты:Связи отображаются в соответствии с очерёдностью задаваемых словпоследовательностью поиска наряду с их описательным текстом и подчиненной иерархией.
Адрес: www.yahoo.com/
2.4 Altavista
AltaVista (www. AltaVista.com) – одна из старейших поисковых систем в Интернете. Первый web-индекс был представленкомпанией в 1995 году. Ядро поисковой системы обязано своим рождением страннойособенности исследовательской лаборатории компании Digital Equipment Corp. Сотрудники этойлаборатории зачем-то хранили всю свою электронную переписку за последние 10лет. Чтобы эта куча информации не просто занимала дисковое пространство, априносила хоть какую-то пользу, была создана программа для индексированиядокументов и поиска нужных слов в ворохе пожелтевшей от времени электроннойкорреспонденции. Система получилась настолько удачной, что впоследствии суспехом перекочевала на просторы Всемирной паутины.
ИндексAltaVista содержит документы наболее чем 25 языках. Локализованные версии сайта AltaVista располагаются в доменах20 стран. В область поиска можно включить документы на всех поддерживаемыхязыках или только в документах на определенном языке, а на специальной страницеможно узнать несколько языков для поиска на всех выбранных языках одновременно.
Выводыи предложения
настоящеевремя в сети Internet используются практически все известные линии связи отнизкоскоростных телефонных линий до высокоскоростных цифровых спутниковыхканалов. Операционные системы, используемые в сети Internet, также отличаютсяразнообразием. Большинство компьютеров сети Internet работают под ОС Unix илиVMS. Широко представлены также специальные маршрутизаторы сети типа NetBlazerили Cisco, чья ОС напоминает ОС Unix.
ФактическиInternet состоит из множества локальных и глобальных сетей, принадлежащихразличным компаниям и предприятиям, связанных между собой различными линиямисвязи. Internet можно представить себе в виде мозаики сложенной из небольшихсетей разной величины, которые активно взаимодействуют одна с другой, пересылаяфайлы, сообщения и т.п.
Примеромтопологии сети Internet может служить сеть Х-Атом, состоящая из несколькихподсетей, и в то же время являющаяся фрагментом всемирной сети Internet.
Насегодняшний день в мире существует более 130 миллионов компьютеров и более 80%из них объединены в различные информационно-вычислительные сети от малыхлокальных сетей в офисах до глобальных сетей типа Internet. Всемирная тенденцияк объединению компьютеров в сети обусловлена рядом важных причин, таких какускорение передачи информационных сообщений, возможность быстрого обменаинформацией между пользователями, получение и передача сообщений (факсов, E – Mailписем и прочего) не отходя от рабочего места, возможность мгновенного получениялюбой информации из любой точки земного шара, а так же обмен информацией междукомпьютерами разных фирм производителей работающих под разным программнымобеспечением.
Такиеогромные потенциальные возможности которые несет в себе вычислительная сеть итот новый потенциальный подъем который при этом испытывает информационныйкомплекс, а так же значительное ускорение производственного процесса не даютнам право не принимать это к разработке и не применять их на практике.
Поэтомунеобходимо разработать принципиальное решение вопроса по организации ИВС(информационно-вычислительной сети) на базе уже существующего компьютерногопарка и программного комплекса отвечающего современным научно-техническимтребованиям с учетом возрастающих потребностей и возможностью дальнейшегопостепенного развития сети в связи с появлением новых технических и программныхрешений.
Internet продолжаетразвиваться с неослабевающей интенсивностью, по сути дела стирая ограничение нараспространение и получение информации в мире. Однако в этом информационномокеане бывает не очень легко найти необходимый документ. Следует также иметь ввиду, что в сети наряду с давно действующими серверами возникают новые.
Помимосерверов «общего» назначения имеются специализированные сайты в той или инойобласти, как например для физики высоких энергий – xxx.lanl.gov.
Приимпортировании файлов статей следует так же иметь в виду, что часто онихранятся в PostScript формате (с расширением, PS’’, EPS’’) предназначенном дляраспечатывания на лазерном принтере, поэтому в этом случае, после их получениядля просмотра и печати на матричном или струйном принтере следует использоватьспециальную программу, например GhostView.
Не вызываетсомнения, что использование Internet в научной работе позволяет получать самую,горячую’’ информацию и поддерживать контакт с коллегами в мире.
Естьпредположение, что Интернет вытеснит и заменит книги. Сейчас этому препятствуетряд факторов. Во-первых, отсутствие комфорта при чтении книг с мониторакомпьютера. И хотя портативные устройства для чтения электронных текстов ужесуществует, разрешение их экранов явно недостаточно. Во-вторых, не до концаразработаны авторские права на электронные публикации.
Интернет вперспективе значительно потеснит традиционные средства массовой информацииблагодаря гибкости, оперативности и интерактивности.
Сегоднямножество людей неожиданно для себя открывают для себя существование глобальныхсетей, объединяющих компьютеры во всем мире в единое информационноепространство, которое называется Internet. Что это такое, определить непросто. Стехнической точки зрения Internet – это объединение транснациональных компьютерныхсетей, работающих по различным протоколам, связывающих всевозможные типыкомпьютеров, физически передающих данные по всем доступным типам линий – отвитой пары и телефонных проводов до оптоволокна и спутниковых каналов. Большаячасть компьютеров в Internet связано по протоколу TCP/IP. Можно сказать, что Internet – это сеть сетей,опутывающая весь земной шар.
Списокрекомендуемой литературы
1. Информатика / Курносов А.П.,кулев С.В., Улезько А.В. и др.; Под ред. А.П. Курносова.-М: КолосС,2005. – 72 с. (Учебники и учеб. пособия для студентов высш. учеб.заведений)
2. Практикум поинформатике: Учеб. пособие / Под ред. Курносова А.П. – Воронеж: ВГАУ, 2004.-239 с.
3. Информатика. Учебник.– 3-е изд., перераб./ Под ред. Н.В. Макаровой. – М.: Финансы и статистика,2002. – 256 с.
4. Информатика. Базовыйкурс / Симонович С.В. и др.-Спб.: Питер, 2006. – 639 с.: ил.
5. Крупник А.Б. Поискв Интернете: самоучитель. – 2-е изд. – СПБ.: Питер, 2004. – 572 с.
6. Орлов А.А. Нужныепрограммы для Интернета – СПб.: Питер, 2006. – 127 с.
7. Солоницын Ю.А.,Холмогоров В. Интернет. Энциклопедия. – 3-е из. – СПб.: Питер, 2003. –592 с.
8. Резников Ф.А. Быстрои легко осваиваем работу в сети Интернет. – М.: Лучшие книги, 2002. –284 с.
9. Компьютерные сети исредства защиты информации: Учеб. пособие / Камалян А.К., Кулев С.А.,Назаренко К.Н. и др. – Воронеж: ВГАУ, 2003. – 119 с.
10. Олифер В.Г., Олифер Н.А. Компьютерныесети. Принципы, технологии, протоколы. – СПб.: Питер, 2002. – 672 с.:ил.
11. Интернет: Энциклопедия/ Под ред. Л. Мелиховой. – 2-е изд.-СПб.; М.; Харьков; Минск; Питер, 2000. –527 с.
12. Муштоватый И.Ф. Самоучительпо работе в Интернете/ Под общ. ред. М.И. Монастырского. – 2-е изд.,доп. и перераб.-Ростов н/Д: Феникс, 2002.-312 с.
13. Попов В. Практикум поИнтернет – технологиям: Учебный курс / В. Попов.-СПб.; М.; Харьков; Минск:Питер, 2002. – 476 с.: ил.
14. Компьютерные сети исредства защиты информации: Учебное пособие / Камалян А.К., Кулев С.А.,Назаренко К.Н. и др.-Воронеж: ВГАУ, 2003.-119 с.
15. Заика А.А. КомпьютерныеСети – М: Олма-Пресс, 2005. -448 с.
16. Компьютерные сети:Учебный курс – 2-е изд. (+CD-ROM). – MicrosoftPress, Русская редакция, 1998.
17. Основы современныхкомпьютерных технологий. Под ред. Хомоненко А.Д. – Корона-принт, СПб 1998.
18. Персональныекомпьютеры в сетях TCP/IP. Крейг Хант; перев. С англ. – BHV-Киев, 1997.
19. Федеральный законРоссийской Федерации «Об информации, информатизации и защите информации» от20.02.1995 №24-ФЗ.
20. Комер Д. Принципыфункционирования Интернета: Пер. с англ./ Д. Комер. – СПБ.; М.;Харьков; Минск: Питер, 2002.-379 с.