Министерство образования и науки РФ
Федеральное агентство по образованию
Тверской колледж имени А. Н. Коняева
Расчетно-графическая письменная работа
по практике получения первичных навыков на ПЭВМ
на теме: «Базы и банки данных»
МиньковецМарии Александровны
Студенткигруппы 2НнСК2
Тверь
2010
Содержание
Введение
Глава 1 «Введение в базы и банки данных»
1.1 Понятия базы и банка данных
1.2 Компоненты базы данных
1.3 Типология моделей
1.4 Пользователи баз данных
Глава 2 «Модели и структуры данных
2.1 Многоуровневые модели предметной области
Введение
Сегодня трудно себе представить сколько-нибудь значимуюинформационную систему, которая не имела бы в качестве основы или важнойсоставляющей базу данных. Концепции и технологии баз данных складывалисьпостепенно и всегда были тесно связанны с развитием систем автоматизированнойобработки информации. Создание баз данных после появления реляционного подходапревратилось из искусства в науку, но, как показала практика последних лет,все, же окончательно его не исключившая. Тем не менее, сейчас это вполнесложившаяся дисциплина (хотя являющаяся скорее инженерной, чем чисто научной),основанная на достаточно формализованных подходах и включающая широкий спектрприемов и методов создания баз данных.
Соответственно назначение систем управления базами данных –обеспечение в течение длительного времени их сохранности, а также возможности выборкии актуализации. Данные существуют всегда, пока есть потребность в ихиспользовании, хотя характер использования, как и пути извлечения практическойпользы могут быть самыми разными: от их использования для совершенствованиясложных систем управления до формирования «чемоданов компромата».
Базы данных в стремительно, а в какой-то степени и сумбурноразвивающихся информационных технологиях – это сравнительно консервативноенаправление, где СУБД и сами базы представляют собой «долговременныесооружения». Элементарная база ЭВМ и парадигмы программирования меняютсябыстрее, чем хранимые данные теряют актуальность. В таких условиях, в отличиеот прикладных программистов, создатели баз данных должны постоянно помнить опроблеме «наследственности»- о том, как интегрировать в создаваемую системунаследуемые данные, находящиеся под управлением устаревшей СУБД, и о том, какпостроить систему, чтобы вновь создаваемые данные могли быть, в свою очередь,наследованы следующим поколением систем и разработчиков.
Широкое использование баз данных различными категориямипользователей привело, с одной стороны, к созданию интерфейсов, требующихминимум времени на освоение средств управления системой, а с другой — кпостроению мощных, гибких СУБД, имеющих в том числе развитые средства защитыданных от случайного или намеренного разрушения. Появились и средстваавтоматизации разработки, позволяющие создать базу данных любому пользователю,даже не владеющему основами теории БД. Базы данных – это уже достаточно хорошопроработанная научная дисциплина.
Глава 1 Введение в базы и банки данных
1.1 Понятие базы и банка данных
Развитие вычислительной техники и появление емкихзапоминающих устройств прямого доступа предопределило интенсивное развитие автоматическихи автоматизированных систем разного назначения и масштаба, в первую очередьзаметное в области бизнес-приложений. Такие системы работают с большимиобъемами информации. (Рис. 1)
/>
Рисунок 1 — Схема «Автоматизированной системы»
Другими направлениями стали, с одной стороны, системыуправления физическими экспериментами, обеспечивающими сверхоперативнуюобработку в реальном масштабе времени огромных потоков данных от датчиков, а сдругой – автоматизированные библиотечные информационно-поисковые системы. Это ипривело к появлению новой информационной технологии интегрированного хранения иобработки данных – концепции баз данных, в основе которой лежит механизмпредоставления обрабатывающей программе из всех хранимых данных только тех,которые ей необходимы, и в форме, требуемой именно этой программе.
Банк данных (БнД) — это система специально организованныхданных, программных, языковых, организационных и технических средств,предназначенных для централизованного накопления и коллективного многоцелевогоиспользования данных.
Базы данных (БД) — это именованная совокупность данных, отображающаясостояние объектов и их отношения в рассматриваемой предметной области.Характерной чертой баз данных является постоянство: данные постояннонакапливаются и используются; состав и структура данных, необходимы для решениятех или иных прикладных задач, обычно постоянны и стабильны во времени;отдельные или даже все элементы данных могут меняться – но и это естьпроявления постоянства – постоянная актуальность.
Система управления базами данных (СУБД) – это совокупностьязыковых и программных средств, предназначенных для создания, ведения исовместного использования БД многими пользователями.
Иногда в составе банка данных выделяют архивы. Основанием дляэтого является особый режим использования данных, когда только часть данныхнаходится под оперативным управлением СУБД. Все остальные данные обычнорасполагаются на носителях, оперативно не управляемых СУБД. Одни и те же данныев разные моменты времени могут входить как в базы данных, так и в архивы. Банкиданных могут не иметь архивов, но если они есть, то состав банка данных можетвходить и система управления архивами.
Эффективное управление внешней памятью являются основнойфункцией СУБД. Эти обычно специализированные средства настолько важны с точкизрения эффективности, что при их отсутствии система просто не сможет выполнятьнекоторые задачи уже по тому, что их выполнение будет занимать слишком многовремени. При этом ни одна из таких специализированных функций, как построениеиндексов, буферизация данных, организация доступа и оптимизация запросов, неявляется видимой для пользователя и обеспечивает независимость между логическими физическим уровнями системы: прикладной программист не должен писатьпрограммы индексирования, распределять память на диске и т. д.
Развитие теории и практики создания информационных систем,основанных на концепции баз данных, создание унифицированных методов и средстворганизации и поиска данных позволяют хранить и обрабатывать информацию о всеболее сложных объектах и их взаимосвязях, обеспечивая многоаспектные информационныепотребности разных пользователей. Основные требования, предъявляемые к банкамданных, можно сформулировать так:
Многократное использование данных: пользователи должны иметьвозможность использовать данные различным образом.
Простота: пользователи должны иметь возможность легко узнатьи понять, какие данные имеются в их распоряжении.
Легкость использования: пользователи должны иметь возможностьосуществлять (процедурно) простой доступ к данным, при этом все сложности доступак данным должны быть скрыты в самой системе управления базами данных.
Гибкость использования: обращение к данным или их поискдолжны осуществляться с помощью различных методов доступа.
Быстрая обработка запросов на данные: запросы на данные,должны обрабатываться с помощью высокоуровневого языка запросов, а не толькоприкладными программами, написанными с целью обработки конкретных запросов.
Язык взаимодействия конечных пользователей с системой долженобеспечивать конечным пользователям возможность получения данных безиспользования прикладных программ.
База данных – это основа для будущего наращивания прикладныхпрограмм: базы данных должны обеспечивать возможность быстрой и дешевойразработки новых приложений.
Сохранение затрат умственного труда: существующие программы илогические структуры данных не должны переделываться при внесении изменений вбазу данных.
Наличие интерфейса прикладного программирования: прикладныепрограммы должны иметь возможность просто и эффективно выполнять запросы наданные; программы должны быть изолированными от расположения файлов и способовадресации данных.
Распределенная обработка данных: система должнафункционировать в условиях вычислительных сетей и обеспечивать эффективныйдоступ пользователей к любым данным распределенной БД, размещенным в любойточке сети.
Адаптивность и расширяемость: база данных должна бытьнастраиваемой, причем настройка не должна вызывать перезаписи прикладныхпрограмм. Кроме того, поставляемый с СУБД набор предопределенных типов данныхдолжен быть расширяемым – в системе должны иметься средства для определенияновых типов и не должно быть различий в использовании системных и определенныхпользователем типов.
Контроль за целостностью данных: система должна осуществлятьконтроль ошибок в данных и выполнять проверку взаимного логическогосоответствия данных.
Восстановление данных после сбоев: автоматическоевосстановление без потери данных транзакции. В случае аппаратных илипрограммных сбоев система должна возвращаться к некоторому согласованномусостоянию данных.
Вспомогательные средства должны позволять разработчику илиадминистратору базы данных предсказать и оптимизировать производительностьсистемы.
Автоматическая реорганизация и перемещение: система должнаобеспечивать возможность перемещения данных или автоматическую реорганизациюфизической структуры.
1.2 Компоненты банка данных
Определение банка данных предполагает, что с функционально-организационнойточки зрения банк данных является сложной человеко-машинной системой,включающей в себя все подсистемы, необходимые для надежного, эффективного ипродолжительного во времени функционирования.
В структуре банка данных выделяют следующие компоненты:
· Информационнаябаза;
· Лингвистическиесредства;
· Программныесредства;
· Техническиесредства;
· Организационно-административныеподсистемы и нормативно-методическое обеспечение.
1.3 Типология моделей /> /> /> /> /> /> /> /> />
1.4Пользователи баз данных
Винформационных системах, создаваемых на основе СУБД, способы организации данныхи методы доступа к ним перестали играть решающую роль, поскольку оказалисьскрытыми внутри СУБД. Массовый, так называемый конечный пользователь, как правило, имеет дело только свнешним интерфейсом, поддерживаемым СУБД.
Этипреимущества, как уже понятно, не могут быть реализованы путем механическогообъединения данных в БД. Предполагается, что в системе обязательно существуетспециальное должностное лицо (группа лиц) — администратор базы данных (АБД), который несет ответственность запроектирование и общее управление базой данных. АБД определяет информационноесодержание БД. С этой целью он идентифицирует объекты БД и моделирует базу,используя язык описания данных. Получаемая модель служит в дальнейшем справочником администраторов приложений ипользователей. Администратор решает также все вопросы, связанные с размещениемБД в памяти, выбором стратегии и ограничений доступа к данным. В функции АБДвходят также организация загрузки, ведения и восстановления БД и многие другиедействия, которые не могут быть полностью формализованы и автоматизированы.
Администратор приложений (или, если таковой специально невыделяется — администратор БД) определяет для приложений подмодели данных. Темсамым разные приложения обеспечиваются собственным «взглядом», но не на всю БД,а только на требуемую для конкретного приложения («видимую») ее часть. Всяостальная часть БД для данного приложения будет «прозрачна».
Прикладныепрограммисты имеют, как правило, в своем распоряжении один или несколькоязыков программирования, с помощью которых генерируются прикладным документом.
Глава 2. Модели и структурыданных
Рассматриваемыев контексте понятия «информационная система» элементы реального мира,информацию о которых мы сохраняем и обрабатываем, будем называть объектами. Объект может быть материальным (например,служащий, изделие или населенный пункт) и нематериальным (например, имя,понятие, абстрактная идея). Будем называть набором объектов совокупность объектов, однородных снекоторой точки зрения (например, объектов нашего внимания, пусть даже и разнородных по своей внутреннейприроде).
Объект имеетразличные свойства (например, цвет, вес, имя), которые важны для нас в товремя, когда мы обращаемся к объекту (например, выбираем среди множествадругих) с какой-либо целью его использования. Причем свойства могут быть заданыкак отдельными однозначно интерпретируемыми количественными показателями, так исловесными нечеткими описаниями, допускающими разную трактовку, иногдазависящую от точки зрения и наличных знаний воспринимающего субъекта.
Однако вовсех случаях человек, работая с информацией, имеет дело с абстракцией, представляющей интересующий егофрагмент реального мира — той совокупностью характеристических свойств (атрибутов), которые важныдля решения его прикладной задачи! Абстрагирование — это способ упрощения совокупности фактов, относящихся креальному объекту (по своей сути бесконечно сложному и разнообразному приизучении его человеком). При этом некоторые свойства объекта игнорируются,поскольку считается, что для решения данной прикладной задачи (или совокупностизадач) они не являются определяющими и не влияют на конечный результат!действий при решении.
Цель такогоабстрагирования — построение конструктивного операбельного описания (рабочеймодели), удобного в обработке как для человека, так и для машины, позволяющегоорганизовать эффективную обработку больших объемов информации, причемвысокопроизводительной должна быть работа не только вычислительной системы, нои взаимодействующего с ней человека.
2.1 Многоуровневыемодели предметной области
Обычноотдельная база данных содержит (отражает) информацию о некоторой предметной области — наборе объектов, представляющихинтерес для актуальных или предполагаемых пользователей. То есть, реальный мир отображается совокупностью конкретных иабстрактных понятий, между которыми существуют (и соответственно, фиксируются)определенные связи. Выбор для описания предметной области существенных понятийи связей является предпосылкой того, что пользователь будет иметь практически все необходимые ему в рамках задачи знания обобъектах предметной области. Однако следует отметить, что пользователь, которыйхочет работать с базой данных, должен владетьосновными понятиями, представляющими предметную область.
И в этомсмысле абстрагирование позволяет построить такое описание (модель предметнойобласти), которое другой человек сможет не только воспринять, но и безошибочноиспользовать для работы с описаниями экземпляров объектов, хранимых в базеданных. Модель предметной области соотносится с реальными объектами и связямитак же, как схема маршрутов городского Пассажирского транспорта с фактическойтраекторией движения автобуса. Схема адекватно отражает действительность науровне Основных понятий — маршрутов и остановок: выбрав по схеме маршрут,пассажир достигнет цели (прибудет на нужную остановку) независимо от того, вкаком транспортном ряду будет двигатьсяавтобус.
Наиболеепростой способ представления предметных областей в БД реализуется поэтапно: 1)фиксацией логической точки зрения на данные (т.е. данные рассматриваются независимо от особенностей ИХ хранения и поиска вконкретной вычислительной среде); 2)определением физического представления данных с учетом выбранных структур хранения данных иархитектуры ЭВМ.
Абстрагированноеописание предметной области с фиксированной (логической) точки зрения будемназывать концептуальной схемой. Соответственно, систематизация понятий и связей предметнойОбласти называется логическим или концептуальным проектированием Модель (представление логическойточки зрения), используемая при абстрагировании — совокупность функциональныххарактеристик объектов и особенностей представления информации (например, вчисловой или текстовой форме), будем называть моделью донных.
Отображениеконцептуальной схемы на физический уровень будем называть внутренней схемой.
Отражениевзгляда (точки зрения) отдельного пользователя на концептуальную схему (каквариант восприятия предметной области) будем называть внешней схемой. Внешняя схема использует те жеабстрактные категории, что и концептуальная, а на практике соответствуетлогической организации данных в прикладной программе.
Теоретическивопрос о многообразии уровней абстракции был решен еще в 60—70-х гг. Основойдля его решения является концепция многоуровневой архитектуры системы базыданных. Например, в отчете предусматривался архитектурный уровень подсхемы,который позволял для каждого конкретного приложения строить свое собственное«видение» используемого подмножества базы данных путем определения его«персональной» подсхемы базы данных.
В более общемвиде этот вопрос решен в архитектурной модели! Здесь на внешнем уровне можетподдерживаться совсем иная модель данных (или даже несколько моделей)! чем наконцептуальном уровне. Поддержка разнообразных возможностей абстрагированияв такой системе достигается благодари средствам определения и поддержкимежуровневого отображений моделей данных.
Помимо этого,для решения указанной проблемы может использоваться внутри модельная структура,например, механизмы представлений(view). ). Вобъектных системах для этих целей может использоваться отношение наследования.
В общемслучае концепция трехуровневого представления не требует более трех уровней,однако с практической точки зрения иногда удобно включать схемы дополнительныхуровней, приведены некоторые варианты решений.
Рассмотреннаятрехуровневая архитектура обеспечивает выполнение основных требований,предъявляемых к системам баз данных:
• адекватность отображения предметной области;
• возможность взаимодействия с БД разных пользователей прирешении разных прикладных задач;
• обеспечение независимостипрограмм и данных;
• надежность функционирования БД изащита от несанкционированного доступа.
С точки зрения пользователейразличных категорий трехуровневая архитектура имеет следующие достоинства:
• системный аналитик, создающиймодель предметной области, не обязательно должен быть специалистом в областипрограммирования и вычислительной техники;
• администратор баз данных,обеспечивающий отражение концептуальной схемы во внутреннюю, не должен беспокоитьсяо корректности представления предметной области;
• конечные пользователи, используявнешнюю схему, могут не] вдаваться полностью в предметную область, обращаясьтолько к необходимым составляющим. При этом исключается возможностьнесанкционированного обращения к данным объявленных внешней схемой, так какформирование ее находится в сфере деятельности администратора базы данных;
• системный аналитик, как иконечный пользователь, не вмешивается во внутреннее представление данных.
Это отражает распространеннуюпрактику специализации и разделения ответственности. Главное же заключается втом, что работу по проектированию и эксплуатации баз данных можно разделить натри достаточно самостоятельных этапа. Хотя надо отметить, что на практикесоздание концептуальной схемы не всегда предшествует построению внешней. Иногдатрудно с самого начала полностью определить предметную область, но с другойстороны, уже известны требования пользователей (именно поэтому создание базыуже имеет смысл). И кроме того, адекватность модели предметной области, в концеконцов, должна подтверждаться практикой пользовательских представлений.
2.2Идентификация объектов и записей
В задачах обработки информации, ив первую очередь в алгоритмизации и программировании, атрибуты именуют (обозначают)и приписывают им значения.
При обработке информации мы, такили иначе, имеем дело с совокупностью объектов, информацию о свойствах каждого из котoрых надо сохранять (записывать)как данные, чтобы при решении задач их можно было найти ивыполнить необходимые преобразования.
Таким образом, любое состояниеобъекта характеризуется совокупностью актуализированных атрибутов (имеющихнекоторое из значений в этот момент времени), которые фиксируются на некоторомматериальном носителе в виде записи — совокупности (группы)формализованных элементов данных (значений атрибутов,представленных в том или ином формате). Кроме того, в контексте задач храненияи поиска можно говорить, что значение атрибута идентифицирует объект: использование значения в качестве поисковогопризнака позволяет реализовать простой критерий отбора по условию сравнения.
Так же как и в реальном мире,отдельный объект всегда уникален (уже хотя бы потому, что мы именно его выделяем среди других). Соответственно, запись, содержащаяданные о нем, также должна быть узнаваема однозначно (по крайней мере, в рамкахпредметной области), т. е. иметь уникальный идентификатор, причем никакойдругой объект не должен иметь такой же идентификатор. Поскольку идентификатор —суть значение элемента данных, в некоторых случаях для обеспечения уникальноститребуется использовать более одного элемента. Например, для однозначнойидентификации записей о дисциплинах учебного плана необходимо использоватьэлементы СЕМЕСТР и НАИМЕНОВАНИЕ ДИСЦИПЛИНЫ, так как возможно преподавание однойдисциплины в разных семестрах.
Предложенная выше схемапредставляет атрибутивный способ идентификации содержания объекта (рис. 3.3).Она является достаточно естественной для данных, имеющих фактографическуюприроду и описывающих обычно материальные объекты. Информацию, представляемуютакого рода данными, называют хорошо 1структурированной. Здесь важно отметить, что структурированность относится нетолько к форме представления данных (формат, способ хранения),но и к способу интерпретации значения пользователем', значение параметра не только представлено в предопределенной форме,но и обычно сопровождается указанием размерности величины, что позволяет пользователю понимать ее смысл бездополнительных комментариев. Таким образом, фактографические данныепредполагают возможность их непосредственной интерпретации.
Однако атрибутивный способпрактически не подходит для идентификации слабоструктурированной информации, связанной d объектами, имеющими обычно идеальную (умозрительную) природу —категориями, понятиями, знаковыми системами. Такие объекты зачастуюопределяются логически и опосредованно — через другие объекты. Для описаниятаких объектов используются естественные или искусственные языки (например,язык алгебры)! Соответственно, для понимания смысла пользователю необходимоиспользовать соответствующие правила языка, и, более того, чаете! необходимоуже располагать некоторой информацией, позволяю щей идентифицировать и связатьполучаемую информацию с наличным знанием. То есть процесс интерпретации такогорода данных имеет опосредованный характер и требует использования дополнительной информации,причем такой, которая не обязательна присутствует в формализованном виде в базеданных.
Такое разделение нашло отражениев традиционном разделении баз данных на фактографические и документальные.
2.3 Поиск записей
Программисту или пользователюнеобходимо иметь возможности обращаться к отдельным, нужным ему записям илиотдельным элементам данных. В зависимости от уровня программного обеспеченияприкладной программист может использовать следующие способы.
• Задать машинный адрес данных и всоответствии с физическим форматом записи прочитать значение. Это случай, когдапрограммист должен быть «навигатором».
• Сообщить системе имя записи илиэлемента данных, которые он хочет получить, и возможно, организацию набораданных. В этом случае система сама произведет выборку (по предыдущей схеме), нодля этого она должна будет использовать вспомогательную информацию о структуреданных и организации набора. Такая информация по существу будет избыточной поотношению к объекту, однако общение с базой данных не будет требовать отпользователя знаний программиста и позволит переложить заботы о размещенииданных на систему.
В качестве ключа, обеспечивающегодоступ к записи, можно использовать идентификатор — отдельный элемент данных.Ключ, который идентифицирует запись единственным образом, называется первичным(главным).
В том случае, когда ключидентифицирует некоторую группу записей, имеющих определенное общее свойство,ключ называется вторичным набором данных может иметь нескольковторичных ключей, необходимость введения которых определяется практическойнеобходимостью — оптимизацией процессов нахождения записей по соответствующемуключу.
Иногда в качестве идентификатораиспользуют составной сцепленный ключ — несколько элементов данных,которые в совокупности, например, обеспечат уникальность идентификации каждойзаписи набора данных.
При этом ключ может храниться всоставе записи или отдельно. Например, ключ для записей, имеющих неуникальныезначения атрибутов, для устранения избыточности целесообразно хранить отдельно.На рис. 3.4 приведены два таких способа хранения ключей и атрибутов для наборапростейшей структуры.
Введенное понятие ключа являетсялогическим и его не следует путать с физической реализацией ключа — индексом, обеспечивающим доступ к записям,соответствующим отдельным значениям ключа.
Один из способов использованиявторичного ключа в качестве хода — организация инвертированного списка, каждыйвход которого содержит значение ключа вместе со списком идентификаторов Соответствующихзаписей. Данныев индексе располагаются в возрастающем или убывающем порядке, поэтому алгоритмнахождения нужногозначения довольно прост и эффективен, а после нахождения значения записьлокализуется по указателю физического расположения. Недостатком индексаявляется то, что он занимает дополнительное пространство и его надо обновлятькаждый раз, когда удаляется, обновляется или добавляется запись. На рис. 3.5приведен инвертированный список для предыдущего примера.
В общемслучае инвертированный список может быть построен для любого ключа, в том числесоставного.
1) А(Е) =?Каково значение атрибута А для объекта Е?
2) А(?) В V Какиеобъекты имеют значение атрибута, равное VI
3) ?(Е) = VКакие атрибуты объекта Е имеют значение, равное V|
4) ?(Е) =?Какие значения атрибутов имеет объект Е?
5) А(?) =?Какие значения имеет атрибут А в наборе?
6)?(?) В V Какие атрибуты объектов набораимеют значение, равное V?
Здесь взапросах типов 2, 3, 6 вместо оператора равенства может быть использован другойоператор сравнения (больше, меньше, не равно или другие).
Запросы типа1 выполняются поиском по «прямому» массиву: доступ к записи производится попервичному ключу. Запросы типа 2 выполняются поиском по инвертированномусписку: доступ к записном) производится по указателю, выбираемому из списка позначению вторичного ключа. Ответом в этих случаях будет значение атрибута илиидентификатора. Запросы типа 3 имеют ответом имя атрибута.Запросы типа 2, 5, 6 относятся к нескольким атрибутам, и в этом случае могутбыть построены несколько индексов, облегчающих поиск по этим ключам.
Составные условия поиска могутиспользовать несколько простых условий, обычно связанных логическими (булевыми)операторами.
Следуетотметить, что в контексте обработки запросов 2-го типа «Какие объекты имеютзаданное значение атрибута?» можно выделить три следующих типа архитектурдоступа.
1. Системы с вторичными индексами. В этихсистемах последовательность расположения записей соответствуетпоследовательности Значений первичного ключа. Как правило, используется одинпервичный индекс и несколько вторичных.
2. Системы частично инвертированныхфайлов. В этих системах записи могут располагаться в произвольнойпоследовательности. В отличие от систем первого типа первичный индексотсутствует. Вторичные индексы применяются для прямой адресации записей, Чтосущественно облегчает включение в файл новых записей, так Как допускается ихразмещение в любом свободном участке файла.
3. Системыполностью инвертированных файлов. В этих системах Предусмотрено наличиефайлов, содержащих значения отдельных элементов данных, входящих в составзаписей, — допускается раздельное хранение элементов данных записи. Значенияэлементов данных, составляющих конкретную запись или кортеж, в общем случаемогут размещаться в памяти произвольно. Для ускорения Процесса поиска в системеиспользуют два набора индексов: индекс экземпляров (значений ключей) и индекс данных (инвертированныйсписок). С помощью индекса экземпляров можно найти в файле элементыданных, имеющих заданное значение. С помощью индекса данных можно найти записи,связанные с заданными значениями элементов. Такая организация характерна дляорганизации данных документальных информационныхсистем.
2.4 Представление предметнойобласти и модели данных
Если быназначением базы данных было только хранение и поиск данных в массивах записей,то структура системы и самой базы была бы простой. Причина сложности в том, чтопрактически любой объект характеризуется не только параметрами-величинами, но ивзаимосвязями частей или состояний. Есть различия и в характере взаимосвязеймежду объектами предметной области: одни объекты могут использоваться толькокак характеристики остальных объектов, другие — независимы и имеютсамостоятельное значение
Кроме того,сам по себе отдельный элемент данных (его значение) ничего не представляет. Онприобретает смысл только тогда, когда связан с атрибутом (природой значения,что позволит интерпретировать значение) и другими элементами данных.
Поэтомуфизическому размещению данных (и, соответственно, определению структурыфизической записи) должно предшествовать описание логической структурыпредметной области — построение модели соответствующегофрагмента реального мира, выделяющей только те объекты, которые будут интересныбудущим пользователям, и представленные только теми параметрами, которые будутзначимы при решении прикладных задач.
2.5 Структуры данных
При любомметоде отображения предметной области в машинных базах данных в основеотображения лежит фиксация (кодирование) Понятий и отношений между понятиями.Абстрактное понятие структурыближе всего к так называемой концептуальной модели Предметной среды ичасто лежит в основе последней.
Понятие структурыиспользуется на всех уровнях представления Предметной области и реализуетсякак:
• структура информации — схематичнаяформа представления сложных композиционных объектов и связей реальнойпредметной области, выделяемых как актуально необходимые для решения прикладныхзадач;
• структура данных —атрибутивная форма представления свойств и связей предметной области,ориентированная на выражение описания данных средствами формальных языков (т.е. учитывающая возможности и ограничения конкретных средств с целью сведенияописаний к стандартным типам и регулярным связям);
структура записей — целесообразная(учитывающая особенности физической среды) реализация способов хранения данныхи организации доступа к ним как на уровне отдельных записей,так и их элементов (сцелью определения основных и вспомогательных функциональных массивов, а такжесовокупности унифицированных процедур манипулирования данными). Структураявляется общепринятым и удобным инструментом, одинаково эффективно используемымкак на уровне сознания человека при работе с абстрактными понятиями, так и науровне логики машинных алгоритмов. Структура позволяет простыми способамисвести многомерность содержательного описания к линейной последовательностизаписей. Именно это позволяет формализовать на общей понятийной основевзаимосвязь представлений информации в разных средах: обеспечить контролируемоесведение бесконечного разнообразия объектов и видов взаимосвязей реального мирак жестко детерминированному описанию — совокупности двоичных данных имашинно-ориентированных алгоритмов их обработки.
Выделение трех видов структур,относящихся к представлению объектов предметной области, имеет, в некоторомсмысле, принципиальный характер.
Структураинформации —это неотъемлемое свойство информации (сведений, сигналов, воспринимаемыхсубъектом) о некоторой совокупности объектов предметной области в контекстепрактической задачи (решаемой субъектом), в общем случае без учета того, будутли для ее решения использованы средства программирования и вычислительныемашины. Структурирование информации осуществляется системным аналитиком исводится к выделению операционных объектов и определению их характеристическихсвойств и взаимосвязей.
Структураданных —это определение информационных массивов (состава и взаимосвязей данных налогическом уровне, соответствующих характеру информации и видам соответствующихпреoбразований). При определенииструктур данных необходимо не только установить состав массива, но и определитьоптимальную взаимосвязь (и, соответственно, определить критерии и методы оценкиэффективности), например, выделение групп или агрегатовj имеющих иерархическуюидентификацию. Эффективность в этом, случае связывается с процессом построенияпрограммы («решателя» прикладной задачи) и, в каком-то смысле — сэффективностью работы программиста. Например, прифункциональной обработке массива необходимо обращаться к отдельным элементам, вто время? как в операциях присваивания или при записи массива в файл элементноеобращение приведет к увеличению размера текста программы,а в ряде случаев — к увеличению времени выполнения.
Структуразаписи — этоопределение структуры физической памяти: выделение, освобождение и защитаобластей физического носителя, способы адресации ипересылки. Эффективность в этом случае связывается с процессами обмена междуустройствами оперативной и внешней памяти, искусственно вводимой дляобеспечения функциональной эффективности отдельныхопераций (например, поиска по ключам) посредством избыточности данных.
Рассмотрим разновидности и типологию«компьютерных» логических структур данных с точки зрения особенности ихорганизации. Структура здесь в первую очередь определяет алгоритм выборкиотдельных элементов данных, но в то же время необходимо отметить, что онаотражает и особенности «технологии» организации и обработки информации,свойственные человеку в его повседневной деятельности.
Физически понятию структура соответствует запись данных.Запись — этоупорядоченная в соответствии с характером взаимосвязей совокупность полей (элементов) данных, размещаемых впамяти в соответствии с их типом. Поле представляет собойминимальную адресуемую (идентифицируемую) часть памяти — единицу данных, накоторую можно ссылаться при обращении к данным.
Таким образом, структура данных —это способ отображения значений в памяти: размер области и порядок ее выделения(который и определит характер процедуры адресации/выборки). Зачастую именноуспешность структурирования данных определяет сложность процедур их обработки[2].
Классификация структур данныхдолжна проводиться с двух точек зрения.
1. Похарактеру взаимосвязи элементов структуры (с точки зрения порядка ихразмещения/выборки) виды структур можно разделить на линейные и нелинейные.