Каково назначение процесса накопления?
Назначение информационного процесса накопления данныхсостоит всоздании, хранении и поддержании в актуальном состоянииинформационного фонда, необходимого для выполнения функциональных задач системы управления, для которой построен контур информационной технологии.
Кроме того, хранимые данные по запросу пользователя или программы должны быть быстро (особенно для систем реального времени) и в достаточном объеме извлечены из области хранения и переведены в оперативные запоминающие устройства ЭВМ для последующего либо преобразования по заданным алгоритмам, либо отображения, либо передачи.
Указанные функции, выполняемые в процессе накопления данных, реализуются по алгоритмам, разработанным на основе соответствующих математических моделей.
Перечислите состав и определите назначение процедур процесса накопления.
Процесс накопления данных состоит из таких процедур, как выбор хранимых данных, хранение данных, их актуализация и извлечение.
Информационный фонд систем управления должен формироваться на основе принципов необходимой полноты и минимальной избыточности хранимой информации.
Эти принципы реализуются процедурой выбора хранимых данных, в процессе выполнения которой проводится анализ циркулирующих в системе данных, и на основе их группировки на входные, промежуточные и выходные, определяется состав хранимых данных.
Входные данные — это данные, получаемые из первичной информации и создающие информационный образ предметной области. Они подлежат хранению в первую очередь.
Промежуточные данные — это данные, формирующиеся из других данных при алгоритмических преобразованиях. Как правило, они не хранятся, но накладывают ограничения на емкость оперативной памяти компьютера.
Выходные данные являются результатом обработки первичных (входных) данных по соответствующей модели, они входят в состав управляющего информационного потока своего уровня и подлежат хранению в определенном временном интервале.
Вообще, данные имеют свой жизненный цикл существования, который фактически и отображается в процедурах процесса накопления.
Процедуры хранения, актуализации и извлечения данных должны периодически сопровождаться оценкой необходимости их хранения, так как данные подвержены старению. Устаревшие данные должны быть удалены.
Процедура хранения состоит в том, чтобы сформировать и поддерживать структуру хранения данных в памяти ЭВМ. Современные структуры хранения данных должны быть независимы от программ, использующих эти данные, и реализовывать принципы - полнота и минимальная избыточность.
Такие структуры получили название баз данных. Процедуры создания структуры хранения, актуализации, извлечения и удаления данных осуществляются с помощью специальных программ, СУБД систем управления базами данных.
Процедура актуализации данных позволяет изменить значения данных, записанных в базе, либо дополнить определенный раздел, группу данных. Устаревшие данные могут быть удалены с помощью соответствующей операции.
Процедура извлечения данных необходима для пересылки из базы данных требующихся данных либо для преобразования, либо для отображения, либо для передачи по вычислительной сети.
При выполнении процедур актуализации и извлечения обязательно выполняются операции поиска данных по заданным признакам и их сортировки, состоящие в изменении порядка расположения данных при их хранении или извлечении.
На логическом уровне все процедуры процесса накопления должны быть формализованы, что отображается в математических и алгоритмических моделях этих процедур.
Что такое инфологическая модель предметной области?
Информационный фонд системы управления должен обеспечивать получение выходных наборов данных из входных с помощью алгоритмов обработки и корректировки данных. Это возможно, если создана инфологическая модель предметной области, которая вместе с наборами хранимых данных и алгоритмами их обработки позволяет построить каноническую модель (схему) информационной базы, а затем перейти к логической схеме и далее — к физическому уровню реализации.
Инфологической (концептуальной) моделью предметной области называют описание предметной области без ориентации на используемые в дальнейшем программные и технические средства.
Однако для построения информационной базы инфологической модели недостаточно. Необходимо провести анализ информационных потоков в системе в целях установления связи между элементами данных, их группировки в наборы входных, промежуточных и выходных элементов данных, исключения избыточных связей и элементов данных.
Получаемая в результате такого анализа без-избыточная структура носит название канонической структуры информационной базы и является одной из форм представления инфологической модели предметной области.
Дайте формализованное описание модели выбора хранимых данных.
Для анализа информационных потоков в управляемой системе исходными являются данные о парных взаимосвязях, или отношениях (т.е. есть отношение или нет отношения), между наборами информационных элементов.
Под информационными элементами понимают различные типы входных - N1, промежуточных - N2 и выходных - N3 данных, которые составляют наборы входных, промежуточных и выходных элементов данных.
Формализовано связи (парные отношения) между наборами информационных элементов отображаются в виде матрицы смежности В, квадратной бинарной матрицы, проиндексированной по обеим осям множеством информационных элементов D = {d1, d2, .,ds}, где s — число этих элементов:
В позиции (i,j ) матрицы смежности записывают 1 (т.е. qi j = 1), если между информационными элементами di и dj существует отношение rо, такое, что для получения значения информационного элемента dj необходимо непосредственное обращение к элементу di .
Наличие отношения между di и dj обозначают в виде, di rо dj т.е. q i j =1 ,
а отсутствие отношения — в виде di dj
Для простоты принимают, что каждый информационный элемент недостижим из самого себя: di = di ; i=
Например, задано множество D из четырех наборов информационных элементов, т.е. D = { d1, d2, d3, d4 }. Пусть матрица смежности В этих элементов имеет вид:
Нарисуйте информационный граф и объясните его назначение.
Для анализа информационных потоков в управляемой системе исходными являются данные о парных взаимосвязях, или отношениях (т.е. есть отношение или нет отношения), между наборами информационных элементов.
Под информационными элементами понимают различные типы входных - N1, промежуточных - N2 и выходных - N3 данных, которые составляют наборы входных, промежуточных и выходных элементов данных.
Формализовано связи (парные отношения) между наборами информационных элементов отображаются в виде матрицы смежности В, квадратной бинарной матрицы, проиндексированной по обеим осям множеством информационных элементов D = {d1, d2, .,ds}, где s — число этих элементов:
В позиции (i,j ) матрицы смежности записывают 1 (т.е. qi j = 1), если между информационными элементами di и dj существует отношение rо, такое, что для получения значения информационного элемента dj необходимо непосредственное обращение к элементу di .
Наличие отношения между di и dj обозначают в виде, di rо dj т.е. q i j =1 ,
а отсутствие отношения — в виде di dj
Для простоты принимают, что каждый информационный элемент недостижим из самого себя: di = di ; i=
Матрице В ставится в соответствие информационный граф G = (D,rо). Множеством вершин графа G = (D,rо) является
множество D информационных элементов,
а каждая дуга di,dj соответствует условию di rо dj, т.е. записи 1 в позиции (i,j ) матрицы смежности В.
Например, задано множество D из четырех наборов информационных элементов, т.е. D = { d1, d2, d3, d4 }. Пусть матрица смежности В этих элементов имеет вид:
матрица смежности В Информационный граф
для этого примера G = (D,Ro) для этого примера
Из этой матрицы видно, что для вычисления элемента
d3 необходимо обращение к элементам d1 и d2, d4 — к элементу d3. Чтобы получить элемент d1, надо обратиться к d3- Элемент d2 не зависит от других элементов матрицы.
В общем случае, структура графа G = (D,R0) сложна для восприятия и анализа. Составленная на основе инфологической модели структура графа, не гарантирована от неточностей, ошибок, избыточности.
Для формального выделения входных, промежуточных и выходных наборов информационных элементов, определения последовательности операций их обработки, анализа и уточнения взаимосвязей на основе графа G = (D,Ro) строят матрицу достижимости.
Чем отличаются матрицы достижимости и смежности?
Для анализа информационных потоков в управляемой системе исходными являются данные о парных взаимосвязях, или отношениях (т.е. есть отношение или нет отношения), между наборами информационных элементов.
Под информационными элементами понимают различные типы входных - N1, промежуточных - N2 и выходных - N3 данных, которые составляют наборы входных, промежуточных и выходных элементов данных.
Формализовано связи (парные отношения) между наборами информационных элементов отображаются в виде матрицы смежности В, квадратной бинарной матрицы, проиндексированной по обеим осям множеством информационных элементов D = {d1, d2, .,ds}, где s — число этих элементов:
В позиции (i,j ) матрицы смежности записывают 1 (т.е. qi j = 1), если между информационными элементами di и dj существует отношение rо, такое, что для получения значения информационного элемента dj необходимо непосредственное обращение к элементу di .
Наличие отношения между di и dj обозначают в виде, di rо dj т.е. q i j =1 ,
а отсутствие отношения — в виде di dj
Для простоты принимают, что каждый информационный элемент недостижим из самого себя: di = di ; i=
Матрицей достижимости М называют квадратную бинарную матрицу, проиндексированную по обеим осям множеством информационных элементов D аналогично матрице смежности В. Запись 1 в каждой позиции (i,j ) матрицы достижимости соответствует наличию для упорядоченной пары информационных элементов (di, dj) смыслового отношения достижимости R. Элемент dj достижим из элемента di , т.е.
выполняется условие di rо dj, если на графе G = (D,Ro) существует направленный путь от вершины di к вершине dj ( в процессе получения значения элемента dj используется значение элемента di ).
Если di dj , то отношение достижимости между элементами di и dj отсутствует и в позиции (i,j ) матрицы М записывают 0.
Записи 1 в j -м столбце матрицы М соответствуют информационным элементам di , которые необходимы для получения значений элементов dj и образуют множество элементов предшествования A(di ) для этого элемента. Записи 1 в i-й строке матрицы М соответствуют всем элементам dj , достижимым из рассматриваемого элемента di и образующим множество достижимости rоdj этого элемента.
Информационные элементы, строки которых в матрице М не содержат единиц (нулевые строки), являются выходными информационными элементами, а информационные элементы, соответствующие нулевым столбцам матрицы М, являются входными. Это условие может служить проверкой правильности заполнения матриц В и М, если наборы входных и выходных информационных элементов известны. Информационные элементы, не имеющие нулевой строки или столбца, являются промежуточными.
Для рассматриваемого примера матрицы В и М выглядят так:
Отличие столбцов матриц М и В объясняется тем, что в матрице М учитывается смысловое отношение R между информационными элементами, а в матрице В — только непосредственно rо. Например, элемент d4 в матрице М достижим из элементов d1, d2 и d3 т.е. d1 r d4, d2 r d4 и d3 r d4 , в то время как в матрице В для этих элементов d4 достижим только из d3, т.е. только d3 r0 d4.
Из анализа матрицы М следует, что элемент d2 является входным ( нулевой столбец ), d4— выходным (нулевая строка), остальные — промежуточные.
В чем состоит отличие входных, промежуточных и выходных наборов данных? Какие из них подлежат хранению?
Для анализа информационных потоков в управляемой системе исходными являются данные о парных взаимосвязях, или отношениях (т.е. есть отношение или нет отношения), между наборами информационных элементов.
Под информационными элементами понимают различные типы входных - N1, промежуточных - N2 и выходных - N3 данных, которые составляют наборы входных, промежуточных и выходных элементов данных
Матрицей достижимости М называют квадратную бинарную матрицу, проиндексированную по обеим осям множеством информационных элементов D аналогично матрице смежности В. Запись 1 в каждой позиции (i,j ) матрицы достижимости соответствует наличию для упорядоченной пары информационных элементов (di, dj) смыслового отношения достижимости R. Элемент dj достижим из элемента di , т.е.
выполняется условие di rо dj, если на графе G = (D,Ro) существует направленный путь от вершины di к вершине dj ( в процессе получения значения элемента dj используется значение элемента di ).
Если di dj , то отношение достижимости между элементами di и dj отсутствует и в позиции (i,j ) матрицы М записывают 0.
Записи 1 в j -м столбце матрицы М соответствуют информационным элементам di , которые необходимы для получения значений элементов dj и образуют множество элементов предшествования A(di ) для этого элемента. Записи 1 в i-й строке матрицы М соответствуют всем элементам dj , достижимым из рассматриваемого элемента di и образующим множество достижимости rоdj этого элемента.
Информационные элементы, строки которых в матрице М не содержат единиц (нулевые строки), являются выходными информационными элементами, а информационные элементы, соответствующие нулевым столбцам матрицы М, являются входными. Это условие может служить проверкой правильности заполнения матриц В и М, если наборы входных и выходных информационных элементов известны. Информационные элементы, не имеющие нулевой строки или столбца, являются промежуточными.
На основе матрицы М строится информационный граф gs (D,R) системы, структурированный по входным N1, промежуточным N2 и выходным N3 наборам информационных элементов и полученный из анализа множества элементов предшествования A(d i ) и достижимости R (d j ).
В общем случае информационный граф системы в отличие от вычисленного графа может иметь контуры и петли, что объясняется необходимостью повторного обращения к отдельным элементам данных.
Информационный граф системы gs (D,R) структурируется по уровням (N1, N2, N3,) с использованием итерационной процедуры, что позволяет определить информационные входы ( N1 ) и выходы ( N3 ) системы, выделить основные этапы обработки данных, их последовательность и циклы обработки на каждом уровне. Кроме того, удаляются избыточные (лишние) дуги и элементы. Граф, получаемый после структуризации по наборам информационных элементов и удаления избыточных элементов и связей, определяет каноническую структуруинформационной базы.
Что такое каноническая структура информационной базы?
Для анализа информационных потоков в управляемой системе исходными являются данные о парных взаимосвязях, или отношениях (т.е. есть отношение или нет отношения), между наборами информационных элементов.
Под информационными элементами понимают различные типы входных - N1, промежуточных - N2 и выходных - N3 данных, которые составляют наборы входных, промежуточных и выходных элементов данных
Матрицей достижимости М называют квадратную бинарную матрицу, проиндексированную по обеим осям множеством информационных. Запись 1 в каждой позиции (i,j ) матрицы достижимости соответствует наличию для упорядоченной пары информационных элементов (di, dj) смыслового отношения достижимости R. Элемент dj достижим из элемента di , т.е.
выполняется условие di rо dj, если на графе G = (D,Ro) существует направленный путь от вершины di к вершине dj ( в процессе получения значения элемента dj используется значение элемента di ).
Если di dj , то отношение достижимости между элементами di и dj отсутствует и в позиции (i,j ) матрицы М записывают 0.
Записи 1 в j -м столбце матрицы М соответствуют информационным элементам di , которые необходимы для получения значений элементов dj и образуют множество элементов предшествования A(di ) для этого элемента. Записи 1 в i-й строке матрицы М соответствуют всем элементам dj , достижимым из рассматриваемого элемента di и образующим множество достижимости rоdj этого элемента.
Информационные элементы, строки которых в матрице М не содержат единиц (нулевые строки), являются выходными информационными элементами, а информационные элементы, соответствующие нулевым столбцам матрицы М, являются входными. Это условие может служить проверкой правильности заполнения матриц В и М, если наборы входных и выходных информационных элементов известны. Информационные элементы, не имеющие нулевой строки или столбца, являются промежуточными.
На основе матрицы М строится информационный граф gs (D,R) системы, структурированный по входным N1, промежуточным N2 и выходным N3 наборам информационных элементов и полученный из анализа множества элементов предшествования A(d i ) и достижимости R (d j ).
В общем случае информационный граф системы в отличие от вычисленного графа может иметь контуры и петли, что объясняется необходимостью повторного обращения к отдельным элементам данных.
Информационный граф системы gs (D,R) структурируется по уровням (N1, N2, N3,) с использованием итерационной процедуры, что позволяет определить информационные входы ( N1 ) и выходы ( N3 ) системы, выделить основные этапы обработки данных, их последовательность и циклы обработки на каждом уровне. Кроме того, удаляются избыточные (лишние) дуги и элементы. Граф, получаемый после структуризации по наборам информационных элементов и удаления избыточных элементов и связей, определяет каноническую структуруинформационной базы.
Информационный граф gs (D,R)
для рассматриваемого примера
Таким образом, каноническая структура задает логически неизбыточную информационную базу. Выделение наборов элементов данных по уровням позволяет объединить множество значений конечных элементов в логические записи и тем самым упорядочить их в памяти ЭВМ.
От канонической структуры переходят к логической структуре информационной базы, а затем — к физической организации информационных массивов.
Каноническая структура служит также основой для автоматизации основных процессов предпроектного анализа предметных областей систем управления.
Процедуры хранения, актуализации и извлечения данных непосредственно связаны с базами данных, поэтому логический уровень этих процедур определяется моделями баз данных.
Определите понятие база данных.
База данных (БД) определяется как совокупность взаимосвязанных данных, характеризующихся возможностью использования для большого количества приложений, возможностью быстрого получения и модификации необходимой информации, минимальной избыточностью информации, независимостью от прикладных программ, общим управляемым способом поиска.
Возможность применения баз данных для многих прикладных программ пользователя упрощает реализацию комплексных запросов, снижает избыточность хранимых данных и повышает эффективность использования информационной технологии. Минимальная избыточность и возможность быстрой модификации позволяют поддерживать данные на одинаковом уровне актуальности.
Основное свойство баз данных — независимость данных и использующих их программ. Независимость данных подразумевает, что изменение данных не приводит к изменению прикладных программ и наоборот.
Расскажите об основных моделях баз данных.
Модели баз данных базируются на современном подходе к обработке информации, состоящем в том, что структуры данных обладают относительной устойчивостью. Действительно, типы объектов предприятия, для управления которым создается информационная технология, если и изменяются во времени, то достаточно редко, а это приводит к тому, что структура данных для этих объектов достаточно стабильна. В результате возможно построение информационной базы с постоянной структурой и изменяемыми значениями данных.
Каноническая структура информационной базы, отображающая в структурированном виде информационную модель предметной области, позволяет сформировать логические записи, их элементы и взаимосвязи между ними. Взаимосвязи между записями БД могут быть типизированы по следующим основным видам:
• "один к одному", когда одна запись может быть связана только с одной записью;
• "один ко многим", когда одна запись взаимосвязана со многими другими;
• "многие ко многим", когда одна и та же запись может входить в отношения со многими другими записями в различных вариантах.
Применение того или иного вида взаимосвязей определило три основные модели баз данных: иерархическую, сетевую и реляционную.
Для пояснения логической структуры основных моделей баз данных рассмотрим пример: разработать логическую структуру БД для хранения данных о трех поставщиках: П1, П2 и П3, которые могут поставлять товары Т1, Т2, Т3 в следующих комбинациях: поставщик П1 — товары Т1, Т2, Т3,
поставщик П2 — товары Т1 и Т2, поставщик Пз — товары Т1 и Тз.
Построим логическую модель БД, основанную на иерархическом подходе.
Иерархическая модель представляется в виде древовидного графа, в котором объекты выделяются по уровням соподчиненности (иерархии) объектов.
Иерархическая модель БД
На верхнем, первом уровне находится информация об объекте "поставщики" (П), на втором — о конкретных поставщиках П1, П2 и П3, на нижнем, третьем, уровне — о товарах, которые могут поставлять конкретные поставщики.
В иерархической модели должно соблюдаться правило: каждый порожденный узел не может иметь больше одного порождающего узла (только одна входящая стрелка); в структуре может быть только один непорожденный узел (без входящей стрелки) — корень. Узлы, не имеющие выходных стрелок, носят название листьев. Узел - это запись.
Для поиска необходимой записи нужно двигаться от корня к листьям, т.е. сверху вниз, что значительно упрощает доступ.
Достоинство иерархической модели данных состоит в том, что она позволяет описать их структуру как на логическом, так и на физическом уровне.
Недостатками иерархической модели данных являются жесткая фиксированность взаимосвязей между элементами данных, вследствие чего любые изменения связей требуют изменения структуры, а также жесткая зависимость физической и логической организации данных.
Быстрота доступа в иерархической модели достигнута за счет потери информационной гибкости (за один проход по дереву невозможно получить информацию о том, какие поставщики поставляют, например, товар Т1).
Указанные недостатки ограничивают применение иерархической структуры.
В иерархической модели используется вид связи между элементами данных ''один ко многим".
Сетевая модель базы данных (взаимосвязь вида "многие ко многим") для поставленной задачи представлена в виде диаграммы связей.
На диаграмме указаны независимые (основные) типы данных П1, П2 и Пз, т.е. информация о поставщиках, и зависимые — информация о товарах
Т1, Т2, и Т3.
В сетевой модели допустимы любые виды связей между записями и отсутствует ограничение на число обратных связей. Но должно соблюдаться одно правило: связь включает основную и зависимую записи.
Сетевая модель Базы Данных
Достоинство сетевой модели БД — большая информационная гибкость по сравнению с иерархической моделью.
Недостаток — достаточно жесткая структура, что препятствует развитию информационной базы системы управления.
При необходимости частой реорганизации информационной базы (например, при использовании настраиваемых базовых информационных технологий) применяют наиболее совершенную модель БД — реляционную, в которой отсутствуют различия между объектами и взаимосвязями.
В реляционной модели базы данных взаимосвязи между элементами данных представляются в виде двумерных таблиц, называемых отношениями. Отношения обладают следующими свойствами:
· каждый элемент таблицы представляет собой один элемент данных (повторяющиеся группы отсутствуют);
· элементы столбца имеют одинаковую природу, и столбцам однозначно присвоены имена;
· в таблице нет двух одинаковых строк;
· строки и столбцы могут просматриваться в любом порядке вне зависимости от их информационного содержания.
Преимущества реляционной модели БД:
· простота логической модели (таблицы привычны для представления информации)
· гибкость системы защиты (для каждого отношения может быть задана правомерность доступа)
· независимость данных
· возможность построения простого языка манипулирования данными с помощью математически строгой теории реляционной алгебры (алгебры отношений).
Наличие строгого математического аппарата для реляционной модели баз данных и обусловило ее наибольшее распространение и перспективность в современных информационных технологиях.
Для приведенной выше задачи о поставщиках и товарах логическая структура реляционной БД будет содержать три таблицы (отношения):
R1, R2, R3, состоящие соответственно из записей о поставщиках, о товарах и о поставках товаров поставщиками.
В каком виде воспринимается пользователем реляционная база данных, примеры структуры реляционной БД.
Реляционная база данных — это такая база данных, которая воспринимается ее пользователем как совокупность таблиц. Если детализировать записи приведенного примера: разработать логическую структуру БД для хранения данных о трех поставщиках: П1, П2 и П3, которые могут поставлять товары Т1, Т2, Т3 в следующих комбинациях: поставщик П1 — товары Т1, Т2, Т3,
поставщик П2 — товары Т1 и Т2, поставщик Пз — товары Т1 и Тз., то получим структуру БД, трех таблиц: R1, R2, R3
Таблица R1, описывает виды товаров. Каждый товар имеет уникальный номер, название, вес и цвет. Таблица R2 представляет поставщиков. Каждый поставщик имеет номер, уникальный для этого поставщика, фамилию (естественно, неуникальную), значение рейтинга и местонахождение (город).
В таблице Яз отражена поставка товаров.
Таблица R3 служит для того, чтобы связать между собой две другие таблицы. Например, первая строка этой таблицы связывает определенного поставщика из таблицы R2 (поставщика П1 с определенным товаром из таблицы R1 (с товаром Т1). Иными словами, она представляет поставку товаров вида Т1 поставщиком по фамилии П1 и объем поставки, равный 300 шт. Таким образом, для каждой поставки имеются номер поставщика, номер товара и количество товара.
Из приведенных в примере таблиц следует:
• все значения данных являются атомарными, т.е. в каждой таблице на пересечении строки и столбца всегда имеется в точности одно значение данных и никогда не бывает множества значений;
• полное информационное содержание базы данных представляется в виде явных значений данных.
Такой метод представления — единственный, имеющийся в распоряжении реляционной базы данных.
Пример- не существует связей и указателей, соединяющих одну таблицу с другой. Для связи таблиц R1 и R2 служит таблица Rз и ничего другого.
R1 (товары)
Номер товара
Название
Масса
Цвет
Т1
Гайка
12
красный
Т2
Болт
17
зеленый
Т3
шайба
5
голубой
R3 (поставка товаров)
Номер поставщика
Номер детали
Количество
товаров
П1
Т1
300
П1
Т2
200
П1
Т3
400
П2
Т1
300
П2
Т2
400
П3
Т1
200
П3
Т3
300
R2(поставщики)
Номер поставщика
Фамилия
Рейтинг
Город
П1
Иванов
20
Минск
П2
Бажов
10
Курск
П3
Шаров
30
Орел
Первичный
ключ
Пример взаимосвязи товаров R1, их поставщиков R2 через таблицу Rз.
Что такое отношение, атрибут, кортеж, степень отношения, кардинальное число?
При работе с реляционными моделями используется терминология:
Формальный реляционный термин
Неформальный эквивалент
Домен
Совокупность допустимых значений атрибутов определенного отношения
Отношение
Таблица
Кортеж
Запись, строка таблицы
Кардинальность
Количество строк в таблице
Атрибут
Поле, столбец таблицы
Степень отношения
Количество полей (столбцов) таблицы
Первичный ключ
Уникальный идентификатор
Пример, разъясняющий основные понятия реляционной модели
Наименьшей единицей данных в реляционной модели является отдельное значение данных. Такие значения рассматриваются как атомарные, т.е. неразложимые, когда речь идет о данной модели.
Множество атомарных значений одного и того же типа называют доменом.
Например, домен «Номеров поставщиков» — это множество допустимых номеров поставщиков, домен «Количество товаров» — множество целых, больших нуля и меньших, например 10 000.
Домены представляют собой совокупность значений, из которой берутся фактические значения, появляющиеся в атрибутах (полях, столбцах).
· Если значения двух атрибутов (полей, столбцов) берутся из одного домена, то имеют смысл их сравнение, а следовательно, соединение, объединение, и т.д.
· Если значения атрибутов берутся из разных доменов, то всякие их сравнения лишены смысла.
Домены по своей природе являются в большей степени понятиями концептуальными и могут и храниться, и не храниться в базе данных как фактическое множество значений. Но они должны специфицироваться как часть определения базы данных, а определение каждого атрибута должно включать ссылку на соответствующий домен во избежание каких-либо двусмысленностей.
Главный элемент реляционной структуры —отношение.
Отношение на доменах D1,D2, .,Dn состоит из заголовка и тела.
Заголовок содержит такое фиксированное множество атрибутов А1,А2, .,Аn, что существует взаимно однозначное соответствие между этими атрибутами Аi и определяющими их доменами ().
Тело — это меняющееся во времени множество кортежей, где каждый кортеж, в свою очередь, состоит из множества пар атрибутов-значений (), (), по одной такой паре для каждого атрибута Ai в заголовке. Для любой заданной пары атрибут-значение (), является значением из единственного домена Di, с которым связан атрибут Аi. Таким образом, все отношения (см. пример - таблицы R1, R2, R3) соответствуют приведенному определению отношения.
Таблица и отношение в действительности не одно и то же. При изображении таблицы мы явно или неявно упорядочиваем расположение столбцов (атрибутов) и строк (кортежей), хотя отношение — это математическое множество, а множество в математике не обладает каким-либо упорядочением.
Значение n— число атрибутов в отношении — называется степенью отношения. Отношение степени один называется унарным, степени два — бинарным, степени три — тернарным, степени n n-арным. В приведенной базе данных таблиц R1, R2 и R3 степень отношений R1 и, R2 равна четырем, а отношения R3— трем. Число кортежей в отношении называется кардинальный числом этого отношения. Кардинальные числа отношений R1, R2 и R3 равны соответственно 3, 3 и 7. Кардинальное число отношения изменяется во времени (кортеж может быть добавлен или удален) в отличие от его степени.
Определите понятие ключа. Каковы требования к ключам отношений?
Важным следствием определений, сделанных выше, является то, что каждое отношение имеет первичный ключ, идентифицирующий это отношение.
Поскольку отношение — это множество, а множества, по определению, не содержат совпадающих элементов, никакие два кортежа отношения не могут в произвольный заданный момент времени быть дубликатами друг друга.
Пусть R — отношение с атрибутами А1,А2, .,Аn. Тогда множество атрибутов К = (Ai, Aj, .,Ak) отношения R является возможным ключом R тогда и только тогда, когда удовлетворяются два независимых от времени условия: уникальность и минимальность.
· условие уникальность указывает на то, что в произвольный заданный момент времени никакие два различных кортежа отношения R не имеют одного и того же значения (Ai, Aj, .,Ak).
· условие минимальность свидетельствует о том, что ни один из атрибутов
(Ai, Aj, .,Ak) не может быть исключен из множества К без нарушения условий уникальности.
Каждое отношение обладает по крайней мере одним возможным ключом, поскольку комбинация всех его атрибутов удовлетворяет условиям уникальности.
Один произвольно выбранный возможный ключ для данного отношения принимается за его первичный ключ, а остальные возможные ключи называются альтернативными.
Помимо первичных и альтернативных ключей, идентифицирующих данное отношение, есть еще внешний ключ.
В общем случае внешний ключ — это атрибут или комбинация атрибутов одного отношения R", значение которого обязательно должно совпадать со значением первичного ключа некоторого другого отношения R', причем внешний и первичный ключи должны быть определены на одних и тех же доменах.
Внешние ключи в неявном виде связывают отношения.
R1 (товары)
Номер товара
Название
Масса
Цвет
Т1
Гайка
12
красный
Т2
Болт
17
зеленый
Т3
шайба
5
голубой
R2(поставщики)
Номер поставщика
Фамилия
Рейтинг
Город
П1
Иванов
20
Минск
П2
Бажов
10
Курск
П3
Шаров
30
Орел
R3 (поставка товаров)
Номер поставщика
Номер детали
Количество
товаров
П1
Т1
300
П1
Т2
200
П1
Т3
400
П2
Т1
300
П2
Т2
400
П3
Т1
200
П3
Т3
300
Примером внешнего ключа является атрибут "Номер поставщика" в отношении R3, (см. рис. Пример взаимосвязи товаров R1, их поставщиков R2 через таблицу Rз.), поскольку этот атрибут может быть первичным ключом отношения R1.
Каковы правила целостности реляционной БД?
Целостность реляционной модели данных определяется правилами:
1. Целостность по сущностям. Не допускается, чтобы какой либо атрибут, участвующий в первичном ключе базового отношения, принимал неопределенные значения.
Базовым отношением называют независимое именованное отношение (в примере БД поставщиков и товаров — это отношения R1 и R2) . Базовые отношения соответствуют сущностям в реальном мире, т.е.отличимы друг от друга, т.е. имеют уникальную идентификацию.
В реальной же модели функцию уникальной идентификации выполняют первичные ключи, и, таким образом, ситуация, когда первичный ключ принимает неопределенное значение, является противоречивой и говорит о том, что некоторая сущность не обладает индивидуальностью, а значит, не существует. Отсюда и название — целостность по сущностям.
2. Целостность по ссылкам. Если базовое отношение R" включает некоторый внешний ключ FK, соответствующий некоторому первичному ключу РК какого-либо базового отношения R',то каждое значение FK в R" должно быть либо равным значению РК в некотором кортеже R", либо полностью неопределенным.
Пример Неопределенность внешнего ключа может возникнуть в ситуации, когда, имеется вакансия на должность в некоторый отдел. Для такой должности атрибут "Фамилия служащего", являющийся внешним ключом, имеет неопределенное значение в кортеже, представляющем эту штатную должность отдела.
Перечислите и объясните традиционные теоретико-множественные операции.
Виды действий (манипуляций) над данными в реляционной модели представляют собой множество операций реляционной алгебры.
Каждая операция реляционной алгебры использует одно или два отношения в качестве операндов и создает в результате некоторое новое отношение. Определены восемь таких операций, объединенных в две группы по четыре операции в каждой.
Первая группа — традиционные теоретико-множественные операции
а - объединение; б - пересечение; в - разность г - декартово произведение
В каждой из этих операций используются два операнда (отношения). Для всех операций, кроме декартова произведения, эти два операнда должны быть совместимы по объединению, т.е. они должны быть одной степени и их i-е атрибуты () должны быть связаны с одним и тем же доменом
Операция "объединение". Объединением двух отношений А и В называется множество всех кортежей t, принадлежащих либо отношению А, либо В, либо им обоим. Символически эта операция показана на (рис. а)
,где U — символ объединения;
— знак принадлежности определенному отношению (множеству).
Операция "пересечение". Пересечением двух отношений А и В называется множество всех кортежей t, каждый из которых принадлежит как А, так и В
(рис. б): где — символ пересечения.
Диаграммы традиционных теоретико-множественных операций:
Операция "разность". Разностью между двумя отношениями А и В называется множество всех кортежей t, каждый из которых принадлежит А и не принадлежит В (рис. в):
где \ — символ разности;
— символ отсутствия принадлежности отношению (множеству).
Операция "декартово произведение". Декартовым произведением двух отношений А и В называется множество всех кортежей t, таких, что t является конкатенацией (соединение в цепочки) некоторого кортежа а, принадлежащего А, и какого-либо кортежа b, принадлежащего В (рис. г):
А х В — {ах, ay, bx, by, cx, су, dx, dy}.
Перечислите и объясните специальные реляционные операции.
Виды действий (манипуляций) над данными в реляционной модели представляют собой множество операций реляционной алгебры.
Каждая операция реляционной алгебры использует одно или два отношения в качестве операндов и создает в результате некоторое новое отношение. Определены восемь таких операций, объединенных в две группы по четыре операции в каждой.
Первая группа — традиционные теоретико-множественные операции
а - объединение; б - пересечение; в - разность г - декартово произведение
Вторая группа — специальные реляционные операции
Операция "селекция". Пусть theta представляет собой любой достижимый оператор сравнения скаляров, например =, ¹, >, ≥,≤, Theta-селекцией отношения А по атрибутам хи уназывается множество всех кортежей t из А, таких, что истин предикат t.xthetat.y. Атрибуты х и у должны быть определены на одном и том же домене, и для этого домена оператор theta должен иметь смысл. Вместо атрибута у может быть задана константа. (например, выбрать из платежной ведомости записи о сотрудниках, имеющих зарплату 500 руб.). Таким образом, оператор theta-ceлекции позволит получать "горизонтальные" подмножества заданного отношения, т.е. подмножества таких кортежей заданного отношения, для которых выполняется поставленное условие
Селекция Проекция
Множество A Множество A
Горизонтальное Вертикальное
Операция "проекция" позволяет получить "вертикальное" подмножество заданного отношения, т.е. подмножество, получающееся выбором специфицированных (определенных) атрибутов с последующим исключением, если это необходимо, избыточных дубликатов кортежей, состоящих из значений выбранных атрибутов.
Операция "соединение" theta имеет тот же смысл, что и в операции селекции. Тогда theta-соединением отношения А по атрибуту х с отношением В по атрибуту у называется множество всех кортежей t, таких, что tявляется конкатенацией какого-либо кортежа а, принадлежащего А, и какого-либо кортежа в, принадлежащего В, и предикат а.х theta b.y. принимает значение "истина". При этом атрибуты А.х и В.у должны быть определены на одном и том же домене, а оператор theta должен иметь смысл для этого домена.
Операция "соединение" похожа на декартово произведение. Отличие состоит в том, что декартово произведение предполагает сцепление каждого кортежа из отношения А с каждым кортежем из В, а в операции "соединение" кортеж из отношения А сцепляется только с теми кортежами из В, для которых выполнено условие а.х = b.y.
Операция "деление". В простейшей форме делит отношение степени два (делимое) на отношение степени один (делитель) и создает (продуцирует) результирующее отношение степени один (частное).
Пусть делимое А имеет атрибуты х и у, а делитель В — атрибут у,. Атрибуты А.у и В.у должны быть определены на одном домене.
Результатом деления А на В является отношение С с единственным атрибутом х, таким, что каждое значение хэтого атрибута С.х появляется как значение А.х, а пара значений (х,у) входит в А для всех значений у, входящих в В. Т.е, кортеж включается в результирующее отношение С только в том случае, если его декартово произведение с отношением В содержит отношение А.
Объясните суть объектно-ориентированного программирования и объектной модели базы данных.
В последние годы все большее признание и развитие получают объектные базы данных (ОБД), толчок к появлению которых дали объектно-ориентированное программирование и использование компьютера для обработки и представления практически всех форм информации, воспринимаемых человеком.
Объектно-ориентированное программирование (ООП) в отличие от структурного делает акцент не на программные структуры (циклы, условия и т.д.), а на объекты.
Объекты это: экранное окно, кнопка в окне, поле для ввода данных, пользователь программы, сама программа и т.д.
Любые действия можно привязать к такому объекту, а также описать, что произойдет с объектом при выполнении определенных действий (например, при "нажатии" кнопки). Многократно используемый объект можно сохранить и применять его в различных программах.
Таким образом, при объектно-ориентированном программировании создают необходимые объекты и описывают действия с ними и их реакцию на действия пользователя. Если создан и определен достаточно большой набор объектов, то написание программы будет состоять в том, чтобы включить в нее и связать с ней те или иные объекты, обеспечивающие выполнение необходимых пользователю функций.
Объект— достаточно крупный блок функционально взаимосвязанных данных, при извлечении которого из ОБД включаются процедуры преобразования и отображения данных по программам, входящим в состав объекта.
Типы и структуры данных, из которых состоит объект, могут быть различными у разных объектов и создаваться самим программистом на основе стандартных типов данных используемого языка программирования. Создаваемые и описываемые программистом типы данных получили название абстрактных типов данных.
Таким образом, объектом называется программно-связанный набор методов (функций) и свойств, выполняющих одну функциональную задачу. Например, кнопка управления на экране — это объект, с которым происходят события, который обладает свойствами, описывающими его внешний вид и назначение, и набором методов для управления его поведением на экране.
Свойство — это характеристика, с помощью которой описываются внешний вид и работа объекта.
Событие — это действие, которое связано с объектом. Событие может быть вызвано пользователем (щелчок мышью), инициировано прикладной программой или операционной системой.
Метод — это функция или процедура, управляющая работой объекта при его реакции на событие.
Объекты могут быть как визуальными, т.е. их можно увидеть на экране дисплея (окно, пиктограмма, текст и т.д.), так и невизуальными (например, программа решения какой-либо функциональной задачи).
Если набор объектов имеет описание (концептуальная модель), указаны свойства и логические связи между объектами (логическая модель) и известно их местонахождение в памяти ЭВМ (физическая модель), то это позволяет извлекать объекты и применять их в соответствии с назначением многими пользователями. Следовательно, организуется объектная база данных (ОБД).
В настоящее время многие известные фирмы, занимающиеся разработкой программных продуктов, предлагают системы ООП. Например, продукты фирмы Microsoft, Visual Basic, Visual FoxPro, Access, SQL Server. Такие системы не только упрощают создание объектов, но и позволяют организовать ОБД, и предоставляют средства работы с ней. Помимо поддержки ООП и ОБД перечисленные системы дают возможность создавать реляционную БД и манипулировать ею.
Нарисуйте схему состава и взаимосвязей моделей и программ процесса накопления данных.
Логический (модельный) уровень процесса накопления данных связан с физическим через программы, осуществляющие создание канонической структуры БД, схемы ее хранения и работу с данными (рис.).
Каноническая структура БД создается с помощью модели выбора хранимых данных. Формализованное описание БД производится с помощью трех моделей: модели хранения данных (структура БД), модели актуализации данных и модели извлечения данных. На основе этих моделей разрабатываются соответствующие программы: создания канонической структуры БД , создания структуры хранения БД , актуализации и извлечения данных .
Объясните назначение средств реализации системы управления базами данных.
Переход к физической модели базы данных, реализуемой и используемой на компьютере, производится с помощью системы программ, позволяющих создавать в памяти ЭВМ (на магнитных и оптических дисках) базу хранимых данных и работать с этими данными, т.е. извлекать, изменять, дополнять, уничтожать их — системы управления базами данных (СУБД).
Расскажите о файловой системе хранения данных.
СУБД это главный, но не единственный способ накопления данных. Файловая форма хранения данных на дисках компьютеров широко распространена и поддерживается всеми современными операционными системами.
Файл — это теоретически неограниченный, статистический набор данных, физически расположенный на магнитном или оптическом диске, имеющий уникальное имя и метки начала и конца. Файлы не связаны между собой функционально, но для облегчения их поиска и проведения необходимых операций, таких, как запись, копирование, переименование, удаление и т.п., они имеют иерархическую логическую организацию, создаваемую операционной системой компьютера.
Современные операционные системы предоставляют пользователю разнообразный набор графических экранных средств манипуляции файлами.