Надежность информационныхсистем
Предисловие
Проблеманадежности является очень важной для современных технических систем. Можнопривести примеры многих систем, для которых решение проблемы надежности в самомпрямом смысле означает, быть или не быть данной системе. К ним можно отнести иразличные информационные системы, включающие в свой состав большое числокомпьютеров, имеющих сетевую структуру, территориально распределенныеинформационные системы, информационные системы измерения параметров различныхобъектов, системы мониторинга и т.п.
Информационныесистемы могут иметь простую и сложную структуру. Их усложнение идет сегодня вразличных направлениях. С одной стороны, в состав систем входит все большеечисло комплектующих элементов. С другой стороны, усложняется их структура,определяющая соединение отдельных элементов и их взаимодействие в процессефункционирования и поддержания работоспособности. При этом усложнение системявляется прямым следствием постоянно возрастающей ответственности выполняемыхими функций, сложности и многообразия этих функций.
При прочихравных условиях система, состоящая из большого числа комплектующих элементов иимеющая более сложную структуру и сложный алгоритм функционирования, являетсяменее надежной по сравнению с более простой системой. Все это требуетразработки специальных методов обеспечения надежности таких систем, включаяразработку математических методов расчета надежности и экспериментальнойоценки./>
/>/>/>1. Основныепонятия и определения
Прежде чемначать изложение теоретических основ надежности, введем основные термины иопределения, принятые в современной инженерной практике.
Поднадёжностью технической системы понимают свойство системы сохранятьработоспособность в заданных условиях функционирования. Говоря оработоспособности, следует сразу же определить критерий отказа системы. Отказ –это событие, после возникновения которого система утрачивает способностьвыполнять заданное назначение. Эти два понятия в определенном смысле выражаютсяодно через другое: отказ – это потеря работоспособности. Однако для той илииной информационной системы конкретное определение отказа зависит от многихфакторов: назначения системы, выполняемой задачи, требований к выполнениюданной конкретной функции и др.
Надежность – этосложное свойство, включающее в свой состав несколько единичных свойств:безотказность, готовность, сохраняемость, ремонтопригодность, а также безопасностьи живучесть.
Подбезопасностью понимается способность системы функционировать, не переходя вопасное состояние. Для информационных систем это свойство не являетсясущественным по сравнению, например, с системами атомной энергетики.
Подживучестью технической системы понимают ее способность противостоять внешнимвоздействиям как естественного характера не предусмотренных условияминормальной эксплуатации, так и преднамеренным.
Отличительнымпризнаком надежности как свойства технической системы является то, что онахарактеризуется вероятностными процессами, протекающими во времени.
При изучениитеории надёжности широко используются такие понятия как система, объект,элемент. Элемент – это такой объект, отдельные части которого не представляютсущественного интереса в пределах проводимого анализа. Под термином «система» будемпонимать множество (совокупность) действующих объектов, взаимосвязанных междусобой функционально и рассматриваемых как единое структурное целое. Понятия «элемент»,«объект» и «система» достаточно относительны. Подразделение системы на элементызависит от требуемой точности проводимого анализа, от уровня нашихпредставлений о системе и т.п. Более того, объект, считавшийся системой в одномисследовании, может рассматриваться как элемент, если изучается системабольшего масштаба. Например, в информационной сетевой системе элементом можетсчитаться компьютер, терминал, канал связи и др. В тоже время, рассматриваяфункционирование компьютера, можно выделить процессор, входные и выходные устройства,различные интерфейсы и т.д.
В теориинадежности весьма важную роль играет деление элементов и систем навосстанавливаемые и невосстанавливаемые. Содержательный смысл этих понятийочевиден.
Информационныесистемы бывают простыми и сложными.
Простымисистемами будем считать такие, в которых чётко определён признак отказа, т.е.можно указать элемент, отказ которого приводит к отказу системы.
Основныепризнаки классификации отказов изделий приведены в таблице 1.
Таблица 1Признак классификации Вид отказа
Характер изменений параметра
до момента отказа
внезапный
постепенный (параметрический)
перемежающийся (сбои) Степень потери полезных свойств
полный
частичный Восстанавливаемость полезных свойств
необратимый
обратимый Связь с другими отказами
независимый
зависимый Наличие внешних признаков
явный
неявный Причина возникновения
конструктивный
технологический
эксплуатационный
/>Период появления
период приработки
при работе нормальная эксплуатация
период старения
при хранении
при испытаниях Цена отказа
простой техники (ущерб от ремонта)
невыполнение задачи (ущерб от этого)
моральный ущерб />2. Основные показателинадёжности
Одной изосновных характеристик надежности объекта является время безотказной работы илинаработка до отказа. Обозначим эту случайную величину Т. Будем считать,что в момент времени t=0 объект начинает работу, а в момент t=T происходит отказ. Отказ– это случайное событие во времени. Закон распределения случайной величины T характеризуетсяинтегральной функцией распределения />= Вер (Tk – вероятность отказа наинтервале [0, t].
Функция Q(t) есть вероятность отказадо момента t.Плотность распределения вероятности отказа
/> (1)
Безотказнаяработа – противоположное событие по отношению к событию отказа, поэтомувероятность безотказной работы в течении времени t:
/>/> (2)
/>Если F (t) –дифференцируемая функция (на практике это почти всегда выполняется), тодифференциальная плотность отказа:
/>/>/> (3)
Tогда вероятность отказа ивероятность безотказной работы объекта в течение времени tопределяетсячерезплотностьвероятностиотказа:
/>, (4)
/>.
В расчетах чащевсего применяют такую характеристику надежности как интенсивность отказов l(t). Интенсивность отказовможно рассматривать как относительную скорость уменьшения значений функциинадежности с увеличением интервала (0, t).
/>/> (5)
Решениеуравнения (5) при начальном условии p(0)=1 дает для функции надежности
формулу/>
/> (6)
При l=const формула (6) существенноупрощается:
P(t)=exp(-lt).(7)
Интенсивностьотказов/>– это есть условнаяплотность вероятности отказов в предположении, что до момента t элементфункционировал безотказно. Таким образом, случайная величина имеет три характеристики– p(t), />, />.
В качествепоказателей надежности применяют также числовые характеристики случайнойнаработки до отказа. Их обычно легче определить по экспериментальным данным,чем зависимости p(t),l(t),f(t). Наиболее частоиспользуют среднюю наработку до отказа (математическое ожидание наработки доотказа или первый начальный момент).
/>, (8)
где F(t) – функция распределенияслучайной величины T.
Интегрируя(8) по частям, получаем
/> (9)
Такимобразом, средняя наработка до отказа численно равна площади под кривой p(t).
При l=const имеем
/> (10)Второйцентральный момент (среднее квадратичное отклонение)
/> (11)
Очень частоэтих двух моментов бывает достаточно для полной характеристики функцийраспределения наработки до отказа. Например, в практически часто встречающихсяслучаях, когда />(экспоненциальноераспределение), p(t)=exp(-lt)и mt=/> – несёт исчерпывающуюинформацию о надежности системы.
Наиболеечасто встречающиеся распределения и их основные показатели представлены втаблице 2.
Таблица 2N п/п
Тип
распределения
Функция
распределения отказов
Плотность
распределения
отказов
Интенсив-
ность
отказов Параметры законов мат. ожид. дисперсия 1 2 3 4 5 6 7 1
Показательные
(экспоненциальные)
/>
/>
/>/>
/>
/>
/> 2
Рэлея
/>
/>
/>
/>
/>
/> 3
Равномерное
/>
/>
/>
/>
/>
/> 4
Вейбулла
/>
/>
/>
/>
/>
/>
при /> – распределение Вейбуллапревращается в показательное.
при /> – распределениеРэлея/>3. Методы повышениянадежности
Эффективностьинформационной системы в значительной степени зависит от уровня ее надежности,в первую очередь от уровня ее безотказности. Опыт эксплуатации показывает, чтоуровень надежности систем не всегда отвечает современным требованиям, поэтомувесьма актуальна проблема разработки методов, позволяющих обеспечить требуемыеуровни характеристик надежности системы. Надежность системы можно повысить,используя различные методы. При этом каждый раз надо выбирать пригодный метод сучетом стоимости, весовых, габаритных и других характеристик системы.
Методыповышения надежности можно классифицировать по области их использования.
/>Методы
/>
Конструктивные Производственные Эксплуатационные />
/>- Создание надежных элементов;
– Создание благоприятного режима работы;
– Методы рационального проектирования систем;
– Методы введения избыточности:
Нагрузочная,
Параметрическая,
Функциональная,
Резервирование
структуры.
– Методы, защищающие элементы от разрушающих факторов
– Совершенствование
технологии;
– Автоматизация
производства;
– Тренировка элементов и
модулей системы.
– Методы предупреждения отказов, основанные на прогнозировании моментов их появления;
– Методы предупреждения отказов, основанные на статистических данных о долговечности элементов;
– Повышение квалификации обслуживающего персонала;
– Научные методы эксплуатации. /> /> /> />4. Резервирование какспособ повышения надежности
Повышение надежностисистемы путем резервирования является одним из эффективных способов повышениянадежности, но всегда связано с увеличением ее габаритов, массы, стоимости.
Рассмотримкратко классификацию методов резервирования (см. табл. 3)
Таблица 3Признак резервирования Метод резервирования По виду соединения основных и резервных элементов Общее Раздельное Смешанное С изменяющейся структурой (динамическое) По нагруженности резервных элементов до их включения Нагруженное Недогруженное (облегченное) Ненагруженное С изменяющейся нагрузкой По способу переключения основных и резервных элементов С ручным переключением С полуавтоматическим переключением С автоматическим переключением По наличию восстановления элементов Без восстановления С восстановлением По используемым параметрам системы
Информационное
Структурное
Функциональное
Временное
Рассмотримметоды резервирования по нагруженности резервных элементов.
Понагруженности резервных элементов резервирование подразделяется на следующиевиды:
1.Нагруженноерезервирование – когда резервный элемент находится в том же режиме, что иосновной элемент.
2.Недогруженноерезервирование – когда резервный элемент находится в менее нагруженном режиме,чем основной элемент.
3.Ненагруженноерезервирование – когда резервный элемент не несет нагрузок (выключен).
4.Резервирование сизменяющейся нагрузкой – когда резервный элемент в выбранные моменты времениможет находиться в одном из заданных состояний (нагруженном, облегченном,ненагруженном)./>5. Нагруженноерезервирование
Пусть системасостоит из nосновных элементов и m резервных элементов. Плотность вероятности безотказнойработы f(t). Условия работыэлементов не зависимы, а автомат контроля и коммутации элементов (АКК) – абсолютнонадежный.
/>/>/>; /> (12)
Для решениязадачи используем метод гипотез [1]. Предположим, что все элементы исправны.Так как работа элементов не зависима, вероятность этой гипотезы:
/> (13)
Пусть отказалодин конкретный (s-й) элемент, тогда вероятность этой гипотезы:
/>/> (14)
Вероятностьотказа любого одного из m + n элементов:
/> (15)
Пустьотказали любые два элемента (сначала s-й, потом k-й). Тогда вероятностьэтой гипотезы:
/> (16)
Далееаналогично
/> (17)
Всерассмотренные выше гипотезы благоприятствуют работоспособному состоянию системы.Поэтому вероятность безотказной работы системы равна сумме вероятностей этихгипотез.
/> или (18)
/> (19)
Так как всеэлементы равнонадежны, то
/>
Если законраспределения экспоненциальный, т.е./>, то />, />. Тогда
/> (20)
При n=1
/>, где k=m+1/ (21)
Тогда />, (22)
/>, (23)
при /> />
Таким образом,у резервированной системы интенсивность отказа является функцией временинаработки, даже для экспоненциального закона распределения времени наработкидля элементов.
При t=0,/>=0; при /> />/>6. Ненагруженноерезервирование
Здесь те жеусловия, что и в п. 5, но время безотказной работы элементов распределенопо экспоненциальному закону с параметром/>.Интенсивность отказов такой системы />, таккак резервированные элементы без отказов.
Необходимо найтиплотность распределения суммы независимых случайных величин
/> (24)
Для этого воспользуемсяхарактеристической функцией
/>, где /> (25)
Тогда
/> (26)
Плотностьвероятности момента выхода из строя m + 1 элемента
/> (27)Вероятность безотказнойработы системы определится как
/> (28)Если резервированияэлементов нет, т.е. m =0, то
/> (29)/>7. Недогруженноерезервирование
Системасостоит из nосновных элементов с интенсивностью отказов λ = а и m резервных элементов сλ = b.Условия работы элементов независимы. Автомат контроля и коммутации – абсолютнонадежен. Система будет исправна, если число k отказов элементов 0≤k(t)≤m. Тогда /> или />, (30)
так как при k = m + 1 будет отказ, агруппа 0≤k(t)≤m + 1 – полная группасобытий
Если в моментt система находится всостоянии k,то интенсивность ее отказов
/>
В моментвремени t+ Δ tсистема будет находиться в состоянии k c вероятностью
/> (31)
– вероятностьтого, что система не уйдет из состояния k.
Устремив /> получим общее выражениедля дифференциального уравнения
/> (32)
При k=0 /> (33)
k=1 /> (34)
k=m+1 /> (35)
Начальныеусловия
/> (36)
т.е. вначальный момент времени все элементы исправны.
Уравнение(32) – уравнение А.Н. Колмогорова для однородного марковского процесса(λ = const).
Уравнению(32) можно сопоставить граф переходов из одного состояния системы в другое
На основаниианализа уравнений А.Н. Колмогорова, Б.В. Васильева [1] было сформулированомнемоническое правило составления таких уравнений по заданному графу. В левойчасти каждого уравнения стоит производная по времени от вероятности нахождениясистемы в k-мсостоянии в момент времени t. Число членов в правой части равно алгебраической суммепроизведений интенсивностей переходов на соответствующие вероятности пребываниясистемы в тех узлах графа, откуда совершается непосредственный переход системыв другие (соседние) узлы. Причем, слагаемым, которым соответствуют выходящие изk-го узла стрелки графа,приписывается – знак минус, а входящем – знак плюс. Как видим уравнение (32)составлено по этому правилу.
Применяяпреобразование Лапласа:
/> (37)
системудифференциальных уравнений сводим к алгебраической, решая которую получим
/> (38)
Зная изображение/> по Лапласу находим
/> (39)Решая (39), получим
/>, (40)
где /> (41)
Окончательно
/>, (42)
где /> (43)
Например, m=1, a/b=1
B0(1)=1+n; B1(1)=n
/> (44)
/> (45)
/>
/> (46)
Из анализа выражения (46)следует, что распределение времени безотказной работы резервированной системыотлично от экспоненциального распределения, даже, если все ее элементы имеюттакое распределение.
/>8. Надежностьрезервированной системы с автоматом контроля и коммутации
1. Влияниенадежности АКК на работоспособность системы. Требования к надежности автомата.
До сих пор предполагали,что АКК абсолютно надежный.
Сделаемследующие допущения:
1)Обнаружение и замена отказавших элементов в системе происходит мгновенно.
2)Интенсивность отказов обозначим как a и в
3) />fa(t)=ne-nt/>
4) Условияработы элементов независимы.
5) Отказ АККне приводит к отказу системы до следующего отказа элемента.
Очевидно, что АКК можетотказать до того как будет использован весь резерв, т.е. он тоже определяетнадежность системы.Можно показать, что
/> (47)
/> (48)
/>
Литература
1. Дружинин Г.В. Надежностьавтоматизированных производственных систем.
М. Энергоатомиздат,1986.
2. Ушаков И.А. Вероятностныемодели надежности информационно-вычислительных
систем. М. Радио исвязь, 1991.
3. Рябинин И.А. Надежностьи безопасность структурно-сложных систем. Санкт-Петербург, Политехника, 2001.
4. Афанасьев В.Г.,Зеленцов В.А., Миронов А.И. Методы анализа надежности и критичностиотказов сложных систем. Министерство обороны, 1992.
5. Райншке К., Ушаков И.А. Оценканадежности систем с использованием графов, М. Радио и связь, 1998.
6. Рябинин И.А., черкесовГ.Н. Логико-вероятностные методы исследования надежностиструктурно-сложных систем. М. Радио и связь, 1986.
7. Барлоу Р., Прошан А.Математическая теория надежности. Пер. с англ. Под ред Гнеденко Б.В., М. Сов.Радио, 1969.
8. Заде Л. Понятиелингвистической переменной и его применение к принятию приближенных решений.Пер. с англ. – М., Мир, 1976.
9. Кофман А. Введение втеорию нечетких множеств Пер. с франц. М. Радио и связь, 1982.