МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ
ВОСТОЧНОУКРАИНСКИЙ НАЦИОНАЛЬНЫЙ
УНИВЕРСИТЕТ имени ВЛАДИМИРА ДАЛЯПОЯСНИТЕЛЬНАЯ ЗАПИСКА
к курсовой работе по дисциплине
“Организацияэксперимента”
Тема: «Построение неполнойквадратичной регрессионной модели по результатам полного факторногоэксперимента 23»
СТУДЕНТ: ЧерныхН.В.
ГРУППА: ММ– 961
РУКОВОДИТЕЛЬ:Шевченко А.В.
Луганск 2009 г.
Раздел 1. Построениенеполной квадратичной регрессионной модели по результатам полного факторногоэксперимента 23
Принципы решениямногофакторных оптимизационных задач. Метод крутого восхождения
Задачи материаловедениявесьма разнообразны. В наиболее общем виде их можно разделить на две группы:
— экстремальные задачи, целью которых является поиск оптимальных в том или ином смыслесоставов материалов, режимов их термической обработки, условий литья, сварки,напыления, обработки давлением и т. п.;
— задачи описания, целью которых является изучение общих закономерностей явлений,происходящих в материалах при изменении их составов, в процессе ихизготовления, во время последующих обработок. Задачи описания и экстремальныезадачи часто решаются вместе.
Во всех случаях ситуациязаметно упрощается, если для того или иного явления удается построить некоторуюматематическую модель.
Предположим, требуетсяизучить влияние химического состава, условий литья, обработки давлением ипоследующей термической обработки на свойства материалов выбранной системы.Целью этого исследования является попытка выявить общие закономерностиизменения свойств материалов в зависимости от их химического состава и условийобработок, а также поиск материала, обладающего некоторым заданным комплексомсвойств. Понятно, что цели исследования легко было бы достигнуть, если быимелись математические модели, связывающие механические, технологические,эксплуатационные и любые другие свойства материалов изучаемой системы с иххимическим составом, режимами литья, деформации, термической обработки,особенностями поверхностных свойств. Решение и задачи описания, и экстремальнойзадачи представляло бы тогда просто анализ имеющихся моделей.
Возникает вопрос, каким жеобразом получить такого рода модели? Существуют, по крайней мере, два способа.
Модели можно попытатьсяпостроить на основе знаний механизмов явлений, происходящих в материалах приизменении их состава и во время обработок, т. е. теоретическим путем.Построенные таким способом модели представляют исключительную ценность,поскольку их можно использовать не только для решения данной конкретной задачи,но и во многих других случаях.
К сожалению, механизмыбольшинства явлений или процессов, происходящих в различных материалах, кнастоящему времени изучены явно недостаточно. Во всяком случае, строгихколичественных теорий, как правило, не существует, а потому только изтеоретических соображений построить модели для каждого конкретного случая почтиникогда не удается. Тем не менее, рассматриваемая задача является стандартной втехнологии металлов, материаловедении, порошковой металлургии и в технологиинанесения покрытий, а сами задачи такого рода, конечно же, решаются.Следовательно, решаются они при неполном знании (а иногда и вообще принезнании) механизмов явлений, протекающих в материалах. И способ решения вполнеопределенный – эмпирический, экспериментальный. Отсюда следует, чтонаиболее реалистичным путем построения математических моделей являетсяэксперимент.
Итак, необходимо с помощьюэксперимента, который будет проводиться при неполном знании или незнаниимеханизмов явлений, научиться строить и анализировать математические модели,связывающие свойства материалов со всеми теми переменными, от которых эти свойствазависят.
Сразу же отметим, чтопоставленная проблема является задачей кибернетики. Действительно, если считатькибернетику наукой, изучающей системы любой природы, способные воспринимать,хранить и перерабатывать информацию для целей оптимального управления, то такойкибернетической системой в данном случае является исследуемый материал, и этусистему можно представить в виде так называемого “черного ящика”. Она будетиметь входы (независимые переменные, факторы) х1, х2,..., xk (в нашем случае это состав, режимы литья, напыления, термическойобработки, деформации) и выходы (зависимые переменные, отклики, параметрыоптимизации, целевые функции) h1, h2, ..., hq (свойства материала). Существеннымявляется то обстоятельство, что каждому набору уровней входов отвечаютопределенные значения выходов. Другими словами, сплав, порошковый материал илипокрытие фиксированного состава, полученные и обработанные по определеннойсхеме и режимам, имеют некоторый комплекс свойств. Сплав другого состава,обработанный по другим режимам, имеет и другие свойства. Точно ответить навопрос, почему при изменении состава и режимов обработок изменились свойствасплава, нельзя (механизм явления либо плохо, либо совсем не известен), но важенлишь сам факт изменения свойств. Если теперь предположить, что между выходами ивходами системы существует определенная связь (а она, без сомнения,существует), задача сводится к постановке минимально возможного числаэкспериментов (выбору некоторого числа наборов уровней входов), фиксациивыходов, а затем к построению и анализу математических моделей, связывающихвыходы с входами.
Таким образом, нужнополучить некоторое представление о так называемых функциях отклика:
/>
Вид функций j исследователю заранее неизвестен. Поэтому, получая в опытахвыборочные оценки выходов y, он вынужден строить приближенные уравненияфункций отклика:
/>
Эти уравнения в многомерномпространстве факторов называются факторным пространством. Они имеютнекоторый геометрический образ – поверхность отклика. Следовательно,задача сводится к получению представления о поверхности отклика. Если задачаэкстремальная, надо найти экстремум (минимум или максимум) этой поверхности илисделать вывод, что экстремума нет. Если решается задача описания, необходимопопытаться выявить причины именно такого характера поверхности.
Свойства материалов, как ивообще любых других систем, можно описывать различными математическимимоделями. Наибольшее применение нашли модели в виде алгебраических полиномов.Обычно используют разложение неизвестной функции отклика в ряд Тейлора вокрестности любой точки из области ее определения в факторном пространстве:
/>
где />; />; />.
Этот степенной ряд в общемслучае бесконечен, но на практике ограничиваются конечным числом его членов,аппроксимируя тем самым неизвестную функцию j (х1, х2,..., хk) полиномомнекоторой степени. Подобная аппроксимация имеет смысл, если функция отвечаетряду требований. Важнейшим из них является требование непрерывности идостаточной «гладкости». Поскольку заранее неизвестно, насколько этотребование выполняется, приходится делать допущения о том, что это так.
Модель строят по результатамэкспериментов, т. е. определяют выборочные оценки коэффициентов b0,bi, bij, bii:
/>
где у – выборочная оценкафункции отклика h.
Эксперимент можно проводитьпо-разному. В случае, когда исследователь наблюдает за каким-то неуправляемымпроцессом, не вмешиваясь в него, или выбирает экспериментальные точкиинтуитивно, эксперимент считают пассивным. В частности, такая ситуациявозникает почти всегда, когда пользуются традиционными методамиэкспериментирования, изучая вначале влияние на свойства материала однойпеременной при остальных постоянных, затем другой и т. д. Поскольку при этомнемыслимо перебрать все возможные варианты, выполняют лишь часть опытов, причемобоснование выбранных вариантов почти никогда не бывает достаточно строгим. Вэтих случаях статистические методы применяют обычно после окончания экспериментов,когда данные уже получены. Здесь используют такие приемы, как подбор функцийраспределения, определение средних величин и мер рассеяния, анализ корреляций,регрессий и т. п.
Опыт показал, что указанный подход,особенно в задачах оптимизации, является неэффективным. Не останавливаясь навсех причинах этого обстоятельства, отметим лишь, что по результатам пассивногоэксперимента можно, например, судить о наличии или отсутствии статистическойсвязи между переменными, построить подходящие уравнения связи. Но этими уравнениямиможно пользоваться только для интерполяции. Например, можно оценить ввиде аналитического выражения, как изменяется прочность того или иногоматериала в зависимости от его состава и условий изготовления, ноинтерпретировать полученную модель, придавать какое-либо значение еекоэффициентам, использовать для целей оптимизации, как правило, нельзя. Внастоящее время пассивный эксперимент достаточно широко используют в технологииметаллов и материаловедении. Тем не менее, будущее, вероятно, не за ним, хотя внекоторых случаях и из пассивных наблюдений удается извлечь весьма ценнуюинформацию.
Совсем иная картинанаблюдается, когда исследователь начинает применять статистические методы навсех этапах исследования и, прежде всего, перед постановкой опытов,разрабатывая схему эксперимента, а также в процессе экспериментирования, приобработке результатов и после эксперимента, принимая решение о дальнейшихдействиях. Такой эксперимент называют активным, и он предполагаетпланирование эксперимента.
Под планированиемэксперимента обычно понимают процедуру выбора числа и условий проведенияопытов, необходимых и достаточных для решения поставленной задачи с требуемойточностью.
Основные преимущества активногоэксперимента связаны с тем, что он позволяет:
- минимизировать общее число опытов;
- выбирать четкие, логически обоснованные процедуры, последовательновыполняемые экспериментатором при проведении исследования;
- использовать математический аппарат, формализующий многие действияэкспериментатора;
- одновременно варьировать всеми переменными и оптимально использовать факторноепространство;
- организовать эксперимент таким образом, чтобы выполнялись многиеисходные предпосылки регрессионного анализа;
- получать математические модели, имеющие более широкую областьпрактического применения, нежели модели, построенные по результатам пассивногоэксперимента;
- рандомизировать условия опытов, т. е. многочисленные несущественные факторыпревратить в случайные величины;
- оценивать элемент неопределенности, связанный с экспериментом, чтодает возможность сопоставлять результаты, получаемые разными исследователями.
Для того чтобы лучше себепредставить, как реализуются идеи активного эксперимента, рассмотрим схемуодного из наиболее широко используемых в настоящее время методов планированияэксперимента – метода крутого восхождения, предназначенного для решенияэкстремальных задач.
В этом методе, как и вомногих других методах планирования эксперимента, задача решается поэтапно. Напервом этапе, варьируя в каждом опыте сразу все факторы, исследователь ищетлишь направление движения к области экстремума. Для этого поверхностьотклика изучают только на небольшом участке и строят для этого участка линейнуюмодель:
/>.
Анализ полученного уравненияпозволяет наметить направление движения из исходной точки, наиболее быстроприводящее к оптимизации выбранного параметра. В дальнейшем на каждом этапе всоответствии с результатами, полученными на предыдущих этапах, ставят небольшуюсерию опытов, результаты которых вместе с интуитивными решениями исследователяопределяют следующий шаг. Эта процедура заканчивается в области экстремума.Здесь ставят несколько большую серию опытов, и поверхность отклика описываютнелинейными функциями.
Анализ нелинейного уравненияпозволяет точно определить координаты экстремума или сделать вывод, чтоэкстремума не существует, а также наметить последующий путь оптимизации.
Сравним классическийметалловедческий подход и метод крутого восхождения на следующем примере.Предположим, что требуется найти состав наиболее прочного сплава на основеникеля, варьируя в нем содержание алюминия (х1) и тантала (х2).Предположим далее, что зависимость прочности (у) от состава для данных сплавовимеет вид, показанный на рис. 1, чего исследователь, приступая к решениюзадачи, естественно, не знает.
По интуитивным соображениямили на основании данных других исследований эксперимент начинают со сплава,отвечающего составу точки S1. При традиционном экспериментированииисследователь начинает изменять в этом сплаве содержание одной из добавок припостоянном количестве другой, затем содержание другой при постоянном количествепервой. При таком подходе, начиная с точки S1, вообще можно не найтиоптимальный состав сплава (точка S6), поскольку движение по прямойот точки S1 в любую сторону не приводит к существенному упрочнениюсплава (см. рис. 1).
Если далее экспериментаторсумеет перейти к другой исходной точке S2, то, последовательноизменяя содержание алюминия и тантала, он найдет наиболее прочный сплав, однакоэтот путь будет достаточно длинным (S2-S3-S4-S5-S6).
Таким образом, традиционноеэкспериментирование, предполагающее поочередное изменение переменных, ведет к нерациональномурасходованию времени и средств, тем более, что большая часть информации, полученнаяпосле подобной работы, часто вообще не представляет практического интереса,поскольку относится к области, далекой от оптимальных условий.
Та же задача методом крутоговосхождения решается следующим образом. Вблизи точки S1, начиная откоторой при обычном экспериментировании успех вообще мог быть не достигнут,ставят небольшую серию из четырех опытов (точки 1, 2, 3, 4 на рис. 1). Цельэтих опытов – еще не поиск состава наиболее прочного сплава. Определениепрочности первых четырех сплавов позволяет исследователю приближенно описатьнеизвестную поверхность отклика на небольшом участке вблизи точки S1,т. е. рассчитать коэффициенты регрессии уравнения:
/>.
/>
Рис. 1. Схема метода крутоговосхождения: I – y = b0 + b1x1 + b2x2; II – y = b'0 + b'1x1 + b'2x2
Найденные по результатамопытов коэффициенты b1 и b2 определяют направлениеградиента для данной аппроксимирующей плоскости, т. е. направление изменениясодержания алюминия и тантала в сплаве, приводящее к возможно более быстромуповышению прочности сплава. Сделав несколько опытов в этом направлении, т. е.осуществив крутое восхождение по поверхности отклика в направленииградиента линейного приближения (отсюда название метода), исследовательвыбирает новую исходную точку S7, возле которой вновь проводитаналогичную серию из четырех опытов, рассчитывает коэффициенты нового линейногоприближения теперь уже вблизи точки S7:
y = b'0 + b'1x1+ b'2x2
и осуществляет движение поградиенту этого уравнения. Движение по градиенту производят до попадания вобласть оптимума, после чего строят и анализируют нелинейную модель этой области.На рис. 1 градиент совпадает с прямой, перпендикулярной изолиниям, т. е. ссамым крутым склоном, ведущим от данной точки к вершине. Для поверхностиотклика, показанной на рис. 1, оказалось достаточно двух серий опытов, чтобыпри крутом восхождении найти состав наиболее прочного сплава.
Даже рассмотренный примерпоказывает, что планирование эксперимента принципиально отличается оттрадиционного экспериментирования. При планировании используется многофакторнаясхема эксперимента, когда эффект влияния какого-либо фактора оценивается порезультатам всех опытов. При традиционном экспериментировании (изменении одногофактора при постоянных остальных факторах) используется однофакторная схема,при которой эффект влияния фактора оценивается лишь по некоторой части опытов.Многофакторная схема существенно эффективней. Покажем это на простом примере.
Предположим, что необходимоопределить массу трех образцов А, В и С. Рассмотрим два способа проведенияэксперимента.
В первом случае схемавзвешивания будет такой, как показано в табл. 1. Здесь первый опыт представляетсобой холостое взвешивание, т. е. по сути дела, определение нулевого положениявесов.
Следующие опыты –поочередное взвешивание каждого из образцов. Масса каждого образца оцениваетсяпо результатам только двух опытов: того опыта, в котором взвешивается образец,и холостого взвешивания. Например, масса образца А = у2 — у1;образца В = у3 — у1; образца С = у4 — у1.
Схема взвешивания во второмслучае показана в табл. 2.
Здесь в первом опытевзвешивают все три образца вместе (холостое взвешивание не производится), а вследующих опытах – каждый образец в отдельности. В этом случае массу каждогообразца оценивают по результатам всех опытов. Действительно, масса образца />; образца />; образца />.
Таблица 1
Схема однофакторного эксперимента по взвешиванию образцов А, В и СНомер опыта А В С Результаты взвешивания 1 - - -
y1 2 + - -
y2 3 - + -
y3 4 - - +
y4
Таблица 2
Схема многофакторного эксперимента по взвешиванию образцов А, В иСНомер опыта А В С Результаты взвешивания 1 + + +
y1 2 + - -
y2 3 - + -
y3 4 - - +
y4
Какой же из способоввзвешивания лучше? Будем считать лучшим способом тот, который дает болеевысокую точность. Если воспользоваться законом сложения дисперсий, для первогоспособа взвешивания получим:
/>
где />– дисперсия результатоввзвешивания образцов; Sy – среднеквадратичная ошибка взвешивания.
Для второго способа />
Оказывается, второй способобеспечивает точность вдвое выше по сравнению с первым, хотя общее число опытовв обоих случаях одинаково. Произошло это по вполне понятной причине. Первыйспособ взвешивания является традиционной схемой эксперимента – типичнойоднофакторной. Несмотря на то, что здесь всего было сделано четыре опыта, массукаждого образца определяли только по результатам взвешивания двух образцов. Второйже способ представляет собой схему многофакторного эксперимента. Здесь массуобразца определяли по результатам всех опытов, а это и дает выигрыш в точности.Чтобы получить результаты с той же точностью при традиционномэкспериментировании, придется повторить все опыты, т. е. проделать по сути делавдвое большую работу. Легко показать, что с увеличением числа факторов эффективностьмногофакторного эксперимента растет.
2. Исходные данные
В разделе “Исходные данные”следует привести факторный план эксперимента, который выдается в табличнойформе в задании на самостоятельную работу, дать характеристику факторного планапо равномерности дублирования экспериментов в каждом опыте и дать краткоеописание (расшифровку) факторного плана.
По равномерностидублирования экспериментов различают факторные планы с равномерным(табл. 3) и неравномерным дублированием. Под дублированием понимаетсяне серия измерений в одном опыте (“несколько образцов на точку”), а полноеповторение опыта: приготовление сплава заново, новое проведение всехтехнологических операций механической обработки образцов и их подготовки киспытаниям.
Равномерное дублированиепредполагает повторение экспериментов в каждой серии опытов одинаковое числораз (дублей). В рассматриваемом примере полного факторного плана с равномернымдублированием (табл. 3) количество дублей составляет 3 на каждую серию опытов,а количество опытов – 8. Таким образом, для постановки эксперимента необходимо24 образца.
Неравномерное дублированиепредполагает повторение экспериментов в каждой серии опытов неодинаковое числораз. На практике неравномерное дублирование экспериментов используетсясравнительно редко из-за сложности построения регрессионных моделей по получаемымопытным данным.
При решении прикладных задачматериаловедения количество дублей в каждом опыте принимают не менее 3-х. Этообусловлено следующим обстоятельством. При изучении свойств большинстваматериалов одними из наиболее существенных факторов, которые эти свойства определяют,являются элементы химического состава материалов. Следовательно, план экспериментапредусматривает приготовление ряда сплавов определенного химического состава.Но готовить сплавы точно заданного состава (а этого требуют предпосылкирегрессионного анализа) не всегда просто. В том случае, когда попадание всостав неудовлетворительно, как и во всех остальных случаях непопаданияфакторов на заданный уровень, можно попытаться учесть ошибки в определениифакторов. Однако когда фиксация факторов на заданных уровнях происходит с оченьбольшими нарушениями, факторы (независимые переменные) можно считать случайнымипеременными, значения которых меняются от одного опыта к другому в соответствиис некоторым распределением. В этом случае следует вообще отказаться от использованиярегрессионного анализа и воспользоваться, например, конфлюэнтным анализом.
Расшифруем матрицупланирования с равномерным дублированием экспериментов, приведенную в табл. 3. Цельюисследований являлось изучение влияния химического состава чугунныхтормозных колодок на их износостойкость (y) в условиях сухого трения втрибосопряжении с контртелом из закаленной стали 45. Всего было произведеновосемь серий опытов. Каждый опыт дублировался 3 раза, следовательно,дублирование равномерное.
Варьируемыми факторами (независимымипеременными) являлись концентрации легирующих элементов в чугуне: алюминия (x1),марганца (x2), углерода (x3). Пределы варьированияхимического состава чугуна (см. табл. 3): Al – 10,8…11,0 %, интервалварьирования 0,1 %; Mn – 1,2…1,8 %, интервал варьирования 0,3 %; С – 31,4…32,6%, интервал варьирования 0,6 %. Условно содержание легирующих элементов поверхнему и нижнему пределам (уровням) обозначены через кодированные значения факторов“Хi = +1” и “ Хi = -1”. Верхний уровень “ Хi = +1” соответствует максимальному содержанию легирующего элемента, нижний уровень“ Хi = -1” – минимальному его содержанию.
Таким образом, переменные хiзадают химический состав сплава через концентрацию легирующих элементов внатуральном виде, а переменные Хi – в кодированном виде соответственночерез верхний (Хi = +1) и нижний (Хi = -1) уровни (табл.3). В дальнейшем для построения регрессионной модели сначала будутиспользоваться кодированные значения факторов Хi, а затем будетпроизводиться переход от кодированных значений факторов к их фактическим значениямхi.
Таблица 3
Матрица плана ПФЭ 23с равномерным дублированием экспериментовВарьируемый фактор Натуральные (фактические) значения факторов
Значения yiu (интенсивность изнашивания, г/см2)
х1 (% Al)
х2 (% Mn)
х3 (% С)
Основной уровень, хi0 10,9 1,5 32,0
Интервал варьирования, Dхi 0,1 0,3 0,6
Верхний уровень, хi(max) (Хi = +1) 11,0 1,8 32,6
Нижний уровень, хi(min) (Хi = -1) 10,8 1,2 31,4 № опыта, u Кодированные значения факторов и соответствующие им (в скобках) натуральные значения Номер дубля
Х1 (Al)
Х2 (Mn)
X3 (С) 1 2 3 u = 1 -1 (10,8 %) -1 (1,2 %) -1 (31,4%) 97,8 99,4 94,6 u = 2 +1 (11,0 %) -1 (1,2 %) -1 (31,4%) 128,3 130,0 124,4 u = 3 -1 (10,8 %) +1 (1,8 %) -1 (31,4%) 152,1 149,4 159,6 u = 4 +1 (11,0 %) +1 (1,8 %) -1 (31,4%) 73,8 71,2 70,7 u = 5 -1 (10,8 %) -1 (1,2 %) +1(32,6%) 110,3 118,5 112,2 u = 6 +1 (11,0 %) -1 (1,2 %) +1(32,6%) 93,8 91,1 90,4 u = 7 -1 (10,8 %) +1 (1,8 %) +1(32,6%) 126,2 130,3 124,8 u = 8 +1 (11,0 %) +1 (1,8 %) +1(32,6%) 114,2 110,4 111,9
В соответствии с даннымитабл. 3 для построения регрессионной зависимости интенсивности изнашиваниячугунных тормозных колодок от содержания в них углерода, алюминия и кремниянеобходимо произвести 24 эксперимента. Для того чтобы исключить влияние систематическихошибок, вызванных различными внешними условиями, данные эксперименты проводятсярандомизированно во времени, т. е. в случайной последовательности.
3. Расчет дисперсии опыта
Построчная дисперсия />для каждого экспериментаопределяется по формуле:
/> (1)
/> (2)
где g и nu — номер и количество дублей экспериментасоответственно; /> — результат g-го повторения u-гоэксперимента; /> — среднее арифметическое значениевсех дублей u — го эксперимента; fu — число степеней свободы в u — мопыте при определении u — й построчной дисперсии />.
Число степеней свободы – понятие,учитывающее в статистических ситуациях связи, ограничивающие свободу измененияслучайных величин. Это число определяется как разность между числом выполненныхопытов и числом констант (средних, коэффициентов и пр.), подсчитанных по результатамтех же опытов.
В нашем случае nu =3, fu = 3 — 1 = 2. Тогда выражение (1) можно переписать следующимобразом:
/> (3)
Построчная дисперсия повыражению (3) рассчитывается для каждого u — го опыта отдельно. Результатырасчетов построчной дисперсии приведены в табл. 4.
Таблица 4
Результаты расчета построчной дисперсии
Номер
опыта, u Номер дубля, g
Удельная потеря массы, />, г/см2
Среднее арифметическое значение интенсивности изнашивания, />, г/см2
Построчная дисперсия, /> 1 1 97,8 97,3 5,975 2 99,4 3 94,6 2 1 128,3 127,6 8,245 2 130,0 3 124,4 3 1 152,1 153,7 27,93 2 149,4 3 159,6 4 1 73,8 71,9 2,77 2 71,2 3 70,7 5 1 110,3 113,7 18,43 2 118,5 3 112,2 6 1 93,8 91,8 3,225 2 91,1 3 90,4 7 1 126,2 127,1 8,17 2 130,3 3 124,8 8 1 114,2 112,2 3,665 2 110,4 3 111,9
регрессия дисперсиядублирование
Приведем пример расчетапострочной дисперсии в первом опыте (u = 1):
/>
После определения построчныхдисперсий производят проверку воспроизводимости экспериментальных данных.Проверка выполняется в том случае, если имеет место дублирование опытов, чтоявляется обязательным правилом при проведении планированного эксперимента. Наэтой стадии проверяется гипотеза о постоянстве дисперсии шума с использованиемкритерия Кохрена. Проверка данной гипотезы позволяет судить об однородности илинеоднородности ряда дисперсий. Если ряд дисперсий однороден, различные значенияфункции отклика (y) определяются с одинаковой точностью. Если ряд дисперсийнеоднороден, различные значения функции отклика (y) определяются с разнойточностью.
Процедура проверкистатистических гипотез в общем случае формально предусматривает сравнениенекоторого критерия, рассчитанного по экспериментальным данным, с его табличнымзначением при выбранном заранее уровне значимости a. Уровень значимости a определяет наибольшую вероятность отвергнуть правильную гипотезу,т. е. наибольшую вероятность предположения о том, что экспериментальныйрезультат ошибочен. Например, если уровень значимости выбирают равным 0,05(что, очень часто делается в технических задачах), то это означает, чтодопускается 5%-ная вероятность неверного решения и доверительная 95%-ная вероятностьверного.
Если найденное по экспериментальнымданным значение критерия попадает в область, соответствующую уровню значимости,то проверяемая гипотеза неверна и ее следует отвергнуть, совершив ошибку свероятностью a. Если же экспериментальноезначение критерия попадает в область, соответствующую вероятности (1-a), то проверяемую гипотезу принимают, совершив ошибку, связаннуюуже с альтернативной гипотезой.
Расчетное значение критерияКохрена рассчитывается по формуле:
/>, (4)
где /> — наибольшая в ряду дисперсия,которую сравнивают со значением G — критерия, взятым из табл. А1 (приложение А)в зависимости от уровня значимости a, числа степеней свободы fu и числа опытов N: G(a; fu; N). В рассматриваемом случае fu = 2; N= 8.
Из табл. 4 находиммаксимальную построчную дисперсию /> и/>Тогда G pacч =27,93/78,4 = 0,356.
Приняв значение уровнязначимости a = 0,05, для числа степенейсвободы fu = 2 и числа опытов N = 8 получим следующее табличноезначение G-критерия: />.
Если G pacч , ряд дисперсийоднороден. Если G pacч > />, ряд дисперсий неоднороден.
В рассматриваемом примере G pacч> />, т.е. ряд дисперсий неоднороден.Обычно такая ситуация возникает, если среди анализируемых экспериментальныхданных имеются грубые ошибки или промахи, связанные с ошибками, допущенными припроведении эксперимента. В таком случае эксперимент следует повторить,тщательно проанализировав его с методологической точки зрения и уделив особоевнимание методике сбора и обработки экспериментальных данных. Если притщательном анализе экспериментальных данных грубых ошибок и промахов невыявлено, неоднородность ряда дисперсий означает, что значения функции отклика(y) действительно определены с разной точностью, однако в каждом отдельномопыте уровень шумов (ошибок) не выходит за границы допустимых значений. Именнотакой вывод справедлив для результатов измерений и расчетов, представленных втабл. 4. Во всех дублях значения функции отклика />очень плотно группируются относительносредних значений />.
4. Расчет коэффициентов регрессии
Модель изучаемого процесса представим в виде обобщенного уравнения:
y = b0+ S(biXi) + S(bijXiXj) + b123X1X2X3.(5)
Применительно к трехфакторному эксперименту уравнение (5) можнозаписать в виде:
y = b0+ b1X1 + b2X2+ b3X3 + b12X1Х2 +b13X1Х3 + b23X2Х3+ b123X1X2X3, (6)
где X1, X2, X3 – кодированныезначения уровней факторов (табл. 3). Кодированные значения уровней факторов вуравнении (6) могут принимать значения +1 и -1.
Коэффициенты уравнения регрессии (6) рассчитываются по зависимости:
/> (7)
где u — номер опыта; /> — кодированные значения уровнейварьируемых факторов /независимых переменных X1(Al), X2(Mn),X3(С) / (табл. 3); /> - средние арифметические значенияфункции отклика (интенсивности изнашивания) (табл. 4).
Распишем уравнение (7) для всех коэффициентов, входящих в регрессионнуюмодель (6):
/>/>/>/> (8)
/>/>/>/>
Для расчета коэффициентов регрессии составим расширенную матрицупланирования (табл. 5).
Таблица 5
Расширенная матрица плана 23
Номер
опыта
Х0
Х1
Х2
Х3
Х4 = Х1 Х2
Х5 = Х1 Х3
Х6= Х2 Х3
Х7 = Х1 Х2 Х3
/>, г/см2 1 +1 -1 -1 -1 +1 +1 +1 -1 97,3 2 +1 +1 -1 -1 -1 -1 +1 +1 127,6 3 +1 -1 +1 -1 -1 +1 -1 +1 153,7 4 +1 +1 +1 -1 +1 -1 -1 -1 71,9 5 +1 -1 -1 +1 +1 -1 -1 +1 113,7 6 +1 +1 -1 +1 -1 +1 -1 -1 91,8 7 +1 -1 +1 +1 -1 -1 +1 -1 127,1 8 +1 +1 +1 +1 +1 +1 +1 +1 112,2
Рассчитаем коэффициенты в уравнении регрессии (6) по зависимостям(8) с учетом знаков Хi в столбцах табл. 5:
/>
/>
/>
/>
/>
/>
/>
/>
Таким образом, получены следующие значения коэффициентов уравнениярегрессии:
b0= 111,9; b12= b4 = -13,14;
b1 = -11,03; b13= b5 = 1,83;
b2 = 34,5; b23= b6= 4,13;
b3 = -0,7125; b123= b7 = 14,89.
Если ввести обозначения b12 = b4; b13= b5; b23 = b6; b123 = b7и учесть обозначения, принятые в табл. 5, регрессионное уравнение (6) запишетсяв виде:
y = b0+ b1X1+ b2X2 + b3X3 + b4X4+ b5X5 + b6X6 + b7X7.(9)
5. Проверка статистической значимостикоэффициентов регрессии
Коэффициенты регрессии, рассчитанные по уравнению (7), строгоговоря, определены не точно, а с некоторой погрешностью. Мерой этой погрешностиявляется дисперсия оценок коэффициентов. Неизбежное наличие погрешностив определении коэффициентов регрессии обусловлено колебаниями значений функцииотклика при дублировании экспериментов в каждом опыте. С учетом этого уравнение(7) можно записать в следующем виде: /> Очевидно, что при достаточномалых значениях коэффициентов bi абсолютная погрешность ихопределения 2×Dbi,обусловленная погрешностью определения значений функции отклика, может оказатьсянедопустимо большой. В этом случае значение коэффициента следует признатьстатистически незначимым, а сам коэффициент исключить из регрессионной модели.Статистическая незначимость коэффициента означает отсутствие его влияния наисследуемый процесс.
Поскольку дублирование экспериментов равномерное, дисперсию оценоккоэффициентов уравнения регрессии можно рассчитать по зависимости:
/>, (10)
где nu – количество дублей в каждом опыте (nu= 3); N – количество опытов (N = 8); /> — средняя дисперсия эксперимента.
Если ряд дисперсий однороден, средняя дисперсия эксперимента рассчитываетсяпо уравнению:
/>, (11)
где /> — значения построчных дисперсий(табл. 4).
Если ряд дисперсий неоднороден (значения функции отклика в разныхопытах определены с различной точностью), но в результатах измерений значенийфункции отклика отсутствуют грубые ошибки и промахи, в качестве среднейдисперсии эксперимента принимается максимальная построчная дисперсия. Всоответствии с данными табл. 4 максимальная построчная дисперсия получена впервом опыте: />. Ее значение и принимаем как среднююдисперсию эксперимента:/>. Тогда дисперсия оценоккоэффициентов регрессии равна />
Среднеквадратичная ошибка />оценки коэффициентов регрессииопределяется как:
/>. (12)
Для рассматриваемого случая />
Рассчитаем доверительный интервал коэффициентов регрессии />:
/>, (13)
где /> — критерий Стьюдента, зависящий отуровня значимости a и числастепеней свободы f2 при определении дисперсии эксперимента:
/>
Для полного факторного эксперимента 23 f2 =(3-1)×8 = 16.
Выбрав уровень значимости a = 0,05, при числе степеней свободы f2 = 16 из табл. Б1(приложение Б) найдем табличное значение критерия Стьюдента (t-критерия) t0,05;16= 2,12. По выражению (13) рассчитаем доверительный интервал коэффициентоврегрессии: />
Коэффициенты уравнения регрессии, абсолютная величина которыхравна доверительному интервалу или больше его, следует признать статистическизначимыми. Т.е. для статистически значимых коэффициентов должно выполнятьсяусловие:
/> или />. (14)
Условие (14) означает, что абсолютные значения статистическизначимых коэффициентов регрессии bi должны не менее чем в />раз превышатьабсолютную ошибку их определения />.
Статистически значимыми коэффициентами, точность оценки которыхможно считать удовлетворительной, являются коэффициенты b0, b1,b2, b12 = b4, b13 = b5, b23= b6 и b123 = b7.
Статистически незначимые коэффициенты (b3) из модели следуетисключить, поскольку их значения не могут считаться достоверными.
Подставляя значения статистически значимых коэффициентов ввыражение (9), получим следующее уравнение регрессии:
/>. (15)
6. Проверка адекватности модели
Процедура проверки адекватности модели сводится к выполнению рядапоследовательных вычислений:
1. Расчет теоретических значений функции отклика в каждом опыте поуравнению (15).
2. Сопоставление расчетных и экспериментальных значений функцииотклика и нахождение дисперсии неадекватности.
3. Расчет критерия Фишера и окончательный вывод на основесопоставления его расчетного и табличного значений об адекватности или неадекватностимодели.
С помощью полученного уравнения (15) определим расчетные значения функцииотклика (удельной потери массы y). Все значения Хi в данноеуравнение входят в кодовом масштабе. Например, в 4-м опыте х1 = +1, х2 = +1, х3 = -1, х4 = +1, х7 = -1 (табл. 3, 5). Тогдарасчетное значение удельной потери массы в этом опыте будет равно:
у(4) = 111,9-11,03+34,5-13,14-1,83-4,13-14,89= 101,38г/см2.
Подсчитанные таким образом значения удельной потери массы приведеныв табл. 6. Данные табл. 4 будем использовать для определения дисперсиинеадекватности. При равномерном дублировании экспериментов дисперсиянеадекватности />определяется по зависимости:
/>; />, (16)
где />и /> — значения функции отклика в u-мэксперименте, соответственно рассчитанные по уравнению регрессии и определенныеэкспериментально; f1 – число степеней свободы; /> — число оставленных коэффициентовуравнения регрессии, включая b0(/>); N — число опытов плана (N = 8).Тогда f1 = 8 — 7 = 1.
Таким образом, если из регрессионной модели исключен, хотя бы одинстатистически незначимый коэффициент (а это неизбежно, если варьируемые факторыдействительно являются независимыми переменными), массив разностей />будетсодержать информацию об ошибках в предсказании значений функции отклика.
Таблица 6
Сопоставление экспериментальных и расчетных данныхНомер эксперимента, u
/>
/>
/>
/> 1 97,3 66,36 30,94 957,3 2 127,6 96,7 30,9 954,8 3 153,7 183,16 -29,46 867,9 4 71,9 101,38 -29,48 869,1 5 113,7 84,22 29,48 869,1 6 91,8 62,32 29,48 869,1 7 127,1 157,98 -30,88 953,6 8 112,2 143,08 -30,88 953,6
В рассматриваемом случае построенная модель (15) включает шестькоэффициентов: />. Тогда в соответствии свыражением (16) />.
Гипотеза об адекватности модели (15) проверяется по критериюФишера. Его расчетное значение находим по уравнению:
/>. (17)
/>.
Из выражения (17) следует,что расчетное значение критерия Фишера представляет собой отношение дисперсиинеадекватности к дисперсии опыта. По сути дела он позволяет ответить на вопрос:во сколько раз модель предсказывает значения функции отклика хуже по сравнениюс опытом? Тогда табличное значение критерия Фишера должно регламентировать допустимоеотклонение расчетных значений функции отклика относительно опытных данных.
Табличное значение критерияФишера определяется в зависимости от уровня значимости a и числа степеней свободы f1 и f2,определенных ранее: F(a; f1;f2). При уровне значимости a = 0,05 табличное значение F — критерия (табл. В1, приложение В) равно/>.
7. Анализ модели
Все соображения онаправлении и силе влияния изученных факторов на износостойкость чугунныхтормозных колодок можно высказать только для выбранных интервалов их изменения.
Из анализа полученногоуравнения регрессии (15), можно сделать вывод о том, что наиболее существенноувеличивает износостойкость фактор X3(С), а значит, для изготовлениятормозных колодок следует использовать чугун с максимальным содержаниемуглерода: 3,8 мас. %.
Установлено, что наименьшиеудельные потери массы (0,071 г/cм2) получены на образце № 7 (Al — 2,5 %, Mn — 12 %, С — 3,8 %) (табл. 6).