Конспект лекций по предмету "Метрология"


Регрессионный анализ и планирование эксперимента

| следующая статья ==>




При пассивном эксперименте исследователь не имеет возможности воздействовать на изучаемый объект. Вследствие того, что на значение выходного параметра помимо входного фактора влияет фактор случайности. Эта зависимость не является однозначно определенной и в простейшем виде может быть представлена аддитивной математической моделью:
, (14.1)
где Е – случайные отклонения.
Если экспериментальные данные нанести на график, то значимость (у) от (х) будет диффузной (расплывчатой). Такая не вполне определенная зависимость называется регрессионной, а зависимость приведенного вида представляет собой регрессию. Линия, наилучшим образом выравнивающая зависимость средних значений называется уравнением регрессии. Регрессия – это закон изменения условного математического ожидания выходной величины в зависимости от изменения входной величины. Для линейного случая уравнение регрессии имеет вид:
, (14.2)
где α – коэффициенты регрессии.
Задача изучения механизма явления считается решенной, если найдена регрессионная модель и оценены статистические характеристики случайных отклонений. Регрессионная модель является приближенной оценкой истинной функциональной зависимости. Регрессионную модель принято записывать в виде:
, (14.3)
где - оценки рассчитанных коэффициентов.
Регрессионная модель – это аналитическое описание линии регрессии. Если экспериментальные данные нанести на график, то линии регрессии можно аппроксимировать прямой, участком синусоиды, параболы, эллипса и т.п. Большую трудность при подборе вида аппроксимирующих функций оказывает разброс экспериментальных данных относительно предполагаемой кривой. Этот разброс определяется фактором случайности на выходной параметр.
Когда зависимости плохо интерпретируемы, используют быстрые и простые графические методы, например, метод контура, метод медианных центров.
Метод наименьших квадратов (МНК) – более строгий метод подбора эмпирических зависимостей – является общей частью корреляционного и регрессионного анализов, задача которых получение коэффициентов уравнения регрессии.
Как корреляционный, так и регрессионный анализы состоят из двух частей: расчет коэффициентов уравнения регрессии методом МНК и статистическая оценка результатов. Если МНК можно применять при любых статистических данных, распределенных по любому закону плотности вероятности, то дать статистическую оценку полученным коэффициентам и уравнению регрессии можно лишь на основе определенных теоретических предпосылок. Корреляционный и регрессионный анализы различаются теоретическими предпосылками, т.е. способами статистической оценки.
Задача корреляционного анализа – исследование тесноты корреляционной связи между случайными переменными процесса и получение коэффициентов уравнения регрессии. Теснота корреляционной связи исследуется путем вычисления коэффициентов парной и множественной корреляции, взаимной и автокорреляционных функций.
Для непрерывных случайных переменных взаимная корреляционная функция между случайными переменными определяется формулой:
(14.4)
На практике обычно используют дискретные замеры через равные промежутки времени, а интеграл заменяют суммой.
Расчет корреляционной функции является весьма трудоемкой операцией, поэтому используют ЭВМ. Существуют хорошо отработанные программы расчета корреляционных функций. Взаимные корреляционные функции используются в теории планирования эксперимента для учета динамики в объектах с непрерывными технологическими процессами. На рисунке приведен пример типичной взаимной корреляционной функции.

Рис. 14. 1 Вид взаимной корреляционной функции.

По расположению максимума этой функции на оси времени определяется время эквивалентного запаздывания. Физический смысл этого понятия состоит в том, что всякий скачок функции на входе объекта наиболее полно отражается на выходе из него только через определенный промежуток времени.
Данный принцип применяется в устройствах измерения скорости потока меточными методами, например, с использованием солевых растворов.
В теории эксперимента применяют также автокорреляционные функции. По ним оценивают величину промежутков времени между соседними измерениями входного сигнала. Эти промежутки называются временем корреляции.
. (14.5)
Статистические критерии являются правилами, которые позволяют делать статистические выводы о свойствах параметров генеральной совокупности с принятым уровнем значимости. Для этой цели широко применяют критерии Стьюдента, Пирсона, Фишера.
Теоретические предпосылки применения методики корреляционного анализа:
· все входные и выходные случайные переменные должны подчиняться многомерному нормальному закону распределения вероятности;
· все случайные процессы должны быть стационарными, т.е. их средние значения и дисперсии не должны существенно изменяться во времени;
· все выходные случайные переменные не должны быть функционально связаны между собой;
· отдельные измерения по каждой их входных переменных должны быть статистически независимыми;
· все входные переменные должны измеряться с пренебрежимо малой ошибкой, существенно меньшей шумового поля.
Перечисленные требования являются достаточно жесткими ограничениями, однако в ряде случаев они все же удовлетворяются. Условия многомерного нормального распределения случайных переменных сужают область применения корреляционного анализа, поэтому они применяются лишь для получения линейных математических моделей.
Задачи регрессионного анализа - исследование тесноты статистической связи между входными и выходными случайными переменными с помощью регрессионных уравнений и коэффициентов. В простейшем случае получают двумерное регрессионное уравнение, в котором участвует лишь одна переменная.
Регрессионный анализ позволяет решать более широкий класс задач, чем корреляционный анализ, и получать оценки коэффициентов нелинейности уравнений регрессии.
Теоретические предпосылки для регрессионного анализа являются менее жесткими:
· случайные помехи должны иметь нормальный закон распределения;
· дисперсии выхода во всех точках факторного пространства должны быть однородными;
· все соседние измерения по каждой входной переменной должны быть независимыми;
· случайные помехи на выходе объекта в каждом опыте должны быть независимы друг от друга, а также от значений входных переменных и коэффициентов уравнений регрессии.
Таким образом, при регрессионном анализе не требуется, чтобы все входные переменные были распределены нормально.
При экспериментальном исследовании объекта качество полученных результатов и произведенные затраты определяются организацией эксперимента. В связи с этим, помимо исследования эффективных методов обработки экспериментальных данных, необходимо оптимизировать сам эксперимент по следующим параметрам: числу учитываемых входных факторов, интервалам варьирования и числу уровней варьирования факторов, сочетанием их и последовательностью проведения опытов.
При проведении эксперимента необходимо включать в рассмотрение все факторы, которые могут влиять на выходной параметр. В ходе эксперимента последовательно можно устанавливать несколько значений уровней факторов. Такой эксперимент называется полным факторным экспериментом (ПФЭ). Эксперимент, в котором встречаются не все возможные сочетания уровней факторов, называется дробным факторным экспериментом (ДФЭ).
Если факторы варьируются на (р) уровнях, то число опытов для ПФЭ будет , где к – число факторов. Поэтому выбор сочетаний уровней факторов, их числа и порядка постановки опытов является целью планирования эксперимента.
Ортогональным называется план с попарно ортогональными вектор-столбцами матрицы планирования. Использование критерия ортогональности имеет целью упрощение вычислений и получение независимых оценок коэффициентов. При этом замена любого коэффициента в модели не изменяет оценок остальных коэффициентов.
В ряде случаев реальные объекты имеют нелинейные зависимости. Один из часто встречающихся видов нелинейности связан с эффектом взаимодействия, когда значение одного фактора зависит от значения другого фактора. Для того, чтобы найти оценку коэффициента при парном взаимодействии, необходимо, пользуясь правилом перемножения столбцов, получить столбец произведения двух факторов.
На рисунке представлена матрица планирования эксперимента с варьированием двух факторов по двум уровням («+» - верхний уровень, «-» – нижний уровень сигнала).

№ опыта




у
1
2
3
4
+
+
+
+
+
-
+
-
+
+
-
-
+
-
-
+





С учетом эффекта взаимодействия математическая модель запишется следующим образом:
, (14.6)
. (14.7)
Столбцы () и () задают планирование, и по ним непосредственно определяются условия опытов, а столбцы (- фиктивная переменная) и () служат только для расчета.
· Матрица планирования должна обладать следующими свойствами: симметрией т.е. сумма элементов столбца каждого фактора должна быть равна нулю относительно центра эксперимента (центра между уровнями);
· нормальностью, т.е. сумма квадратов элементов каждого столбца должна быть равна числу опытов;
· ротабельностью, т.е. равенством точности предсказания значений отклика на равных расстояниях от центра эксперимента.
При увеличении числа входных факторов общее число опытов в ПФЭ резко увеличивается. При построении линейных моделей имеется возможность сокращения числа опытов за счет потери информации, несущественной для данного вида моделей.
Пользуясь таким планированием, можно вычислить четыре коэффициента для рассматриваемого примера. Если имеется основание считать, что эффект парного взаимодействия отсутствует, то последний столбец можно представить в виде варьирования нового фактора . Тогда оценка коэффициентов, удовлетворяющих МНК, определяются по выражениям:
; ; ; . (14.8)
Так какв данном плане как взаимодействие , то оценка четвертого коэффициента является смешанной. Поставив только четыре опыта для оценки влияния трех факторов, была использована только половина всех возможных для данного примера вариантов. На основании данного примера можно сделать вывод о том, что с целью уменьшения числа опытов часть факторов целесообразно варьировать как взаимодействие.
Разрешающей способностью такой полуреплики называют число независимых переменных, входящих в определенный контраст. Дробные реплики широко применяются при получении линейных моделей. Целесообразность их возрастает по мере роста числа факторов. Если план обладает избыточностью опытов для нахождения оценок коэффициентов регрессионного уравнения, то он называется насыщенным.
При увеличении числа рассматриваемых факторов для уменьшения числа экспериментов можно воспользоваться и другими специальными методами, например, планом в виде латинского квадрата, греко-латинского квадрата и др. Планы второго порядка используют для нахождения коэффициентов нелинейных моделей второго порядка.

| следующая статья ==>


Не сдавайте скачаную работу преподавателю!
Данный конспект лекций Вы можете использовать для создания шпаргалок и подготовки к экзаменам.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем конспект самостоятельно:
! Как написать конспект Как правильно подойти к написанию чтобы быстро и информативно все зафиксировать.