Разделы

Авто
Бизнес
Болезни
Дом
Защита
Здоровье
Интернет
Компьютеры
Медицина
Науки
Обучение
Общество
Питание
Политика
Производство
Промышленность
Спорт
Техника
Экономика

Основные понятия и определения теории планирования эксперимента

Как правило, любой объект исследования (носитель некоторых неизвестных и подлежащих изучению свойств или качеств) можно представить в виде «черного ящика» с определенным количеством входов и выходов (рис. 4.1.).

Входные переменные Хi, i = 1, 2,…k (где k – число переменных), определяющие состояние объекта называются факторами. Фиксированное значение фактора называют уровнем фактора. Основное требование к факторам достаточная управляемость, под которой понимается возможность установить нужный уровень фактора и стабилизировать его в течении всего опыта.

Выходная переменная Yg (обычно g = 1) – это реакция объекта на входные воздействия; она носит название функции отклика или цели. Выбор функции отклика определяется целью исследования, которая может представлять собой оптимизацию экономической (стоимость, производительность), технологической (точность, быстродействие), конструктивной (габариты, надежность) или другой характеристики объекта.

В результате эксперимента получают уравнение регрессии (аппроксимирующую функцию Y = f(X1, X2,…Xk)), которое часто называют статистической моделью процесса. Под аппроксимацией понимают замену точных аналитических выражений приближенными. В качестве уравнения регрессии обычно используют полином некоторой степени. Например, линейная зависимость при k =1 имеет вид Y = a0 + a1X, при k = 2  Y = a0 + a1X1 + a2X2. Квадратичная зависимость при k = 1 Y = a0 + a1X + a2X2. Где a0, a1, a2… – неизвестные коэффициенты регрессии, которые вычисляются на основании результатов эксперимента. Например, задавшись некоторым сочетанием факторов Xij (здесь i = 1, 2,…k – номер фактора, j =1, 2, …N – номер опыта), проведем первый опыт (j = 1) и получим функцию отклика Yj = Y1 при принятых значениях факторов (см. табл. 4.1).
Таблица 4.1



опыта

Значения функции
отклика

Значения факторов

1

Y1

X11

X21

Xi1

Xk1

2

Y2

X12

X22

Xi2

Xk2

j

Yj

X1j

X2j

Xij

Xkj

N-1

YN-1

X1,N-1

X2,N-1

Xi,N-1

Xk,N-1

N

YN

X1,N

X2,N

Xi,N

Xk,N

Затем возьмем другое сочетание факторов и вновь поставим опыт. В результате зафиксируем отклик Y2, соответствующий этому сочетанию и т.д. По результатам каждого опыта путем подстановки Xij и Yj в уравнение регрессии можно записать одно уравнение, в котором коэффициенты аппроксимирующего полинома не известны. Если число опытов совпадает с числом коэффициентов в аппроксимирующем полиноме, можно составить систему уравнений, решение которой дает значения искомых коэффициентов. В этом случае значения отклика Y, вычисленные по уравнению регрессии в точках эксперимента точно совпадают с их экспериментальными значениями. Кроме того, в силу конечного числа членов аппроксимирующего полинома расхождение между истинным и приближенным значениями функции отклика вне экспериментальных точек может быть значительным. В связи с изложенным возникает задача нахождения такого вида полинома и такого количества опытов, чтобы удовлетворялся некоторый критерий. Обычно в качестве критерия принимают сумму квадратов отклонений экспериментальных значений Yj от их расчетного значения. Наилучшим приближением аппроксимирующей функции к истинной считается функция, удовлетворяющая условию минимума этой суммы. Иными словами, в данном случае для определения коэффициентов аппроксимирующего полинома применяется наиболее универсальный метод наименьших квадратов.

Рассмотрим метод наименьших квадратов на примере квадратичной зависимости Y = a0 + a1X + a2X2. Посредством МНК значения a0, a1 и a2 находятся из условия минимизации суммы квадратов отклонений измеренных значений отклика Yj от получаемых с помощью регрессионной модели, т. е. путем минимизации суммы:
.
Минимизация суммы квадратов производится обычным способом с помощью дифференциального исчисления путем приравнивания к 0 первых частных производных по a0, a1 и a2.

Выполнив ряд преобразований, получим систему нормальных уравнений метода наименьших квадратов

Вычисляя из N опытов необходимые суммы и решая эту систему, находим значения коэффициентов a0, a1 и a2.

При использовании метода наименьших квадратов необходимым условием получения статистических оценок является выполнение неравенства N > d, т .е. количество опытов N должно быть больше, чем число коэффициентов полинома d. Увеличение N можно производить двумя различными путями: повторением опыта в исходных точках эксперимента либо увеличением количества этих точек. Второй путь дает возможность не только учесть погрешности измерения, но и оценить адекватность аппроксимирующего полинома во всей области экспериментирования и при необходимости повысить его порядок.

Основной особенностью рассматриваемой статистической (регрессионной) модели является то, что подобная модель не может точно описать поведение объекта в любом конкретном опыте. Исследователь не может предсказать точное значение Y в каждом опыте, но с помощью соответствующей статистической модели может указать, вокруг какого центра будут группироваться значения Y при данном сочетании значений факторов Xij.

Планированию эксперимента должен предшествовать этап неформализованных решений – выбора области экспериментирования (области планирования), т .е. области факторного пространства, изучение которой представляет интерес для исследователя. Границы этой области по каждому фактору Xi обусловлены его минимальным и максимальным значениями, т. е. .

Область планирования для случая учета двух факторов (X1 и X2) изображена на рис. 4.2. При трех факторах такая область представляет собой параллелепипед. При большем числе факторов она ограничивается гиперплоскостями в n-мерном пространстве.

Оценка границ области планирования факторов производится на основе принципиальных ограничений либо исходя из технико-экономических показателей.

Рис. 4.2. Пример области планирования для двух факторов

Для удобства обработки и интерпретации результатов эксперимента целесообразно все факторы представить в безразмерной форме. Для этого производят операцию линейного преобразования факторного пространства – операцию кодирования (нормализации). Ее сущность заключается в том, что начало координат факторного пространства переносится в точку с координатами  (центр эксперимента, на рис. – точка 0', где .
Кроме того, интервал варьирования факторов  разбивается на ряд уровней, симметричных относительно центра эксперимента. В случае составления симметричных двухуровневых планов все k факторов изменяются на двух уровнях. При этом значениям Xi max соответствует кодированная переменная xi = +1, а значениям Xi min соответствует xi = -1. Для количественных факторов связь между физическими (Xi) и кодированными (xi) значениями факторов определяется соотношением .

Описанные преобразования являются линейными, поэтому в аппроксимирующей функции изменяются только коэффициенты при факторах. Например, рассмотренные выше регрессионные зависимости будут иметь вид Y = b0 + b1x, при k = 2  Y = b0 + b1x1 + b2x2. Квадратичная зависимость при k = 1 Y = b0 + b1x + b2x2.

Следующим этапом является составление планов.

Для получения исчерпывающей информации о свойствах функции отклика в принципе необходимо проведение бесконечного числа опытов во всех точках области планирования эксперимента. В противном случае всегда существует теоретическая возможность пропустить некоторую особенность поверхности отклика. Указанную разновидность эксперимента можно назвать экспериментом с полным перебором всех входных состояний. Такой эксперимент носит число умозрительный, гипотетический характер и нереализуем на практике. Если для однофакторного случая можно еще представить себе некий эксперимент, в какой-то степени близкий к полному перебору, когда экспериментатор, постепенно уменьшая или увеличивая значение фактора, непрерывно следит за откликом, то в случае, когда число факторов больше одного, подобный эксперимент уже становится принципиально нереализуем.

Экспериментатор просто вынужден задаться дискретной сеткой значений факторов, выбрать какое-то фиксированное число уровней каждого фактора. В теории планирования эксперимента сознательно отказываются от полного перебора входных состояний или эксперимента близкого к нему по своей конструкции. Выбор числа уровней варьирования по каждому фактору непосредственно связывается с выбором вида функции отклика или точнее с выбором вида ее аппроксимации.

Составить план эксперимента – это значит определить, какое значение должен принимать каждый из факторов в каждом опыте. Точка плана – упорядоченная совокупность численных значений факторов, соответствующая условиям проведения опыта, точка факторного пространства, в которой проводится эксперимент.
Матрица плана – стандартная форма записи условий проведения экспериментов в виде прямоугольной таблицы, строки которой отвечают опытам, а столбцы факторам; размер матрицы плана . Она может иметь совпадающие строки; (i, u)-й элемент матрицы плана равен уровню i-го фактора в j-м опыте. Пример матрицы плана в табличном виде приведен в правой части таблицы 5.1.

Матрица спектра плана – матрица, составленная из всех строк матрицы плана, отличающихся уровнем хотя бы одного фактора. Размер матрицы спектра n×k; все строки этой матрицы различны.

Матрица дублирования – квадратная диагональная матрица, диагональные элементы которой равны числам параллельных опытов в соответствующих точках спектра плана.

План эксперимента может быть задан либо матрицей плана, либо матрицей спектра плана в совокупности с матрицей дублирования.
Следует отметить, что прежде чем приступить к составлению плана, нужно определить регрессионную модель объекта, поскольку план и модель неразрывно связанные понятия. В настоящее время изданы каталоги планов эксперимента, в которых приводятся сравнительная оценка планов и рекомендации по их выбору применительно к конкретным условиям эксперимента. Одну и ту же задачу, как правило, можно решать с помощью различных планов эксперимента. Это значит, что при разных планах параметры модели и предсказанные значения отклика будут оцениваться с разной точностью.
В качестве примера рассмотрим модель, включающую только линейные эффекты и эффекты взаимодействия двух факторов: Y = b0 + b1x1+b2x2+b12x1x2. Планы используемые для данной модели называются планами первого порядка. Чтобы получить информацию, необходимую для определения коэффициентов полинома достаточно провести полный факторный эксперимент при двух уровнях факторов, т.е. реализовать план ПФЭ 2k. Полным факторным экспериментом называется эксперимент, в котором реализуются все возможные сочетания уровней факторов (для n уровней факторов число опытов равно nk). В рассматриваемом случае число опытов N = 22 = 4. Соответствующая матрица планирования приведена в таблице 4.2.

Матрица планирования двухфакторного эксперимента

Таблица 4.2


№ опыта

x1

x2

1

-1

-1

2

+1

-1

3

-1

+1

4

+1

+1

По результатам эксперимента, проведенного в соответствии с представленным планом, можно определить все четыре коэффициента полинома. В данном случае N = d = 4, условие N > d не выполняется, что не позволяет произвести статистические оценки аппроксимирующей зависимости. Для получения таких оценок нужно ограничиться линейной зависимостью без учета взаимовлияния факторов (при этом d = 3 < N = 4) либо провести дополнительный опыт в нулевой точке x1 = x2 = 0 (тогда N = 5 < d = 4).

Теория планирования эксперимента рекомендует, как правило, начинать с простейшей модели (например, с линейной модели, если нет информации о свойствах объекта или есть информация, что объект не обладает ярко выраженными нелинейными свойствами, или с квадратичной модели, если известно, что функция отклика, по всей видимости, нелинейна).

Логика экспериментирования здесь такова: постановка небольшого числа опытов для получения простейшей модели, проверка ее пригодности; если модель удовлетворяет исследователя, эксперимент заканчивается. Если же модель не пригодна, необходим следующий цикл экспериментирования: постановка новых (дополнительных опытов), позволяющих получить более сложную модель, ее проверка и т.д. до тех пор, пока не будет получена модель, которую исследователь признает достаточно хорошей (рис. 5.3)

Рис. 4.3. Структурная схема эксперимента

Если обратиться к наиболее распространенным полиномиальным моделям, то подобная логика означает, что исследователь обычно начинает с построения простейшей линейной модели, для чего достаточно варьировать каждый фактор всего на двух уровнях. Затем, в случае неудачи, он переходит к построению квадратичных моделей; для этого нужно минимум три уровня варьирования по каждому фактору. Обычно исследователь довольно быстро определяет подходящую модель и экономит значительное число опытов по сравнению с вариантом, когда сразу ищется модель максимальной сложности. Согласно этой концепции при проведении эксперимента необходимо использовать последовательную, шаговую стратегию. После каждого шага производится анализ результатов, затем принимается решение о дальнейшей деятельности.

Точность получаемой модели обязательно должна быть сопоставлена с интенсивностью случайной помехи, воздействующей на результат измерения отклика Y. При прочих равных условиях, чем меньше уровень помехи, тем более точной (и, как правило, сложной) должна быть модель; чем выше уровень помехи, тем в большей степени можно ожидать, что более простая (необычно менее точная) модель окажется работоспособной. Фактически здесь можно провести известную аналогию с задачами теории измерений, ясно, например, что подключение прибора высокого класса точности для измерения переменной, отягощенной большой случайной ошибкой есть расточительность.

Например, для однофакторной ситуации приведенной на рис. 4.4, теоретическая функция отклика весьма сложной формы, и кроме того имеет место значительная случайная помеха. В данном случае для предсказания Y по Х нецелесообразно использовать сложную модель, поскольку все равно точность предсказания будет определяться в основном шумовой составляющей.

Рис. 4.4. К принципу сопоставления с шумом:
1 – теоретическая функция отклика; 2 – линейная модель

На примере рис. 4.4 можно проиллюстрировать понятие «корреляционной связи», которое широко используется при обработке экспериментальных данных. Если две переменные зависят друг от друга так, что каждому значению Х соответствует значение Y, то между ними существует функциональная связь. Однако часто между переменными Х и Y существует связь, но не вполне определенная. Одному значению X соответствует несколько значений (совокупность) Y. В этом случае связь называют корреляционной. Чтобы предварительно определить наличие корреляционной связи между Х и Y, наносят точки на график и строят так называемое корреляционное поле. По тесноте группирования точек вокруг прямой или кривой линии, по наклону линии можно визуально судить о наличии корреляционной связи. Так, из рис. 4.4 видно, что экспериментальные данные имеют определенную связь между Х и Y. По форме поля можно ориентировочно судить о форме графика, характеризующей прямолинейную или криволинейную зависимости.

Поскольку многие реальные объекты характеризуются высоким уровнем помех, при их описании получили наибольшее распространение полиномиальные регрессионные модели, причем в подавляющем числе случаев порядок такой модели равен 1 или 2. Подобные модели широко используются при создании различного рода инженерных методик расчета тех или иных устройств, схем и агрегатов, так как необходимая точность расчетов обычно весьма невелика (порядка 5 – 15 %).

При нестабильных условиях эксперимента последовательность опытов должна быть случайной. Это позволяет в определенной мере скомпенсировать влияние различного рода помех. Процесс организации случайной последовательности опытов называется рандомизацией. Тем самым обеспечивается представительность полученной выборки, т.е. гарантируется возможность с помощью измерения свойств конечного набора элементов из совокупности высказать обоснованное суждение о свойствах всей совокупности в целом. При проведении различного рода экспериментов принцип рандомизации предусматривает случайный порядок реализации строк матрицы плана.

Таким образом, можно выделить следующую последовательность процедур планирования эксперимента:
– выбирается цель исследования и ее количественная характеристика (функция отклика);
– выбираются из k действующих в системе факторов наиболее важные X1, X2, ….Xk;
– устанавливаются пределы изменений факторов  и , вычисляются основной уровень  и интервал (шаг) варьирования , заменяются переменные Xi на кодированные xi ;
– разрабатывается методика измерения выбранных факторов, определяется погрешность и число повторений в каждой из выбранных комбинаций факторов;
– выбирается регрессионная модель процесса. В случае недостатка информации вначале принимается линейная модель;
– составляется или выбирается по справочным таблицам план эксперимента;
– проводится эксперимент;
– вычисляются коэффициенты регрессии изучаемой зависимости и проверяется адекватность полученной модели. Если линейная модель не согласуется с экспериментом, то проводятся дополнительные опыты для построения более сложных зависимостей.
– проводится анализ полученного в итоге уравнения регрессии и делаются соответствующие выводы.

Дата публикации:2012-11-10

Просмотров:3353

Вернуться в оглавление:

Комментария пока нет...


Имя* (по-русски):
Почта* (e-mail):Не публикуется
Ответить (до 1000 символов):







 

2012-2018 lekcion.ru. За поставленную ссылку спасибо.