Разделы

Авто
Бизнес
Болезни
Дом
Защита
Здоровье
Интернет
Компьютеры
Медицина
Науки
Обучение
Общество
Питание
Политика
Производство
Промышленность
Спорт
Техника
Экономика

Стратегическое планирование машинных экспериментов с моделями систем

.

Общая совокупность таких векторов образует план эксперимента, а совокупность различных векторов, число которых обозначим N, – спектр плана.

В активном эксперименте факторы могут принимать только фиксированные значения. Фиксированное значение фактора называют уровнем фактора. Количество принимаемых уровней факторов зависит от выбранной структуры факторной модели и принятого плана эксперимента. Минимальный и максимальный , (k – число факторов) уровни всех факторов выделяют в факторном пространстве некоторый гиперпараллелепипед, представляющий собой область планирования. В области планирования находятся все возможные значения факторов, используемые в эксперименте.

Вектор задает точку центра области планирования. Координаты этой точки обычно выбирают из соотношения

. (6.1)

Точку называют центром эксперимента. Она определяет основной уровень факторов , . Центр эксперимента стремятся выбрать как можно ближе к точке, которая соответствует искомым оптимальным значениям факторов. Для этого используется априорная информация об объекте.

Интервалом (или шагом) варьирования фактора xj называют величину, вычисляемую по формуле

(6.2)

Факторы нормируют, а их уровни кодируют. В кодированном виде верхний уровень обозначают +1, нижний 1, а основной 0. Нормирование факторов осуществляют на основе соотношения

(6.3)

Для переменных ,начало координат совмещено с центром эксперимента, а в качестве единиц измерения используются интервалы варьирования факторов. Геометрическое представление области планирования при двух факторах показано на рис. 6.3. Центр эксперимента находится в точке 0 с координатами . Точки 1, 2, 3, 4 являются точками плана эксперимента. Например, значения факторов x1 и x2 в точке 1 равны соответственно и , а нормированные их значения

В дальнейшем будем предполагать, что в планах активных экспериментов факторы нормированы.

План эксперимента удобно представлять в матричной форме. План эксперимента задается либо матрицей плана, либо матрицей спектра плана в совокупности с матрицей дублирования.

 

 

х2

х2max 3 +1 4

Dх2

1 0 +1

х2min 1 1 2

 

0 х1min х1 maxх1

Рис. 6.3. Геометрическое представление области планирования при двух факторах: x1 и x2

 

Матрица плана представляет собой прямоугольную таблицу, содержащую информацию о количестве и условиях проведения опытов. Строки матрицы плана соответствуют опытам, а столбцы факторам. Размерность матрицы плана L х k, где L – число опытов, k – число факторов. При проведении повторных (дублирующих) опытов в одних и тех же точках плана матрица плана содержит ряд совпадающих строк.

Матрица спектра плана – это матрица, в которую входят только различающиеся между собой строки матрицы плана. Размерность матрицы спектра плана N х k, где N – число точек плана, различающихся между собой хотя бы одной координатой .

Матрица спектра плана имеет вид

(6.4)

где вектор, определяющий нормированные значения координат точки плана в i-м опыте; xij нормированное значение j-го фактора в i-м опыте.

Матрица дублирования – квадратная диагональная матрица n, диагональные элементы которой равны числам параллельных опытов в соответствующих точках спектра плана:

. (6.5)

Опыты при выполнении эксперимента проводятся в последовательности, предусмотренной матрицей плана. Эта матрица составляется лишь при необходимости рандомизации опытов, когда в результатах эксперимента можно ожидать наличие систематических ошибок. Для выбора случайной последовательности опытов используется таблица равномерно распределенных случайных чисел. Первое число таблицы выбирают произвольно, желательно случайным образом, а затем, начиная с этого числа, выписывают L чисел таблицы, где L – число опытов (с учетом их дублирования). При этом числа, большие L, а также уже выписанные, отбрасываются.

В вычислительных экспериментах опыты проводят в соответствии с матрицей спектра плана, так как предполагается отсутствие систематических ошибок и поэтому нет необходимости в рандомизации опытов.

Определение базисных функций с помощью регрессионного анализа.Регрессионный анализ проводится с целью получения по экспериментальным данным регрессионных моделей, представляющих собой экспериментальные факторные модели. Задачей регрессионного анализа является определение параметров экспериментальных факторных моделей объектов проектирования или исследования, т.е. определение коэффициентов уравнений моде­лей при выбранной их структуре.

Регрессионный анализ включает три основных этапа:

1) статистический анализ результатов эксперимента;

2) получение оценок искомых коэффициентов регрессии ;

3) оценку адекватности и работоспособности полученной экспериментальной факторной модели технической системы.

Под структурой экспериментальной факторной математической модели понимается вид математических соотношений между факторами X, V и откликом Y. В качестве факторов принимают внутренние и внешние параметры технической системы, подлежащие оптимизации в процессе ее проектирования. Внутренние параметры системы это параметры ее элементов, внешние это параметры внешней среды, в условиях воздействий которой осуществляется функционирование системы. Функциями отклика Y являются выходные параметры технической системы, характеризующие ее эффективность и качество процессов функционирования. Выходные параметры системы принимаются в качестве критериев оптимальности.

Как уже отмечалось, структура факторной модели выбирается на основе априорной информации, используя принцип постепенного ее усложнения. Параметры факторной математической модели определяются методами регрессионного анализа. При определении параметров этими методами нет необходимости различать виды факторов, т. е. подразделять факторы на управляемые Х и неуправляемые V. Поэтому в дальнейшем все они будут обозначаться буквой Х. Тогда факторную модель можно представить векторным уравнением регрессии вида

. (6.6)

Определение параметров В этой модели будем рассматриватьна примере одного уравнения . Для определения параметров используются результаты эксперимента. Результаты эксперимента можно представить функцией вида

(6.7)

где аддитивная помеха случайного характера с нормальным законом распределения.

Так как каждый опыт проводится при определенном сочетании уровнейфакторов X, то функцию представим выражением

(6.8)

где – j-й элемент вектора искомых коэффициентов уравнения регрессии: – j-я базисная функция элемент вектора базисных функций

В качестве базисных функций используют полиномы простейших переменных, системы ортогональных полиномов, тригонометрические функции. Наиболее часто пользуются полиномами первой и второй степеней. Например, полином первой степени, описывающий функцию отклика у при двух факторах x1 и x2, может иметь вид

(6.9)

или

(6.10)

а полином второй степени

(6.11)

Базисные функции в случае использования последнего выражения имеют вид:.

Если уравнение регрессии имеет вид выражений (6.9), (6.10), его называют уравнением линейной регрессии (линейной регрессией или регрессией первого порядка), а если содержит факторы во второй и более высокой степени – нелинейной регрессией (регрессией соответствующего порядка).

Линейная регрессия может представлять как линейную математическую модель, так и нелинейную, в зависимости от того, содержит ли она линейные эффекты (как в выражении(6.9),или наряду с ними также эффекты взаимодействия (как в выражении (6.10)). Линейным называют эффект, характеризующий линейную зависимость выходного параметра у от соответствующего фактора xi. Эффектом взаимодействия называют эффект, характеризующий совместное влияние нескольких факторов на у (например, в выражении (6.10) ). Эффекты взаимодействия двух факторов называют парным взаимодействием, трех факторов тройным взаимодействием и т.д.

Как всякий статистический метод, регрессионный анализ применим при определенных предпосылках (постулатах).

1. Аддитивная помеха случайная нормально распределенная величина с параметрами =0 и =const. В этом случае функция отклика Y также случайная величина с нормальным законом распределения. Гипотезу о нормальном распределении Y можно проверить по критерию Пирсона.

2. Постоянство дисперсии помехи означает, что интенсивность ошибки определения Y не меняется при изменении уровня факторов в процессе эксперимента. Выполнение этого постулата проверяется по критерию однородности дисперсии в разных точках опыта.

3. Значения факторов в активном эксперименте неслучайные величины. Это означает, что установление каждого фактора на заданном уровне и удерживание его на этом уровне во время опыта точнее, чем ошибка воспроизводимости. В вычислительном эксперименте это выполняется однозначно, а в физическом вклад, вносимый ошибками измерения факторов Х, должен быть пренебрежимо малым в сравнении с действием других неконтролируемых факторов, образующих ошибку e определения функции Y.

4. Значения помехи e в различных точках опыта некоррелированы. Для обеспечения этих требований используется рандомизация опытов. В пассивном эксперименте условие некоррелированости помехи обеспечивают путем соответствующего выбора временного интервала съема информации об условиях и результатах опытов.

5. Векторы-столбцы базисных функций должны быть линейно независимыми. Выполнение этого требования необходимо для получения раздельных оценок всех коэффициентов регрессии . В активном эксперименте оно обеспечивается соответствующим выбором спектра плана эксперимента. При этом число опытов N (без учета дублирования) должно быть не меньше, чем число оцениваемых коэффициентов NB, т. е. N≥NB.

В пассивном эксперименте линейная зависимость между столбцами практический исключается, так как факторы неуправляемы и принимают случайные значения в различных опытах, но может наблюдаться сильная коррелированность столбцов, что повлечет за собой большие ошибки вычисления коэффициентов регрессии. Для выявления коррелированности столбцов проводят корреляционный анализ результатов пассивного эксперимента.

Оценка параметров регрессионной модели.Исходными данными для получения оценок параметров регрессионной модели технической системы (т.е. оценок искомых коэффициентов регрессии ) является информация о значениях управляемых факторов (или неуправляемых при проведении пассивного эксперимента) и функции отклика Y. Эту информацию можно представить в виде матрицы X значений факторов во всех N опытах, предусмотренных спектром плана эксперимента, и вектора-столбца полученных в этих опытах значений функции отклика Y:

(6.12)

(6.13)

где вектор-строка значений факторов в i-м опыте; xij значение j-го фактора в i-м опыте; k – количество факторов; N – количество опытов; значение функции отклика Y в i-м опыте (если проводились параллельные опыты, т. е. осуществлялось дублирование опытов, то вместо используются оценки их математических ожиданий, т.е. выборочные средние ).

Значения базисных функций во всех опытах представляют собой матрицу F, называемую матрицей базисных функций

(6.14)

где значение m-ой базисной функции в i-м опыте; вектор-строка значений базисных функций в i-м опыте.

Используя информацию об X, и F, необходимо найти оценки коэффициентов регрессии, представляемые вектором-столбцом

(6.15)

где bk значение оценки коэффициента регрессии при базисной функции .

Так как функция отклика Y – случайная величина, поскольку на ее значения в различных опытах оказывает влияние случайная помеха ε, то оценки коэффициентов регрессии будут случайными величинами.

Уравнение регрессии устанавливает зависимость между оценкой математического ожидания функции отклика и факторами . Общий вид этой зависимости

(6.16)

В связи с наличием помехи значение функции отклика в i-м опыте будет отличаться от . Для определения можно составить выражение

, (6.17)

где εi - невязка уравнения регрессии в i-м опыте.

Невязка характеризует отклонение значений функции отклика в опытах от получаемых с помощью регрессионной модели (6.16). Она возникает по двум причинам: из-за ошибки эксперимента и из-за непригодности (приближенности) выбранной структуры факторной математической модели. Причем эти причины смешаны и нельзя сказать, какая из них преобладает.

Если постулировать, что модель пригодна, то невязка будет порождаться только ошибкой опыта. Тогда для определения коэффициентов уравнения (6.16) невязку надо минимизировать. Для этого в регрессионном анализе используется метод наименьших квадратов (МНК). Составляется функция, представляющая собой сумму квадратов невязок, и осуществляется ее минимизация, т.е.

(6.18)

Подставим значение εi из выражения (6.17)

(6.19)

В выражении (6.19) коэффициенты bm рассматриваются как неизвестные переменные, которые наилучшим образом соответствуют полученным результатам эксперимента. Значения этих коэффициентов, при которых достигается минимум функции Е, принимаются в качестве оценок коэффициентов регрессии. Минимум функции Е имеет место при равенстве нулю частных производных этой функции по переменным b0, b1, …, bd:

После преобразований получим систему линейных неоднородных алгебраических уравнений относительно искомых оценок коэффициентов регрессии b0, b1, …, bd:

(6.20)

Очевидно, что коэффициенты при неизвестных переменных этой системы уравнений являются элементами матрицы Ф, определяемой из выражения

, (6.21)

в котором F представляет собой матрицу базисных функций (6.14). Значения элементов матрицы F известны из проведенного эксперимента. Следовательно, элементы матрицы Ф оказываются известными коэффициентами системы уравнений (6.20). Выпишем матрицу Ф

(6.22)

Матрицу Ф называют информационной матрицей Фишера. Она содержит (d +1) строк и (d+1) столбцов, причем, элемент j-й строки m-го столбца представляет собой сумму Матрица Ф симметрична относительно главной диагонали, что упрощает составление системы алгебраических уравнений (6.20) для регрессионной модели.

Систему уравнений (6.20) можно также записать в матричной форме

(6.23)

Система уравнений (6.20) имеет единственное решение, если определитель матрицы Ф не равен нулю. В этом случае матрица Ф будет невырожденной. Выполнение пятой предпосылки регрессионного анализа, изложенной в предыдущем параграфе, исключает возникновение вырожденности.

Решение системы уравнений (6.20) обычно осуществляют методом Гаусса. При небольшом числе определяемых коэффициентов bk можно использовать правило Крамера.

Полученные методом наименьших квадратов оценки b0, b1, …, bd действительных значений коэффициентов регрессии β0, β1…, βd обладают следующими свойствами:

1) математические ожидания оценок , т. е. оценки bj несмещенные;

2) дисперсии оценок коэффициентов регрессии минимальны и равны

(6.24)

а корреляционный момент

(6.25)

где Cjj, Cjm элементы матрицы Ф-1, обратной к информационной; дисперсия случайной помехи;

3) оценки b0, b1, …, bd подчиняются совместному (d + 1)-мерному нормальному распределению.

Планы экспериментов и их свойства. Для проведения активных экспериментов разработано множество различных планов. Планы учитывают как особенности структуры регрессионных моделей, так и требования их эффективности с позиций повышения точности получаемых моделей и снижения затрат на проведение эксперимента.

При построении линейных моделей или нелинейных, содержащих только взаимодействия факторов, но без квадратов этих факторов (регрессий первого порядка), каждый фактор можно варьировать только на двух уровнях. Для получения таких моделей используют планы первого порядка.

Известно несколько разновидностей планов первого порядка. Эти планы различаются в зависимости от структуры регрессионной модели. Они предназначены для планирования следующих видов экспериментов:

· однофакторного (классического) эксперимента;

· полного факторного эксперимента;

· дробного факторного эксперимента.

Если в регрессионную модель входят факторы в квадрате или с более высокими степенями, то необходимо не менее трех уровней варьирования факторов. При построении квадратичных моделей применяют планы второго порядка. Эти планы часто используют в качестве своего ядра какой-либо план первого порядка, который дополняется так называемыми звездными точками.

Планы различают по степени насыщенности. План называют насыщенным, если общее число точек плана равно числу неизвестных параметров регрессионной модели. Такой план позволяет получить экспериментальную факторную модель при минимальных затратах, так как обеспечивает минимум числа опытов.

План называется композиционным, если в спектр его в качестве составной части входят точки спектра плана, который был реализован при построении более простой модели. Композиционность плана позволяет реализовать принцип постепенного усложнения модели при минимальных затратах, так как при этом используются результаты опытов, выполненных для получения простой модели. Многие планы второго порядка являются композиционными.

Важным свойством плана является его ортогональность. У ортогональных планов информационная матрица Фишера Ф диагональная, а столбцы матрицы базисных функций F попарно ортогональны. Для ортогонального плана при заданных значениях диагональных элементов матрицы Ф дисперсии оценок коэффициентов регрессии bk минимальны. Причем эти оценки получаются независимыми, что существенно облегчает их вычисление и анализ.

При изменении вида плана изменяется матрица Ф, что влияет на дисперсии оценок коэффициентов регрессии. Различают D-, А- и E-оптимальные планы. Они обеспечивают различные формы эллипсоидов рассеивания оценок. D-оптимальный план минимизирует обобщенную дисперсию оценок коэффициентов регрессии и обеспечивает минимальный объем эллипсоида их рассеивания. А-оптимальный план минимизирует среднюю дисперсию всех оценок, а эллипсоид имеет наименьшую сумму квадратов длин осей. Эллипсоид рассеивания у Е-оптимального плана имеет минимальную длину своей наибольшей оси.

В зависимости от возможностей предсказания отклика по уравнению регрессии различают планы ротатабельные и униформные. План называется ротатабельным, если дисперсия предсказания отклика постоянна на фиксированном расстоянии от центра эксперимента. Униформный план обеспечивает практически постоянное ее значение в некоторой области факторного пространства. Свойства ротатабельности или униформности обеспечиваются соответствующим выбором точек матрицы спектра плана. Задача выбора оптимального плана довольно сложная и в большинстве случаев не имеет аналитического решения. Поэтому поиск оптимальных планов обычно осуществляется численными методами на ЭВМ.

Рассмотрим основы построения и основные свойства планов первого порядка.

План однофакторного эксперимента. Однофакторный (классический) эксперимент предназначен для получения линейной экспериментальной факторной модели вида

(6.26)

Однофакторный эксперимент предусматривает поочередное варьирование каждого из факторов при фиксированных на некотором уровне значениях остальных факторов. Фактор xi варьируют на двух уровнях xiв и xiн, а все остальные при этом должны находиться в точке центра эксперимента , . Для нормированных факторов хiв = +1, хiн = 1, хj = 0. С учетом этого составим матрицу спектра плана однофакторного эксперимента

(6.27)

Число точек плана в этом случае N = 2k, где k – количество факторов. Точки спектра плана располагаются в центрах граней гиперкуба.
На рис. 6.4, а показано расположение точек для двумерного случая, а
на рис. 6.4, б — для трехмерного.

Вектор базисных функций имеет вид

(6.28)

а матрица F численных значений базисных функций отличается от матрицы спектра плана Х только одним дополнительным столбцом, соответствующим базисной функции

(6.29)

 

 

       
   
 
 

 


Рис. 6.4. Расположение точек спектра однофакторного эксперимента:

а – при двух факторах; б – при трех факторах

Матрица базисных функций F обладает очевидными свойствами:

1) (6.30)

(6.31)

2) (6.32)

(6.33)

3) (6.34)

где N – число точек спектра плана; – значение m-й базисной функции в i-м опыте.

Согласно выражению (6.34) векторы-столбцы всех базисных функций попарно ортогональны.

Используя свойства (6.32)(6.34) и выражение (6.22), легко составить информационную матрицу Фишера Ф = FTF

(6.35)

Так как матрица Ф диагональная, то план однофакторного эксперимента ортогональный и коэффициенты регрессии некоррелированы друг с другом. Для определения дисперсии оценок коэффициентов регрессии (6.26) вычислим обращенную матрицу Фишера.

(6.36)

Искомые дисперсии оценок коэффициентов регрессии определяются произведениями дисперсии помехи на соответствующие диагональные элементы матрицы Ф-1 :

(6.37)

Очевидно, что точность получаемой модели в этом случае невысокая, так как коэффициенты регрессии bm, (кроме коэффициента b0) имеют высокое значение дисперсии. Поэтому однофакторный эксперимент следует признать явно неудовлетворительным для построения модели технической системы. В связи с этим в настоящее время он практически не применяется. Следует отметить, что рассмотренный план обладает свойством ротатабельности.

План полного факторного эксперимента.Спектр плана полного факторного эксперимента (ПФЭ) содержит все возможные комбинации значений факторов на всех уровнях их изменения. Число точек N спектра плана определяется по формуле

N=qk, (6.38)

где q – число уровней варьирования факторов; k – количество факторов.

Рассмотрим особенности и свойства ПФЭ, применяемых при построении линейных регрессий вида

(6.39)

Для получения линейной регрессии достаточно варьировать факторы на двух уровнях, т. е. q = 2. Тогда число точек спектра плана будет

N=2k. (6.40)

Такой план принято обозначать ПФЭ2k.

Рассмотрим порядок составления матрицы спектра плана, полагая, что факторы нормированы и, следовательно, могут принимать значения только либо +1, либо 1. Напомним, что столбцы матрицы Х соответствуют значениям факторов x1, x2, …, xk.

Для составления матрицы спектра плана используется следующее простое правило: в первой строке матрицы все факторы равны 1, в первом столбце знаки единиц меняются поочередно; во втором столбце они чередуются – через 2; в третьем – через 4; в четвертом – через 8 и т. д. по степеням двойки. Следовательно, для каждого последующего столбца частота изменения знака в два раза меньше, чем для предыдущего.

Используя изложенное правило чередования знаков, составим матрицы спектров планов для случаев k = 2 и k = 3, т. е. для двух и трех факторов.

При k = 2 число точек плана N = 22 = 4, а матрица спектра плана имеет вид

(6.41)

при n=3 N=23=8, а матрица X

(6.42)

Спектры планов можно изобразить в привычной для экспериментатора табличной форме. В табл. 6.1 приведен спектр плана ПФЭ22, а в табл. 2 спектр плана ПФЭ23.

Таблица 6.1

i Факторы
x1 x2
-1 -1
+1 -1
-1 +1
+1 +1

 

Таблица 6.2

i Факторы
X1 x2 x3
-1 -1 -1
+1 -1 -1
-1 +1 -1
+1 +1 -1
-1 -1 +1
+1 -1 +1
-1 +1 +1
+1 +1 +1

 

В табл. 1, 2 и в последующем буквой i обозначен номер точки спектра плана.

Точки плана ПФЭ2k располагаются в вершинах k-мерного гиперкуба. На рис. 6.4, а показано расположение точек для двумерного случая, а
на рис.6.5, б – для трехмерного.

 


Рис.6.5. Расположение точек спектра плана ПФЭ2k:

а – при k = 2; б – при k = 3

Посредством ПФЭ можно построить как простейшую линейную модель технической системы вида

, (6.43)

так и нелинейную.

Для модели вида (6.43) система базисных функций очевидна:

Число базисных функций в этом случае равно k + 1.

Выясним, какие базисные функции могут входить в регрессионную модель, получаемую посредством ПФЭ2k, чтобы выполнялось требование о линейной независимости векторов-столбцов этих функций. При выполнении этого требования получают раздельные оценки всех коэффициентов регрессии. Линейная независимость столбцов матрицы F достигается, если в ней отсутствуют полностью совпадающие или полностью противоположные (по знакам) столбцы.

В общем случае в полиномиальную модель могут входить факторы в любой степени и различные комбинации из их произведений. Так как при нормированных факторах их значения равны 1 или +1, а в качестве показателей степеней факторов принимаются целые числа, то при четных показателях степеней вектор-столбец базисной функции состоит только из +1 и совпадает с вектором-столбцом функции , а векторы-столбцы всех базисных функций, соответствующих одним и тем же факторам хj, возведенным в любые нечетные степени, будут совпадающими. Вместе с тем легко убедиться, что любые комбинации произведений факторов x1, x2, …, xk могут быть в числе базисных функций.

Выпишем выражения линейных регрессий при k = 2 с учетом всех возможных сочетаний взаимодействия факторов

. (6.44)

При k = 3 получаем

(6.45)

В табл. 6.3 приведены базисные функции плана ПФЭ22, используемого для построения регрессионной модели (6.44), а в табл. 6.4 плана ПФЭ23, используемого для модели (6.45). Прямоугольниками в этих таблицах обведены спектры планов.

Таблица 6.3

i f0=1 f1=x1 f2=x2 f3=x1x2
+1 -1 -1 +1
+1 +1 -1 -1
+1 -1 +1 -1
+1 +1 +1 +1

 

Таблица 6.4

i f0=1 f1=x1 f2=x2 f3=x3 f4=x1x2 f5=x1x3 f6=x2x3 f7=x1x2x3
+1 -1 -1 -1 +1 +1 +1 -1
+1 +1 -1 -1 -1 -1 +1 +1
+1 -1 +1 -1 -1 +1 -1 +1
+1 +1 +1 -1 +1 -1 -1 -1
+1 -1 -1 +1 +1 +1 -1 +1
+1 +1 -1 +1 -1 -1 -1 -1
+1 -1 +1 +1 -1 +1 +1 -1
+1 +1 +1 +1 +1 -1 +1 +1

 

Уравнение линейной регрессии, как это видно из (6.39) и (6.45), может содержать следующее предельное количество коэффициентов при различных видах базисных функций:

· один коэффициент b0 – свободный член уравнения регрессии;

· п коэффициентов bj линейных членов уравнения регрессии;

· Сn2коэффициентов bj,m при парных взаимодействиях факторов;

· Сn3 коэффициентов bj,m,l при тройных взаимодействиях факторов и т. д.;

· один коэффициент b1,2,…,k при взаимодействии факторов максимального, k-го порядка.

Выражение для определения общего числа коэффициентов регрессии имеет вид

. (6.46)

Так как при использовании всех возможных сочетаний факторов в уравнении регрессии число определяемых коэффициентов NB равно числу точек N спектра плана ПФЭ2k, то такой план является насыщенным.

Численные значения , приведенные в таблице базисных функций, являются элементами матрицы F. Матрица Fплана ПФЭ2k обладает следующими свойствами.

1. Свойство симметричности относительно центра эксперимента – алгебраическая сумма элементов каждого столбца матрицы базисных функций, кроме столбца , равна нулю

(6.47)

где значение j-й базисной функции, соответствующее i-й строке матрицы F; i – номер точки спектра плана; N – число точек спектра плана;
NB количество базисных функций.

2. Свойство ортогональности столбцов – сумма построчных произведений элементов любых двух столбцов равна нулю

(6.48)

3. Свойство нормировки – сумма квадратов элементов каждого столбца матрицы базисных функций равна числу точек N спектра плана

(6.49)

4. Для столбца базисной функции сумма элементов также равна N

(6.50)

Выражения (6.47) (6.50) записаны в предположении, что дублирование опытов не производится.

Составим информационную матрицу Фишера Ф, определяемую выражением (6.22). Выражения (6.48) и (6.49) позволяют определить элементы матрицы Ф. Очевидно, что для IIФЭ2k матрица Ф диагональная с постоянными диагональными элементами

(6.51)

Следовательно, ПФЭ2k относятся к классу ортогональных планов.

Так как матрица Ф диагональная, то корреляционные моменты оценок коэффициентов регрессии и оценки всех коэффициентов регрессии bj, j =некоррелированы друг с другом. Кроме того, все коэффициенты регрессии оцениваются с одинаковой точностью, так как диагональные элементы матрицы Ф одинаковы. Дисперсия оценок коэффициентов

. (6.52)

Для линейной модели вида (6.43) план ПФЭ2k является А- и E-оптимальным и ротатабельным, а для модели (6.39) – D-оптимальным.

План дробного факторного эксперимента.Наряду с отмеченными положительными качествами полного факторного эксперимента он имеет существенный недостаток: увеличение количества факторов приводит к быстрому росту числа опытов, что обусловлено степенной зависимостью (6.38). Например, при k = 10 спектр плана содержит N = 210 = 1024 опыта. Кроме того, необходимо дублирование опытов.

ПФЭ позволяет построить регрессионную модель, которая учитывает влияние на функцию отклика выбранных факторов и всех возможных сочетаний взаимодействий этих факторов. Но поскольку структура модели выбирается на основе априорной информации о физических свойствах исследуемого объекта, то весьма сложно представить себе влияние на характеристики его функционирования эффектов взаимодействий выше второго или третьего порядка. Обычно при построении многофакторной регрессионной модели ограничиваются парными или, в крайнем случае, отдельными тройными взаимодействиями факторов. В этом случае ПФЭ оказывается избыточным, так как число точек спектра плана N значительно больше количества коэффициентов регрессии NB. В результате возникает возможность сокращения числа опытов. Но при этом, естественно, должно соблюдаться условие возможности оценки коэффициентов регрессии по результатам опытов, которое выражается соотношением N ≥ NB.

Во многих случаях на начальной стадии моделирования технической системы в связи с отсутствием необходимой информации о влиянии на ее выходные параметры различных факторов (внутренних или внешних параметров) строят линейную модель вида (6.43). Например, при трех факторах выбирают модель в виде

(6.53)

В этом уравнении четыре коэффициента регрессии, а при k = 3 спектр плана ПФЭ, согласно выражению (6.40), содержит 8 точек, т.е. предусматривает 8 опытов в различных точках факторного пространства. Следовательно, четыре опыта оказываются избыточными и их можно было бы исключить, естественно, при условии выполнения принятых предпосылок регрессионного анализа, прежде всего ортогональности столбцов матрицы базисных функций F.

При построении математических моделей, использующих упрощенные уравнения регрессий, когда N > NB, применяют дробные факторные эксперименты (ДФЭ). Наибольшее распространение имеют регулярные планы ДФЭ типа 2k-p, т. е. ДФЭ2k-p, где k – число факторов, р – степень дробности ДФЭ. Планы ДФЭ принято называть репликами с указанием их степени дробности. Так, план ДФЭ2k-1 называют полурепликой ПФЭ2k (1/2-реплика); ДФЭ2k-2 1/4-реплика ПФЭ2k; ДФЭ2k-3 1/8-реплика ПФЭ2k и т.д. Полуреплика сокращает число опытов в два раза по сравнению с ПФЭ, 1/4-реплика в четыре раза и т.д.

При построении матрицы спектра плана ДФЭ2k-p необходимо обеспечить выполнение условий, описываемых выражениями (6.47)(6.50), принимая во внимание, что число точек спектра этого плана определяется по формуле

(6.54)

Условия (6.47)(6.50) удовлетворяются, если в матрице базисных функций F отсутствуют полностью совпадающие или полностью противоположные столбцы, что позволяет получить раздельное оценивание всех коэффициентов регрессии.

При выборе степени дробности ДФЭ должно выполняться условие

. (6.55)

Выбранные базисные функции для ДФЭ составляют лишь некоторую часть базисных функций соответствующего ПФЭ. Назовем эти функции существенными переменными, характеризующими в наибольшей мере физические свойства технического объекта.

Процедура построения спектра плана ДФЭ2k-p содержит четыре этапа.

Этап 1. Выбор структуры уравнения регрессии и определение степени дробности ДФЭ. При этом исходят из условия выполнения
соотношения (6.55).

Этап 2. Выбор ведущих факторов и построение для них матрицы спектра плана, определяющего программу их изменения в ходе эксперимента.

Число m ведущих факторов принимают равным разности между количеством факторов п и степенью дробности ДФЭ

m=k – p. (6.56)

Для выбранных ведущих факторов x1, x2,…, xm строят план ПФЭ2m, используя изложенное в предыдущем параграфе правило чередования знаков.

Этап 3. Построение матрицы Х спектра плана ДФЭ2k-p. Часть этой матрицы составляет матрица спектра плана ПФЭ2m, а во вторую часть должны войти столбцы матрицы для остальных факторов xm+1, xm+2,…, xk, количество которых равно

р = k – m. (6.57)

Столбцы матрицы X, соответствующие этим факторам, определяют путем перемножения соответствующих столбцов ведущих факторов. Для этого используют генерирующие соотношения. Генерирующим соотношением называется алгебраическое выражение, устанавливающее связь между одним из факторов xm+1, xm+2,…, xk и произведением какой-либо комбинации ведущих факторов x1, x2, …, xm. Пример xm+1=x1x2x3.

Чтобы получаемые столбцы были ортогональными, для каждого из них задается отдельное генерирующее соотношение (количество этих соотношений равно р). Выбор генерирующих соотношений, вообще говоря, произволен. Однако в качестве генерирующих нельзя использовать те произведения ведущих факторов, которые входят в состав существенных переменных, так как в этом случае в матрице базисных функций F окажутся совпадающие столбцы: для одного из факторов xm+1, xm+1, …, xk и одного из взаимодействий факторов из числа существенных переменных.

Генерирующее соотношение имеет вид

(6.58)

где xm+i фактор, не включенный в число ведущих (для него определяется столбец матрицы Х спектра плана ДФЭ2k-p); xj, xl, xn, … ведущие факторы.

Количество ведущих факторов, входящих в генерирующее соотношение (6.58), может быть произвольным, но соотношения (6.58) для всех xm+i должны быть разными.

Этап 4. Проверка пригодности полученного спектра плана. Для этого необходимо построить матрицу базисных функций F и проверить, нет ли в ней совпадающих или полностью противоположных столбцов, т.е. выяснить, обладает ли матрица F свойством ортогональности столбцов, определяемым выражением (6.48). Если в матрице F нет совпадающих или противоположных столбцов, полученный спектр плана ДФЭ2k-p пригоден для решения поставленной задачи. В противном случае выполняются последовательно следующие процедуры до тех пор, пока не будет обеспечена ортогональность:

· выбираются иные генерирующие соотношения;

· изменяется набор ведущих факторов;

· уменьшается степень дробности плана р.

При ограниченных возможностях проведения опытов степень дробности плана сохраняют, а изменяют структуру уравнения регрессии (например, используют иные взаимодействия факторов или исключают какую-либо базисную функцию, соответствующую одному из взаимодействий высшего порядка).

Таким образом, регулярные планы ДФЭ2k-p обладают теми же свойствами, что и планы ПФЭ2k. Матрица F удовлетворяет выражениям (6.47)(6.50). Информационная матрица Фишера Ф диагональная и имеет вид (6.51). Дисперсию оценок коэффициентов регрессии определяют по формуле (6.52). Планы ДФЭ2k-p ортогональны. Для линейных моделей они ротатабельны. А- и E- оптимальны, а насыщенные планы D- оптимальны. Поскольку планы ДФЭ значительно экономичнее планов ПФЭ, они получили широкое практическое применение. В частности, их используют для анализа чувствительности целевой функции к вариации параметров технических объектов в процессе их отсеивания и отбора для осуществления оптимизации.

Рассмотрим примеры построения планов ДФЭ.

Пример 1. Получить спектр плана ДФЭ, предназначенного для оценки коэффициентов уравнения регрессии вида (6.53).

Так как число факторов в этом уравнении три (x1, x2, x3), то при проведении ПФЭ количество точек спектра плана было бы равно N=23=8. В уравнении же (6.53) всего четыре коэффициента, поэтому можно использовать полуреплику, т.е. ДФЭ231, спектр плана которой содержит четыре точки: N = 231 = 4, и следовательно, условие (6.55) выполняется.

Число ведущих факторов m = k – р = 3 1 = 2. Выберем в качестве ведущих факторов х1 и х2 Значения элементов векторов-столбцов этих факторов получим на основе плана ПФЭ22, используя метод чередования знаков. Для определения вектора-столбца фактора x3 примем генерирующее соотношение в виде х3 = х1х2. Полученный спектр плана ДФЭ23–1 выделен прямоугольником в табл. 6.5, в которой приведена матрица базисных функций F.

Таблица 6.5

i f0=1 f1=x1 f2=x2 f3=x3
+1 +1 +1 +1 -1 +1 -1 +1 -1 -1 +1 +1 +1 -1 -1 +1

В матрице F нет совпадающих столбцов, следовательно, полученный спектр плана пригоден для решения поставленной задачи.

Пример 2. Задан список существенных переменных: x1, x2, x3, x4, x1x2, x2x3, x3x4. Получить спектр плана ДФЭ.

Уравнение регрессии в этом случае будет включать 4 фактора и 8 коэффициентов, а число точек спектра плана ПФЭ равно N = 24 = 16.

Следовательно, можно попытаться использовать ДФЭ24-1 , спектр плана которого содержит необходимое число точек N = 8 и обеспечивает выполнение условия (6.55).

Число ведущих факторов m = k – р = 3. Выберем в качестве ведущих факторы x1, x2, x3. Для фактора x4 необходимо указать генерирующее соотношение. Возможно несколько вариантов: x1x2, x1x3, x2x3, x1x2x3. Соотношения x1x2 и x2x3 принимать нельзя, так как эти взаимодействия факторов входят в список существенных переменных, в результате их вектор-столбцы будут совпадать с вектором-столбцом фактора x4. Выберем для начала генерирующее соотношение х4 = х1х2х3. Вычислив значения элементов столбцов базисных функций f4=x4, f5=x1x2, f6=x2x3, f7=x3x4, получим матрицу F, которая приведена в табл. 6.6. Спектр плана ДФЭ24-1 обведен прямоугольником.

Таблица 6.6

i f0=1 f1=x1 f2=x2 f3=x3 f4=x4=x1x2x3 f5=x1x2 f6=x2x3 f7=x3x4
+1 -1 -1 -1 -1 +1 +1 +1
+1 +1 -1 -1 +1 -1 +1 -1
+1 -1 +1 -1 +1 -1 -1 -1
+1 +1 +1 -1 -1 +1 -1 +1
+1 -1 -1 +1 +1 +1 -1 +1
+1 +1 -1 +1 -1 -1 -1 -1
+1 -1 +1 +1 -1 -1 +1 -1
+1 +1 +1 +1 +1 +1 +1 +1

 

Векторы-столбцы и оказались одинаковыми, следовательно, полученный план непригоден. Последовательно перебирая все возможные варианты решения проблемы, можно убедиться, что ни один из них не дает положительного результата. Это означает, что при заданном списке существенных переменных план ДФЭ24-1 не может быть применен для получения искомого уравнения регрессии. Следовательно, необходимо использовать план ПФЭ24.

Пример 3. Введем небольшое изменение в список существенных переменных примера 2: вместо примем .

Те же действия, что и в предыдущем примере, дают значения элементов матрицы F, приведенные в табл. 6.7.

Таблица 6.7

i f0=1 f1=x1 f2=x2 f3=x3 f4=x4=x1x2x3 f5=x1x2 f6=x2x3 f7=x3x4
+1 -1 -1 -1 -1 +1 +1 +1
+1 +1 -1 -1 +1 -1 +1 -1
+1 -1 +1 -1 +1 -1 -1 +1
+1 +1 +1 -1 -1 +1 -1 -1
+1 -1 -1 +1 +1 +1 -1 -1
+1 +1 -1 +1 -1 -1 -1 +1
+1 -1 +1 +1 -1 -1 +1 -1
+1 +1 +1 +1 +1 +1 +1 +1

 

В матрице F все столбцы различны и она пригодна для получения уравнения регрессии выбранной структуры.

Следует отметить, что генерирующие соотношения можно принимать также с обратным знаком, например, . В этом случае лишь поменяются знаки в векторах-столбцах базисных функций и на противоположные, но это не приведет к изменению свойств матрицы F, оцениваемых выражениями (6.47)(6.50).

Если принять генерирующее соотношение , то спектр плана ДФЭ24-1 также окажется пригодным, что легко проверить (рекомендуется для самостоятельной работы).

Генерирующие соотношения и определяющие контрасты. Если матрица базисных функций F плана ДФЭ содержит полностью совпадающие или противоположные столбцы, то это исключает возможность раздельного оценивания коэффициентов регрессии, соответствующих этим столбцам. В этом случае говорят, что имеет место смешанная оценка. Коэффициенты регрессии при этом оказываются коррелированными.

Для выяснения системы смешивания используют определяющие контрасты. Определяющие контрасты матрицы F представляют собой произведения левых и правых частей генерирующих соотношений.

Генерирующее соотношение, устанавливающее связь между фактором и ведущими факторами , имеет вид

(6.59)

Умножим левую и правую части этого выражения на . Учитывая, что элементы столбца матрицы F при нормированных факторах равны или , получим . В результате определяющий контраст будет представлен выражением

(6.60)

Число определяющих контрастов, так же как и число генерирующих соотношений ДФЭ, равно р. Составив выражения определяющих контрастов для всех генерирующих соотношений и перемножив их левые и правые части, получим обобщенный определяющий контраст (ООК). При этом в правой части полученного произведения может оказаться некоторое количество одинаковых сомножителей, например, т сомножителей фактора . В этом случае следует иметь в виду, что при четном числе сомножителей результат их перемножения равен единице, а при нечетном равен , т. е.

Для определения системы смешивания влияния переменных в ДФЭ обобщенный определяющий контраст умножают на каждую переменную, т.е. на каждую базисную функцию. Если при этом получают одинаковые результаты для какой-либо пары базисных функций, то соответствующие столбцы матрицы Fокажутся совпадающими и оценки коэффициентов регрессии при этих базисных функциях будут коррелированными (смешанными). Такой план ДФЭ непригоден для получения регрессии заданной структуры. В общем случае может оказаться несколько пар совпадающих столбцов матрицы F.

В табл. 6.8 приведены результаты определения системы смешивания влияния переменных в ДФЭ24-1 для примера 2. В этом примере использовано одно генерирующее соотношение: . В результате выражение ООК имеет вид: .

Одинаковые результаты оценок системы смешивания выделены. Из таблицы видна смешанность оценок влияния переменных и на функцию отклика, что не дает возможности осуществить раздельную оценку коэффициентов регрессии при этих переменных.

Таблица 6.8

Переменные уравнения регрессии ООК Система смешивания
x0 x1 x2 x3 x4 x1x2 x2x3 x3x4   1 = x1x2x3x4 x0 = x1x2x3x4 x1 = x2x3x4 x2 = x1x3x4 x3 = x1x2x4 x4 = x1x2x3 x1x2=x3x4 x2x3= x1x4 x3x4 =x1x2

 

Статистический анализ результатов активного эксперимента. Прежде чем определять оценки коэффициентов регрессии, необходимо выполнить статистический анализ результатов эксперимента с целью оценки их качества и пригодности для построения регрессионной модели. Статистический анализ включает оценку ошибок параллельных опытов, отсеивание грубых ошибок, проверку однородности дисперсий опытов и определение дисперсии воспроизводимости эксперимента.

Ошибки параллельных опытов.В условиях наличия случайных помех с целью уменьшения случайных погрешностей эксперимента и повышения точности получаемой регрессионной модели осуществляется дублирование опытов, т.е. проведение параллельных опытов. Каждый опыт, предусмотренный матрицей спектра плана, повторяется раз. Рекомендуется число n принимать одинаковым для всех N точек плана. В результате проводится опытов, в соответствии с матрицей плана, предусматривающей при этом рандомизацию опытов.

Повторные опыты в одной и той же точке плана при наличии помехи дают различные результаты при определении функции отклика. Разброс результатов относительно оценки математического ожидания функции отклика называют ошибкой воспроизводимости опыта. Эту ошибку надо оценить.

Для каждой точки плана по результатам параллельных опытов находят выборочное среднее , равное среднему арифметическому полученных опытных значений функции отклика

(6.61)

где и – номер параллельного опыта; значение функции отклика в -м параллельном опыте -й точки спектра плана.

Для оценки отклонения функции отклика от ее среднего значения вычисляется дисперсия воспроизводимости опыта по данным n параллельных опытов в каждой -й точке спектра плана

(6.62)

При вычислении принимают число степеней свободы m на единицу меньше, чем число параллельных опытов, т.е. , так как одна степень свободы уже использована для вычисления . Это обеспечивает несмещенность оценки дисперсии воспроизводимости опыта .

Отсеивание грубых ошибок. Формула (61) справедлива лишь при нормальном распределении случайной величины у. При наличии грубых ошибок опыта распределение у отклоняется от нормального, что противоречит предпосылкам 1 и 2, положенным в основу регрессионного анализа. Поэтому грубые ошибки надо вначале исключить, а затем определять и . Грубые ошибки – это брак повторных опытов. Для обнаружения брака используют -критерий Стьюдента

(6.63)

Значения и определяются по формулам(61) и (62), но без учета оцениваемого результата опыта .

Полученное значение -критерия сравнивается с табличным при выбранном уровне значимости и числе степеней свободы m. Уровень значимости γ характеризует вероятность ошибки. Если , то это соответствует браку данного опыта и результат его не может быть использован. В этом случае опыт подлежит повторному проведению.

Значения -критерия Стьюдента зависят от числа степеней свободы m и уровня значимости γ.

Проверка однородности дисперсий. Однородность дисперсии означает, что среди всех дисперсий нет таких, которые бы значительно превышали все остальные. Для проверки однородности дисперсий во всех точках спектра плана используется либо критерий Кохрена G, либо критерий Фишера F.

Критерий Кохрена основан на распределении отношения максимальной дисперсии к сумме всех дисперсий

(6.64)

Критерий Кохрена применяется, если количество сравниваемых дисперсий больше двух, а число повторных опытов во всех точках плана одинаково. Определив число степеней свободы и (N – число точек спектра плана, n – количество повторных опытов в каждой точке плана), находят табличное значение критерия Кохрена . Если , гипотеза об однородности дисперсий и воспроизводимости результатов принимается. Это означает, что предпосылки 1 и 2, положенные в основу регрессионного анализа, выполняются. В этом случае каждая из дисперсий оценивает одну и ту же дисперсию помехи . Следовательно, полученные результаты эксперимента качественные и могут быть использованы для построения регрессионной модели. В противном случае следует увеличить число параллельных опытов или повторить эксперимент при строгом соблюдении методики и схемы проведения опытов, предприняв необходимые меры для исключения грубых ошибок.

Если выяснится, что непостоянство дисперсии помехи обусловлено внутренними свойствами объекта, то необходимы более сложные способы обработки результатов эксперимента. Можно, например, вводить некоторую функцию от y: и др.

Критерий Фишера можно применять при любом числе дисперсии . Он определяется из соотношения

(6.65)

Дисперсии однородны, если , где табличное значение критерия Фишера, определяемое при числах степеней свободы и и принятом уровне значимости γ.

Следует отметить, что уровень значимости γ по всем критериям, применяемым в процессе статистического анализа и обработки результатов эксперимента (Кохрена, Стьюдента, Фишера), должен быть одинаков. Для технических систем рекомендуется принимать γ = 0,05.

Дисперсия воспроизводимости эксперимента. Если дисперсии однородны, то их усредняют и находят дисперсию воспроизводимости эксперимента

(6.66)

Дисперсия представляет собой оценку дисперсии помехи . Так как число степеней свободы при определении дисперсии равно , то число степеней свободы, связанное с оценкой , вычисляется по формуле

.(6.67)

Формула (6.67) годится, если число повторных опытов во всех точках спектра плана одинаково. Если число опытов различно, используют формулу

(6.68)

где число степеней свободы в -й точке спектра плана; ;
число параллельных опытов в этой точке.

Определение коэффициентов регрессионной модели и проверка их значимости. Параметрами регрессионной модели являются коэффициенты регрессии , где количество базисных функций. Значения коэффициентов регрессии можно получить, решив систему алгебраических уравнений (6.20). В этих уравнениях величина индекса d в обозначении базисных функций и коэффициента регрессии равна . Так как информационная матрица Фишера Ф для ПФЭ и ДФЭ диагональная (6.51) и все диагональные элементы ее одинаковы и равны N, то выражение для определения всех коэффициентов уравнения регрессии одинаково и имеет простой вид:

(6.69)

где N – число точек спектра плана; значение -й базисной функции в -й точке спектра плана; выборочное среднее функции отклика в той же точке, определяемое по формуле (6.61).

Значения базисных функций для отдельных факторов равны , а для взаимодействия факторов . С учетом этого на основе выражения (6.69) можно записать следующие формулы для вычисления значений коэффициентов уравнения регрессии:

для коэффициентов при факторах , включая также свободный член уравнения,

(6.70)

для коэффициентов при взаимодействиях факторов

,(6.71)

где k – количество факторов.

Формулы (6.70) и (6.71) применяются для планов первого порядка. Для плана ПФЭ , а ДФЭ . При определении коэффициента (свободного члена уравнения регрессии) .

Поскольку полученные значения коэффициентов регрессии случайные числа, в связи с действием случайной помехи в процессе эксперимента, то они являются оценками истинных значений коэффициентов регрессии . Погрешность определенияоценивают дисперсией .

Дисперсии оценок всех коэффициентов регрессии одинаковы. Величина дисперсии зависит только от ошибки воспроизводимости эксперимента и числа опытов

(6.72)

где n — число повторных опытов (значение n должно быть одинаковым для всех точек N спектра плана).

После определения коэффициентов регрессии проверяют их значимость. Эта проверка осуществляется с использованием t-критерия Стьюдента, значение которого находят из соотношения

(6.73)

где общее число коэффициентов уравнения регрессии, равное количеству используемых базисных функций для построения регрессии.

Полученное значение для каждого коэффициента регрессии сравнивают с табличным , определяемым при принятом уровне значимости q и числе степеней свободы , с которым определялась дисперсия воспроизводимости . Если , нулевая гипотеза о незначимости коэффициента принимается и член уравнения регрессии, включающий этот коэффициент, исключается из математической модели. Если же , полагают, что данный коэффициент значимо (неслучайно) отличается от нуля и его следует сохранить в регрессионной модели. В этом случае значение коэффициента больше ошибки опыта, которую можно оценить величиной доверительного интервала . Доверительный интервал находят по формуле

(6.74)

Следует, однако, отметить, что дисперсия воспроизводимости эксперимента зависит от очень многих факторов: выбора центра эксперимента, интервалов варьирования факторов, наличия экстремумов функции отклика в области планирования, соотношения величины отклика и помехи (так называемое отношение сигнал-шум) и др. В этой связи при небольшом различии между и следует весьма осторожно относиться к оценке значимости коэффициентов регрессии. Лучше такие коэффициенты сохранить в модели, а влияние соответствующего фактора (или взаимодействия факторов) проверить в дальнейшем на более сложной модели или в иных условиях планирования эксперимента.

После исключения незначимых коэффициентов уравнение регрессии приобретает вид

(6.75)

где количество значимых коэффициентов регрессии.

Так как часть коэффициентов регрессии исключена из модели, то .

Если все коэффициенты оказались значимыми, суммирование в формуле (6.75) осуществляется до .

Проверка адекватности и работоспособности регрессионной модели. По уравнению регрессии (6.75) можно вычислить предсказанные значения функции отклика всех точках спектра плана: . В результате будет получено N значений . Если регрессионная модель получена на основе ПФЭ и все коэффициенты регрессии признаны значимыми, то в
формуле (6.75) . Тогда значения должны совпадать со средними выборочными значениями , полученными в результате эксперимента для каждой точки спектра плана. Следовательно, поверхность отклика проходит через все точки , и полученная модель адекватна. Значения в этом случае используют для проверки правильности вычислений коэффициентов регрессии.

Если же , то в общем случае , а величины их разностей несут информацию об ошибках предсказания по уравнению регрессии и их можно использовать для последующего анализа свойств полученной модели ее адекватности и работоспособности.

Для оценки рассеяния эмпирических значений относительно расчетных , полученных по уравнению регрессии, используют дисперсию адекватности

(6.76)

где n – число параллельных опытов; N – число точек спектра плана;
количество значимых коэффициентов регрессии.

Если число параллельных опытов в различных точках спектра плана неодинаково, то для вычисления используют формулу

(6.77)

где число параллельных опытов в -й точке спектра плана.

Проверка адекватности регрессионной модели осуществляется путем сопоставления дисперсии адекватности и дисперсии воспроизводимости эксперимента . У адекватной модели значение обусловлено в основном действием случайной помехи, поэтому различие между и должно быть небольшим, так как они оценивают одну и ту же дисперсию помехи .

Проверку гипотезы об адекватности модели (гипотезы о равенстве дисперсий и ) выполняют по критерию Фишера (F-критерию)

(6.78)

В формулах (6.76) и (6.77) учтено, что чем больше число т параллельных опытов, тем с большей достоверностью оцениваются средние значения функции отклика у. Поэтому требования к различиям между экспериментальными и расчетными значениями становятся более жесткими, что отражается в увеличении F-критерия.

Полученные значения статистики F сравнивают с табличным значением критерия Фишера , определяемым в зависимости от уровня значимости q и чисел степеней свободы и , с которыми определялись дисперсии и :

(6.79)

(6.80)

Если , регрессионная модель считается адекватной.

Различие между дисперсиями и обусловлено систематической ошибкой при определении функции отклика поуравнению регрессии из-за его приближенности. Если модель описывает физические свойства исследуемого объекта неудовлетворительно, систематическая ошибка приводит к значительному возрастанию дисперсии адекватности и, следовательно, к увеличению статистики F.

При гипотеза адекватности модели отвергается. В таком случае нужно либо изменить структуру математической модели, либо уменьшить интервалы варьирования факторов и провести повторно эксперимент с моделью прежней структуры.

В первом варианте реализуется принцип постепенного усложнения структуры математической модели. Если использовалось упрощенное уравнение регрессии первого порядка, учитывающее влияние на функцию отклика только факторов, или факторов и некоторого количества эффектов их взаимодействий низших порядков, что характерно для ДФЭ, то в модель можно дополнительно ввести новые члены, содержащие другие эффекты взаимодействия тех же порядков или более высоких порядков. Однако во многих случаях такой путь оказывается неэффективным, так как, согласно выражению (6.76), при увеличении количества членов уравнения регрессии и неизменном числе точек спектра плана N дисперсия адекватности может возрасти, несмотря на снижение разности , поскольку при этом увеличивается и, следовательно, уменьшается знаменатель
выражения (6.76). Кроме того, следует иметь в виду, что с увеличением порядка эффекта взаимодействия возрастает вероятность незначимости коэффициента регрессии при этом эффекте. В этой связи наиболее целесообразно перейти к планированию второго порядка, используя регрессионное уравнение в виде полного квадратного полинома.

После обеспечения адекватности регрессионной модели осуществляют проверку ее работоспособности.

Адекватность регрессионной модели еще не гарантирует ее пригодность к практическому использованию в задачах прогнозирования и поиска оптимальных решений. Модель может оказаться неработоспособной из-за низкой ее точности. Для проверки работоспособности модели используют коэффициент детерминации, представляющий собой числовую интегральную характеристику точности уравнения регрессии. Его значение вычисляют по формуле

(6.81)

где среднее значение отклика:

(6.82)

Модель считается работоспособной при . В этом случае обеспечивается уменьшение ошибки предсказания, полученного по уравнению регрессии, по крайней мере, в 2 раза в сравнении с предсказанием по среднему значению отклика , без учета влияния факторов на функцию отклика у.

Планы второго порядка. Планы второго порядка предназначены для получения регрессионной модели в виде полного квадратного полинома полинома второй степени. Такой полином содержит основные эффекты, все парные взаимодействия и квадратичные эффекты

(6.83)

Число коэффициентов уравнения регрессии в этом случае

(6.84)

что в раз больше, чем в линейной модели вида (6.43).

Соответственно возрастает и минимально необходимое число точек в спектре плана. Для получения квадратичной модели варьирование факторов в эксперименте должно осуществляться, по крайней мере, на трех уровнях.

Существует большое множество различных планов второго порядка. Систематизированное их изложение дается в специальной литературе [9]. Рассмотрим кратно лишь композиционные планы типа , получившие широкое применение благодаря их экономичности и простой структуре. Эти планы содержат ядро ПФЭ2k или ДФЭ2k-p и включают 2k звездных точек, которые расположены на координатных осях на расстоянии ±a от центра эксперимента. Величина a выбирается из условия минимизации обобщенной дисперсии оценок коэффициентов регрессии, что обеспечивает минимум объема эллипсоида рассеяния этих оценок. Следовательно, планы построены с учетом критерия D-оптимальности. Величина для этих планов оказывается равной 1 для всех k факторов, а область планирования представляет собой гиперкуб. Центральной точки планы не содержат.

Если ядром плана является ПФЭ2k, то число точек спектра плана типа определяют по формуле

(6.85)

а если ядро составляет план ДФЭ2k-p, то

(6.86)

В качестве примера в табл. 6.9 приведена матрица спектра плана типа при k = 3, ядром которого является план ПФЭ23.

Таблица 6.9

i x1 x2 x3 i x1 x2 x3
-1 -1 -1 -1
+1 -1 -1 +1
-1 +1 -1 -1
+1 +1 -1 +1
-1 -1 +1 -1
+1 -1 +1 +1
-1 +1 +1        
+1 +1 +1        

 

Из приведенной таблицы легко видеть процедуру построения плана. Первые восемь точек составляют ядро плана , соответствуют спектру плана ПФЭ23, а остальные шесть – звездные точки. В этих точках варьируется только один какой-либо фактор , на нижнем или верхнем уровне, а остальные находятся в центре эксперимента и их нормированные значения равны нулю.

Оценки коэффициентов регрессии вычисляют по формулам:

(6.87)

(6.88)

(6.89)

(6.90)

В формулах (6.87) и (6.88) число точек ядра спектра плана: .

Если отдельные коэффициенты и окажутся незначимыми, то их можно исключить из уравнения регрессии без пересчета остальных коэффициентов.

Дисперсии оценок коэффициентов регрессии различны, так как план не обладает свойством ортогональности, а коэффициенты и коррелированны, поэтому в случае незначимости некоторых коэффициентов при исключении их из модели требуется уточнение оставшихся коэффициентов и .

Регрессионный анализ результатов вычислительного эксперимента на детерминированной теоретической модели. Детерминированная математическая модель характеризуется взаимно однозначным соответствием между внешним воздействием на моделируемую систему и ее реакцией на это воздействие. Поэтому в каждой точке спектра плана проводят только один опыт. План активного вычислительного эксперимента составляется в зависимости от вида регрессионной модели так же, как и для вероятностных математических моделей. При построении экспериментальных факторных моделей, предназначенных для решения задач оптимизации параметров технических объектов в процессе их функционального проектирования, используют планы первого и второго порядков.

Регрессионный анализ при экспериментах на детерминированных и вероятностных моделях включает одни и те же этапы: статистический анализ результатов эксперимента, получение оценок коэффициентов регрессии оценка адекватности экспериментальной факторной модели. Однако содержание первого и третьего этапов в обоих случаях различно.

На первом этапе осуществляется построение модели среднего и ее статистический анализ. При этом определяют среднее значение функции отклика и дисперсию модели среднего , характеризующую рассеяние результатов эксперимента относительно :

(6.91)

(6.92)

где значение функции отклика в -й точке спектра плана;
N – количество проведенных опытов, равное числу точек спектра плана.

Коэффициенты регрессии первого порядка определяются по
формулам (6.70) и (6.71), а регрессии второго порядка, полученной на основе плана типа , по формулам (6.87)(6.90).

После определения коэффициентов осуществляется проверка пригодности полученного уравнения регрессии. Для этого вначале необходимо вычислить по уравнению регрессии предсказываемые значения функции отклика в каждой точке плана . В уравнение регрессии при вычислениях подставляют значения нормированных факторов в соответствии с матрицей спектра плана. Затем определяется остаточная дисперсия

(6.93)

где число коэффициентов в уравнении регрессии.

При оценке пригодности полученного уравнения регрессии принимается иная нулевая гипотеза, чем при экспериментах на вероятностных моделях. Здесь нулевая гипотеза гласит о том, что модель среднего достаточно хорошо описывает исследуемый процесс. Качество предсказания, обеспечиваемого уравнением регрессии, оценивают по критерию Фишера F сравнивая остаточную дисперсию с дисперсией модели среднего :

(6.94)

Уравнение регрессии адекватно описывает результаты эксперимента, если полученное по формуле (6.94) значение F больше табличного значения критерия Фишера , определяемого при принятом уровне значимости q и числах степеней свободы и , с которыми определены дисперсии и . Согласно выражениям (6.92) и (6.93) . Если условие выполняется, это означает, что уравнение регрессии описывает результаты эксперимента в раз лучше модели среднего. Тогда нулевая гипотеза отвергается.

При оценке значимости коэффициентов регрессии принимается нулевая гипотеза о том, что , и осуществляется проверка, отличаются ли статистически значимо оценки коэффициентов от нуля. Значимость проверяют по критерию Стьюдента, используя
формулу (6.73). При вычислении дисперсии , оценивающей погрешности определения коэффициентов , используется остаточная дисперсия (а не дисперсия воспроизводимости эксперимента , как это было для вероятностной модели)

. (6.95)

При упрощении уравнения регрессии остаточная дисперсия может возрасти, что приводит к снижению критерия Фишера. Поэтому члены уравнения регрессии с незначимыми коэффициентами можно исключать лишь в том случае, если проверка полученной упрощенной модели на адекватность по критерию Фишера дает положительный результат.

 

 

Существуют две составляющие планирования: стратегическое и тактическое планирование.

Стратегическое планирование ставит своей целью решение задачи получения необходимой информации о системе S с помощью модели Мм, реализованной на ЭВМ, с учетом ограничений на ресурсы, имеющиеся в распоряжении экспериментатора.

Тактическое планирование представляет собой определение способа проведения каждой серии испытаний машинной модели Мм, предусмотренных планом эксперимента.

Проблемы стратегического планирования. Проблемы стратегического планирования машинных экспериментов, связанные с особенностями функционирования моделируемого объекта (системы S) и с особенностями машинной реализации модели Мм и обработки результатов эксперимента, следующие:

1) построение плана машинного эксперимента;

2) наличие большого количества факторов;

3) многокомпонентная функция реакции;

4) стохастическая сходимость результатов машинного эксперимента;

5) ограниченность машинных ресурсов на проведение эксперимента.

Рассмотрим существо этих проблем и методы их решения.

При построении плана эксперимента необходимо помнить о цели проведения машинных экспериментов с моделью Мм системы S:

· получение зависимости реакции от факторов для выявления особенностей изучаемого процесса функционирования системы S (т.е. решить задачу анализа),

· нахождение такой комбинации значений факторов, которая обеспечивает экстремальное значение реакции (т.е. решить задачу синтеза системы S).

При реализации полного факторного плана различия между машинными экспериментами для достижения той или иной цели стираются, так как оптимальный синтез сводится к выбору одного из вариантов, полученного при полном факторном анализе. Но полный факторный эксперимент эквивалентен в этом случае полному перебору вариантов, что нерационально с точки зрения затрат машинных ресурсов. Для более эффективного (с точки зрения затрат машинного времени и памяти на моделирование) нахождения оптимальной комбинации уровней факторов можно воспользоваться выборочным методом определения оптимума поверхности реакции (систематическая или случайная выборка) на основе априорной информации о моделируемой системе S.

Другая специфическая проблема стратегического планирования машинных экспериментов - наличие большого количества факторов. Это одна из основных проблем реализации имитационных моделей на ЭВМ, так как известно, что в факторном анализе количество комбинаций факторов равно произведению числа значений всех факторов эксперимента. Когда при моделировании требуется полный факторный анализ, то проблема большого количества факторов может не иметь решения. Достоинством полных факторных планов является то, что они дают возможность отобразить всю поверхность реакции системы, если количество факторов невелико. Строят неполные факторные планы, требующие меньшего числа точек, но приводящие к потере допустимого количества информации о характере функции реакции. В этом случае строят план эксперимента, исходя из поверхности реакции, это позволяет уменьшить объем эксперимента без соответствующих потерь количества получаемой информации. Методы поверхности реакции позволяют сделать некоторые выводы из самых первых экспериментов с машинной моделью Мм. Если дальнейшее проведение машинного эксперимента оказывается неэкономичным, то его можно закончить в любой момент.

Следующей проблемой стратегического планирования машинных экспериментов является многокомпонентная функция реакции. В этом случаев рассматривают имитационный эксперимент по определению многих реакций как несколько имитационных экспериментов, в каждом из которых исследуется (наблюдается) только одна реакция. Если переменные реакции связаны друг с другом, то рационально использовать интегральные оценки нескольких реакций, построенные с использованием весовых функций, функций полезности и т.д.

Проблема стохастической сходимости результатов машинного эксперимента возникает вследствие того, что целью проведения конкретного машинного эксперимента при исследовании и проектировании системы S является получение на ЭВМ количественных характеристик процесса функционирования системы S с помощью машинной модели Мм. В качестве таких характеристик наиболее часто выступают средние некоторых распределений, для оценки которых применяют выборочные средние, найденные путем многократных прогонов модели на ЭВМ, причем чем больше выборка, тем больше вероятность того, что выборочные средние приближаются к средним распределений. Сходимость выборочных средних с ростом объема выборки называется стохастической сходимостью. Основной трудностью при определении интересующих характеристик процесса функционирования системы S является медленная стохастическая сходимость. Известно, что мерой флуктуаций случайной величины служит ее нестандартное отклонение. Если s – стандартное отклонение одного наблюдения, то стандартное отклонение среднего N наблюдений будет равно s/. Таким образом, для уменьшения случайной ошибки в k раз требуется увеличить объем выборки в k2 раз, т.е. для получения заданной точности оценки может оказаться, что объем необходимой выборки нельзя получить на ЭВМ из-за ограничения ресурса времени и памяти. Основная идея ускорения сходимости в машинных экспериментах – использование априорной информации о структуре и поведении системы S, свойствах распределения входных переменных и наблюдаемых случайных воздействий внешней
среды Е.

Но при планировании машинных экспериментов на практическую реализуемость плана существенное влияние оказывают имеющиеся в распоряжении экспериментатора ресурсы. Поэтому планирование машинного эксперимента представляет собой итерационный процесс, когда выбранная модель планаэксперимента проверяется на реализуемость с точки зрения ограниченности машинных ресурсов, а затем, если это необходимо, вносятся соответствующие коррективы в исходную модель.

Этапы стратегического планирования. Можно выделить следующие этапы стратегического планирования машинных экспериментов:

1) построение структурной модели;

2) построение функциональной модели.

При этом структурная модель выбирается исходя из того, что должно быть сделано, а функциональная – из того, что может быть сделано.

Структурная модель плана эксперимента характеризуется числом факторов и числом уровней для каждого фактора. Число элементов эксперимента

Nc=q1q2qk,

где k – число факторов эксперимента; qi – число уровней i-го фактора, .

При этом под элементом понимается структурный блок эксперимента, определяемый как простейший эксперимент в случае одного фактора и одного уровня, т.е. k=1, q=1, Nc=1.

При этом надо найти наиболее существенные факторы, таккак из опыта известно, что для большинства систем 20 % факторов определит 80 % свойств системы S, а остальные 80 % факторов определяют лишь 20 % ее свойств.

Следующий шаг в конструировании структурной модели плана состоит в определении уровней, на которых следует устанавливать и измерять каждый фактор, причем минимальное число уровней фактора, не являющегося постоянным, равно двум. Число уровней следует выбирать минимальным, но достаточным для достижения цели машинного эксперимента.

Если принять число уровней всех факторов одинаковым, тогда структурная модель будет симметричной и примет вид Nc=qk , где q=qi, .

Функциональная модель плана эксперимента определяет количество элементов структурной модели Nф, т.е. необходимое число различных информационных точек. При этом функциональная модель может быть полной и неполной. Функциональная модель называется полной, если в оценке реакции участвуют все элементы, т.е. Nф=Nc, и неполной, если число реакций меньше числа элементов, т.е. Nф<Nc. Основная цель построения функциональной модели – нахождение компромисса между необходимыми действиями при машинном эксперименте (исходя из структурной модели) и ограниченными ресурсами на решение задачи методом моделирования.

Для более быстрого нахождения компромиссного решения можно при предварительном планировании машинного эксперимента использовать номограмму, построенную при варьировании числа факторов k, числа уровней факторов q, повторений эксперимента р,а также затрат времени на прогон модели t и стоимости машинного времени c. Вид такой номограммы показан на рис. 6.6, причем при ее построении предполагалось, что полное число прогонов, необходимых при симметрично повторяемом эксперименте,

N=рqk. (6.96

 

 

 


Рис. 6.6. Номограмма предварительного планирования машинного эксперимента

 

Рассмотрим особенности использования такой номограммы на примере.

Пример 6.3. Пусть необходимо спланировать машинный эксперимент при наличии трех факторов k = 3, каждый из которых имеет три уровня q = 3, причем требуется р = 15 повторений с затратами t = 120 с машинного времени на один прогон при стоимости 1 ч машинного времени с = 100 руб. Кроме того, предполагается, что в день на моделирование данной системы S выделяется 60минмашинного времени, т.е. на моделирование требуется
k = Nt/3600 дней. Такой машинный эксперимент потребует около
400 прогонов, затратив примерно tS = 13 ч машинного времени, около Tk = 13 дней на получение результатов моделирования и 1304 руб. для оплаты машинного времени.

Сравним случай, рассмотренный в примере, при условии, что число уровней факторов уменьшено до двух, т.е. q = 2. Такой машинный эксперимент потребует только 135 прогонов; 4,5 ч машинного времени;
4,5 дня на получение результатов и всего 450 руб. затрат для оплаты машинного времени, т.е. имеет место сокращение затрат на 265 %.

Такая номограмма (рис. 6.6) может быть использована и для других входов, например, при фиксированной величине денежных средств, отводимых на машинный эксперимент.

 

Для более детального анализа имеющихся у экспериментатора возможностей при планировании эксперимента рассмотрим попарно относительное влияние числа факторов k, числа уровней q и числа повторений р на количество необходимых машинных прогонов модели N. Предполагая эти величины непрерывными, проанализируем, какая из трех величин дает наибольшее сокращение полного количества прогонов. Для этого продифференцируем уравнение (6.96):

, , . (6.97)

Из этих уравнений видно, что:

1) если kp>q и k>qlnq, то доминирует (оказывает наибольшее влияние на число машинных прогонов N) изменение числа уровней q;

2) если kp<q и k>qlnq, то доминирует число факторов k;

3) если p<q и plnq<1, то доминирует число повторений р.

Такой анализ позволяет дать наглядную графическую интерпретацию определения доминирующей для данного машинного эксперимента с моделью системы S переменными: k, q или р. Графически отразим
уравнения (6.97). На рис. 6.7, а приведен график отношения (qlnq)/k как функции числа уровней q при изменении числа факторов k от 1 до 5. Если отношение (qlnq)/k>1 при данных k и q, то доминирует число факторов k. Если это отношение меньше 1, то доминирует число уровней q.

На рис. 6.7, б приведен график зависимости отношения q/(kp) от числа уровней q для величин произведений kp в пределах от 1 до 5. Если в данном случае q/(kp)>1, то доминирует число повторений р,а если q/(kp)<1, то доминирует число уровней q.

На рис. 6.7, в показан график зависимости отношений 1/(plnq) от числа уровней q для числа повторений р, изменяющихся в пределах от 1 до 10. Если 1/(plnq)>1, то доминирует число повторений р, а если 1/(plnq)<1, то доминирует число факторов k.

а б в

(qlnq)/k q/(kp) 1/(рlnq)

2 2 2

k=1 2 3 4 5 kp=1 2

 

1 1 5 1

р=1

 

0 0 0

1 2 3 4 q 1 2 3 4 q 1 2 3 4 q

 

Рис. 6.7. Графическое изображение зависимостей:

аqlnq/k; б – q/(kp); в – 1/(plnq) в функции

 

Пример 6.4. Пусть при составлении плана машинного эксперимента требуется оценить,какая переменная играет доминирующую роль в сокращении полного числа машинных прогонов модели N при k = 4, q = 3,
p = 2. Воспользуемся рис. 6.7, а: для q = 3 и k = 4 отношение (qlnq)/k<1, т.е. число уровней q доминирует над числом факторов k. Исходя из рис. 6.7, б, для q = 3, kp = 8 имеем q/(kp)<l, т.е. число уровней q доминирует над числом
повторений р. И наконец, воспользовавшись рис. 6.7, в, видим, что для q = 3 и p = 2 отношение 1/(рlnq)<1, т. е. число факторов доминирует над числом повторений р.

 

Таким образом, использование при стратегическом планировании машинных экспериментов с Мм структурных и функциональных моделей плана позволяет решить вопрос о практической реализуемости модели на ЭВМ исходя из допустимых затрат ресурсов на моделирование системы S.

 

Дата публикации:2014-01-23

Просмотров:1122

Вернуться в оглавление:

Комментария пока нет...


Имя* (по-русски):
Почта* (e-mail):Не публикуется
Ответить (до 1000 символов):







 

2012-2018 lekcion.ru. За поставленную ссылку спасибо.