Разделы

Авто
Бизнес
Болезни
Дом
Защита
Здоровье
Интернет
Компьютеры
Медицина
Науки
Обучение
Общество
Питание
Политика
Производство
Промышленность
Спорт
Техника
Экономика

Тактическое планирование машинных экспериментов с моделями систем

 

Тактическое планирование эксперимента с машинной моделью Мм системы S связано с вопросами эффективного использования выделенных для эксперимента машинных ресурсов и определением конкретных способов проведения испытаний модели Мм, намеченных планом эксперимента, построенным при стратегическом планировании. Проблемы тактического планирования машинного эксперимента следующие:

1) определение начальных условий и их влияния на достижение установившегося результата при моделировании;

2) обеспечение точности и достоверности результатов моделирования;

3) уменьшение дисперсии оценок характеристик процесса функционирования моделируемых систем;

4) выбор правил автоматической остановки имитационного эксперимента с моделями систем.

Проблема определения начальных условий их влияния на достижение установившегося результата при моделировании. Когда начинается очередной прогон модели процесса функционирования системы S, требуется определенное время для достижения условий равновесия, которые соответствуют условиям функционирования реальной системы. Таким образом, начальный период работы машинной модели Мм искажается из-за влияния начальных условий запуска модели. Для решения этой проблемы либо исключается из рассмотрения информация о модели Мм, полученная в начальной части периода моделирования (0, Т), либо начальные условия выбираются так, чтобы сократить время достижения установившегося режима. Все эти приемы позволяют только уменьшить, но не свести к нулю время переходного процесса при проведении машинного эксперимента с моделью Мм.

Проблема обеспечения точности и достоверности результатов моделирования. Решение второй проблемы тактического планирования машинного эксперимента связано с оценкой точности и достоверности результатов моделирования (при конкретном методе реализации модели, например, методе статистического моделирования на ЭВМ) при заданном числе реализации (объеме выборки) или с необходимостью оценки необходимого числа реализации при заданных точности и достоверности результатов моделирования системы S.

Обработка результатов статистического имитационного эксперимента принципиально не может дать точных значений показателя эффективности Е системы S; в лучшем случае можно получить только некоторую оценку такого показателя. Количество реализации N при статистическом моделировании системы S должно выбираться исходя из двух противоречивых требований: определения затрат ресурсов на машинный эксперимент с моделью Мм (включая построение модели и ее машинную реализацию) и оценки точности и достоверности результатов эксперимента с моделью системы S (при заданных ограничениях на ресурсы). Необходимо решить задачу нахождения разумного компромисса между ними.

Из-за наличия стохастичности и ограниченности числа реализаций N в общем случае ¹Е. При этом величина e называется точностью (абсолютной) оценки. Вероятность того, что неравенство

|Е-|<e (6.98)

выполняется, называется достоверностью оценки

Q=P{|E-|<e}. (6.99)

Величина e0 = e/Е называется относительной точностью оценки, а достоверность оценки соответственно будет иметь вид:

Q=P{|(Е-)/Е|<e0}.

Рассмотрим взаимосвязь точности и достоверности результатов с количеством реализации при машинном эксперименте, когда в качестве показателей эффективности Е выступают вероятность р (I), математическое ожидание а (II) и дисперсия s2 (III).

I. Пусть цель машинного эксперимента с моделью Мм некоторой системы S – получение оценки р вероятности появления р = Р(А) некоторого события А, определяемого состояниями процесса функционирования исследуемой системы S. В качестве оценки вероятности р в данном случае выступает частость = m/N, где т – число положительных исходов.

Тогда соотношение (6.99), связывающее точность и достоверность оценок с количеством реализации, будет иметь вид:

Р{|p – m/N|<e}=Q, P{p – e<m/N<p+e}=Q .(6.100)

Дляответа на вопрос о законе распределения величины p = m/N представим эту частость в виде = m/N = , так как количество наступлений события А в данной реализации из N реализаций является случайной величиной x, принимающей значения х1 = 1 с вероятностью р, и x2 = 0 с дополнительной вероятностью 1 – p. Математическое ожидание и дисперсия случайной величины x будут таковы:

M[x] = х1p + x2(1 – p) = 1р + 0(1 – р) = р;

D[x] = (х1M[x])2р + (x2 – M[x])2(1 – р) = (1 – p)2р + (0 – р)2(1 – р) = р(1 – р).

Тогда

M[] = М[m/N] = = M[x] = р.

Это соотношение говорит о несмещенности оценки для
вероятности р. С учетом независимости значений величин хi получим

D[] = D[m/N]= = D[x] = .

В силу центральной предельной теоремы теории вероятностей (или ее частного случая – теоремы Лапласа) частость m/N при достаточно больших N можно рассматривать как случайную величину, описываемую нормальным законом распределения вероятностей с математическим ожиданием р и дисперсией p(1 – p)/N. Поэтому соотношение (6.100) можно переписать так:

.

Учитывая, что Ф0(-z)=1 – Ф0(z), получим

,

где tjквантиль нормального распределения вероятностей порядка
j =(1+Q)/2; находится из специальных таблиц.

В результате точность оценки вероятности р можно определить как

,

т.е. точность оценки вероятностей обратно пропорциональна .

Из соотношения для точности оценки e можно вычислить количество реализаций

N=, (6.101)

необходимое для получения оценки с точностью e и достоверностью Q.

Пример 6.5. Необходимо рассчитать количество реализаций N при статистическом моделировании системы S, когда в качестве показателя эффективности используется вероятность р при достоверности Q = 0,95
(tj = 1,96) и точности e = 0,01; 0,02; 0,05. Так как значения р до проведения статистического моделирования системы S неизвестны, то вычислим множество оценок N для диапазона возможных значений р, т.е. от 0 до 1, с дискретом 0,1. Результаты расчетов с использованием выражения (6.101) представлены в табл. 6.10. Из таблицы видно, что при переходе от
p = 0,1 (0,9) к p = 0,5 количество реализации N возрастает примерно в три раза, а при переходе от e = 0,05 к e = 0,01 количество реализации N возрастает примерно в 25 раз.

Таблица 6.10

Вероятность p Количество реализаций N
Точность e
0,05 0,02 0,01
0,1(0,9)
0,2(0,8)
0,3(0,7)
0,4(0,6)
0,5

 

При отсутствии возможности получения каких-либо априорных сведений о вероятности р использование понятия абсолютной точности теряет смысл. Действительно, можно, например, предварительно задать точность результатов моделирования e = 0,01, а искомая р в результате окажется хотя бы на порядок ниже, т.е. p £ 0,001. В таких случаях целесообразно задавать относительную точность результатов
моделирования e0. Тогда соотношение (6.9) примет вид:

N=. (6.102)

Соотношение (6.8) наглядно иллюстрирует специфику статистического моделирования систем, выражающуюся в том, что для оценивания малых вероятностей р с высокой точностью необходимо очень большое число реализаций N. В практических случаях для оценивания вероятностей порядка 10-k целесообразно количество реализаций выбирать равным 10k+1. Очевидно, что даже для сравнительно простых систем метод статистического моделирования приводит к большим затратам машинного времени.

II. Другим распространенным случаем в практике машинных экспериментов с моделью Мм является необходимость оценки показателей эффективности Е системы S по результатам определения среднего значения некоторой случайной величины. Пусть случайная величина x имеет математическое ожидание а и дисперсию s2. В реализации с номером i она принимает значение хi. В качестве оценки математического ожидания a используется среднее арифметическое

.

В силу центральной предельной теоремы теории вероятностей при больших значениях N среднее арифметическое будет иметь распределение, близкое к нормальному с математическим ожиданием а и дисперсией s2/N. Для математического ожидания a точность оценки e = tjs/, а количество реализаций

N= или N=. (6.103)

III. Аналогично, если в качестве показателя эффективности Е системы S выступает дисперсия s2, а в качестве ее оценки используется величина S2, то математическое ожидание и дисперсия соответственно будут

,

где m4 - центральный момент четвертого порядка случайной величины. Для дисперсии s2 точность оценки e = tj. Отсюда количество реализации будет

. (6.104)

Для частного случая, когда случайная величина имеет нормальное распределение m4 = 3s4, получим N = t2j2s4/e2 = 2t2j/e20.

Таким образом, на основании соотношений (6.101) (6.104) можно сделать вывод, что количество реализаций при статистическом моделировании существенно зависит от дисперсии оцениваемой случайной величины. Поэтому выгодно выбирать такие оцениваемые показатели эффективности Е системы S, которые имеют малые дисперсии.

Проблема уменьшения дисперсии оценок характеристик процесса функционирования моделируемых систем.Проблема уменьшения дисперсии тесно связана с проблемой выбора количества реализаций при обеспечении необходимой точности и достоверности результатов машинного эксперимента. Существуют методы, позволяющие при заданном числе реализации увеличить точность оценок, полученных на машинной модели Мм, и, наоборот, при заданной точности оценок сократить необходимое число реализации при статистическом моделировании. Эти методы используют априорную информацию о структуре и поведении моделируемой системы S и называются методами уменьшения дисперсии.

Рассмотрим в качестве иллюстрации метод коррелированных реализаций (выборок), используемый в задачах сравнения двух или более альтернатив. При исследовании и проектировании системы S всегда происходит сравнение вариантов Si, , отличающихся друг от друга структурой, алгоритмами поведения и параметрами.

Независимо от того, как организуется выбор наилучшего варианта системы S (простым перебором результатов моделирования системы Si или с помощью автоматизированной процедуры поиска), элементарной операцией при этом является сравнение статистически усредненных критериев интерпретации.

Сравниваемые статистические показатели Еi вариантов моделируемой системы Si, , полученные на машинной модели Мм,можно записать в виде средних значений Ei=M[qi], , критериев qi,характеризующих систему S, или в виде средних значений функции этих критериев fj(qi), , . Например, если

то показатели Еi являются вероятностями нормальной работы системы Si. Если

,

то показатель Еi является дисперсией значения контролируемой величины и т.д. Здесь Dqi=|qi – qиi| отклонение значения контролируемой для системы Si величины qi от истинной qиi.

Для сравнения характеристик, полученных на машинной модели Мм, рассмотрим два конкурирующих варианта моделируемой системы: S1 и S2. Существенной особенностью операции сравнения вариантов систем S1 и S2 является повышение требований к точности статистических оценок , , показателей Е1, Е2 при уменьшении разности DЕ=|E1 – Е2|.

Рассмотрим наиболее характерные случаи, имеющие место при имитационных экспериментах, когда в качестве оценок выступают средние значения (I), вероятности (II) и дисперсии (III).

I. Если полученные в результате имитационного эксперимента с вариантами модели системы S1 и S2 оценки , средних значений критериев q1, q2, a1=M[q1], a2=M[q2] имеют дисперсии D[], D[] и коэффициент корреляции оценок , равен R[, ], то дисперсию погрешности оценки = разности d = a1 – a2можно найти из соотношения

, (6.105)

где s1 = , s2 = средние квадратичные отклонения оценок.

При независимом моделировании вариантов системы с использованием различных реализаций псевдослучайных последовательностей коэффициент корреляции оценок R[, ] = 0 и Dи[] = D[] + D[].

При моделировании удается получить положительный коэффициент корреляции R[, ]>0, т.е. D[]<Dи[], когда при имитационных экспериментах с вариантами системы S1 и S2 используются, например, одни и те же псевдослучайные последовательности.

II. Вероятности р1, р2 событий А1, А2, характеризующих сравниваемые варианты модели систем S1 и S2, можно представить как средние значения двоичных случайных величин q1, q2 c распределением вероятностей P{q1=1} = p1; P{q1=0} = 1 – p1; P{q2=1} = p2; P{q2=0} = l – p2.

Поэтому для оценки разности вероятностей Dp = p1p2 = M[q1] – M[q2] можно использовать все выражения, полученные ранее при сравнении средних значений, видоизменив в них обозначения с учетом того, что двухмерное распределение вектора (q1, q2), описывающее зависимость между событиями А1, А2, имеет вид:

Р{q1=1, q2=1} = P(A1, A2) = pA;

P{q1=0, q2=0} = PA1А2) = pB;

P{q1=1, q2=0} = Р(А1А2) = pC;

P{q1=0, q2=l} = PA1, A2) = pD,

причем pA+pC = p1, pB+pD = p2. В частности, для повторной выборки объемом N получим, что оценка

D= = (m1m2)/N,

где т1, m2 количество наступлений событий А1, А2, полученных при независимых прогонах модели. Учитывая, что между q1, q2ковариация
B12 = pA – р1р2, найдем дисперсию оценки

D[D] = (pC+pD(pC – pD)2)/N,

что следует из (6.11).

III. Рассмотрим случай, когда в качестве оценки вариантов систем S1 и S2 выступает дисперсия. В этом случае оценка Dразности DD=D1D2 дисперсией критериев q1, q2 вычисляется по независимым реализациям вектора (q1, q2) с помощью формулы D=, где
, эмпирические дисперсии критериев q1, q2, рассчитываемые по формуле

.

Для оценки Dдисперсия

D[D]=D[]+D[]2B[, ],

где дисперсии эмпирических дисперсий D[], D[] вычисляются по формуле

,

где m4 = M4[q] = M[(q – M[q])4] центральный момент распределения четвертого порядка.

Ковариация B[,] » M[(q1M[q1])2(q2M[q2])2]/N.

Таким образом, при таком подходе к уменьшению дисперсии задача состоит в специальном построении моделирующего алгоритма системы S, позволяющего получить положительную корреляцию, например, за счет управления генерацией случайных величин. Вопрос об эффективности использования метода уменьшения дисперсии может быть решен только с учетом необходимости дополнительных затрат машинных ресурсов (времени и памяти) на реализацию подхода.

Проблема выбора правил автоматической остановки имитационного эксперимента с моделями системы. Простейший способ решения проблемы выбора правил автоматической остановки имитационного эксперимента – задание требуемого количества реализации N (или длины интервала моделирования Т). Однако такой детерминированный подход неэффективен, так как в его основе лежат достаточно грубые предположения о распределении выходных переменных, которые на этапе тактического планирования являются неизвестными. Другой способ – задание доверительных интервалов для выходных переменных и остановка прогона машинной модели Мм при достижении заданного доверительного интервала, что позволяет теоретически приблизить время прогона к оптимальному.

Правила автоматической остановки могут быть включены в машинную модель такими способами:

1) путем двухэтапного проведения прогона, когда сначала делается пробный прогон из N* реализации, позволяющий оценить необходимое количество реализации N (причем, если N* ³ N, то прогон можно закончить, в противном случае необходимо набрать еще N – N* реализации);

2) путем использования последовательного анализа для определения минимально необходимого количества реализации N, которое рассматривается при этом как случайная величина, зависящая от результатов N – 1 предыдущих реализаций (наблюдений, испытаний) машинного эксперимента.

Рассмотрим особенности последовательного планирования машинных экспериментов, построенных на последовательном анализе. В последовательном анализе объем выборки не фиксирован, а после i-го наблюдения принимается одно из следующих решений: принять данную гипотезу, отвергнуть гипотезу, продолжить испытания, т.е. повторить наблюдения еще раз. Благодаря такому подходу можно объем выборки существенно уменьшить по сравнению со способами остановки, использующими фиксированный объем выборки. Таким образом, последовательное планирование машинного эксперимента позволяет минимизировать объем выборки в эксперименте, необходимой для получения требуемой при исследовании системы S информации. Построив критерий, можно на каждом шаге решать вопрос либо о принятии нулевой гипотезы Н0, либо о принятии альтернативной гипотезы Н1, либо о продолжении машинного эксперимента. Последовательное планирование машинного эксперимента использует принцип максимального правдоподобия и последовательные проверки статистических гипотез.

Пусть распределение генеральной совокупности характеризуется функцией плотности вероятностей с неизвестным параметром Y = f(y, q). Определяются нулевая и альтернативная гипотезы H0: q = q0 и Н1:q = q1. Гипотезы проверяют на основании выборки нарастающего объема т. Можно записать: вероятность получения данной выборки P0m = f(y1,q0)…f(ym, q0) при условии, что верна гипотеза H0 (правдоподобная выборка); вероятность получения выборки P1m = f(y1,q1)…f(ym, q1) при условии верности гипотезы H1. Процедура проверки строится на отношении правдоподобия Р1m/Р0m.

Последовательный критерий отношения вероятностей строится следующим образом. На каждом шаге машинного эксперимента определяются Р1m и Р0m, а также проверяется условие:

где 0<B<1, A>1, .

Для сходимости критерия необходимо, чтобы A£(1 – b )/a, B³b/(1 – a ), где a вероятность ошибки первого рода; b вероятность ошибки второго рода.

Данный метод позволяет уменьшить среднее число реализаций в машинных экспериментах по сравнению с использованием фиксированных объемов выборки (при одинаковых вероятностях ошибок). Примером применения метода может служить проверка гипотезы о среднем значении величины, распределенной по нормальному закону.

Пример 6.6. Пусть для случайной величины у известна дисперсия s2 и неизвестно среднее m. При этом нулевая гипотеза Н0: m = q0, альтернативная H1: m = q1. Если Н0 верна, то вероятность ее отвергнуть равна a. Если верна гипотеза H1, то вероятность принять ее равна b. В случае q0<m<q1 ни одна из гипотез не принимается.

Для нормального распределения:

.

.

.

Критерий проверки гипотезы строится по следующему правилу:

если lnB = b<<a = lnA,

то наблюдение продолжается.

Можно упростить процедуру, если использовать логарифмическую функцию правдоподобия. В этом случае

,

a = lnA = ln [(1 – b )/a],

b = lnB =ln [b/(1 – a )].

Тогда на каждом шаге т проверяется выполнение неравенств:

если

,

то принимается H0;

если

,

то принимается H1;

если

,

то машинный эксперимент продолжается.

Для математического ожидания числа наблюдений при условии верности H0 и H1 соответственно можно записать

M[N/Н0]= , M[N/Н1]=,

где N – число наблюдений; z = ln[f(y, q1)/f(y, q0)] = – [(y – q 1)2+(y – q0)2]/(2s2).

Можно записать М[z/H0] = (q1 – q0)2/(2s2) = M[z/H1], так как М[y] = q0 для гипотезы H0 и M[y] = q1 для гипотезы H1.

Тогда

M[N/Н0] = , M[N/Н1] = .

Применение данного метода по сравнению с фиксированным объемом выборки N дает уменьшение числа реализации при статистическом моделировании болеечем в два раза.

Для проверки гипотезы о среднем для случайных величин с нормальным законом распределения, неизвестным средним m и неизвестной дисперсией s2 можно использовать следующую процедуру. Проверяют гипотезы Н0: m < m0 и Н1: m > m0. Необходимо, чтобы вероятность отвергнуть Н0 при m £ m0 была Р £ a и вероятность принять H0 при m > m0 + D была Р £ b.

На первом шаге берут выборку размером т и вычисляют выборочную дисперсию

;

здесь число т выбрано таким, чтобы выполнялось условие

a(d)£1,25 log (1/d),

где a(d) = [(1/d)2/f – 1]f/2, d = min(a,b), f = m – 1.

Затем последовательно проводят по одному эксперименту. При выполнении условия

эксперимент прекращают и гипотезу H0 отвергают.

Гипотезу H1 принимают, если

,

где d = 3D/8.

Таким образом, чем сложнее машинная модель Мм, тем важнее этап тактического планирования машинного эксперимента, выполняемый непосредственно перед моделированием на ЭВМ системы S. Процесс планирования машинных экспериментов с моделью Мм итерационен, т.е. при уточнении некоторых свойств моделируемой системы S этапы стратегического и тактического планирования экспериментов могут чередоваться.

 

Дата публикации:2014-01-23

Просмотров:883

Вернуться в оглавление:

Комментария пока нет...


Имя* (по-русски):
Почта* (e-mail):Не публикуется
Ответить (до 1000 символов):







 

2012-2018 lekcion.ru. За поставленную ссылку спасибо.