Прикладная математика. Курсовик. Вариант 10. Курсовая работа по дисциплине Прикладная математика
Скачать 0.5 Mb.
|
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 х 2. Построим интервальный вариационный ряд. Для удобства возьмем a= 20, b= 40, h=2, v= 10.
Построим многоугольник частостей: xi —1/2 —1/4 │ │ │ │ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 pi Построим график выборочной функции распределения: 1 │ │ │ 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 х 3. Найдем следующие показатели: 1)выборочную среднюю - по исходному ряду данных: _ (e1 + … + en) Σen X = ———――――=—— =(20+22+24+25+26+26+28+28+28+28+28+ 28+31+31+31+31+31+31+34+35+35+ n n +36+38)/24= 708/24 = 29,5; _ - по дискретному вариационному ряду: X = (x1p1 + … +xvpv ) = Σ xipi = 20∙1/24+22∙1/24+24∙1/24+25∙1/24+26∙2/24+28∙6/24+31∙6/24+ +33∙1/24+34∙1/24+35∙2/24+36∙1/24+38∙1/24 = 708/24 = 29,5; _ - по интервальному вариационному ряду: X=(y1p1 + … +yvpv ) = Σ yipi = 21∙1/24+23∙1/24+25∙2/24+27∙2/24+29∙6/24+31∙6/24+33∙1/24+ +35∙3/24+37∙1/24+39∙1/24 = 722/24 =30,08; 2)выборочную дисперсию - по исходному ряду данных: Σ ( ei - Xi)2Σei2 --- S2 = ———――=—— –X2 =(400+484+576+625+676+676+784+784+784+784+784+784+961+961+ n n +961+961+961+961+1089+1156+1225+1225+1296+1444)/24 – (29,5)2 = 889,25 – 870,25 = 19
S2= Σ ( xi - Xi)2 pi = Σ xi2pi– X2= 400∙1/24+484∙1/24+576∙1/24+625∙1/24+676∙2/24+784∙6/24+ +961∙6/24+1089∙1/24+1156∙1/24+1225∙2/24+1296∙1/24+1444∙1/24 – (29,5)2 = 889,25 – 870,25 = 19; - по интервальному вариационному ряду: S2 =Σ ( yi- Xi)2pi = Σ yi2pi – X2= 441∙1/24+529∙1/24+625∙2/24+729∙2/24+841∙6/24+961∙6/24+ +1089∙1/24+1225∙3/24+1369∙1/24+1521∙1/24 – (30,08)2 = 922,67 – 904,81 = 17,86; 3) выборочное среднее квадратическое
S =√19 =4,36;
S = √19 = 4,36; - по интервальному вариационному ряду: S = √17,86 = 4,23 . Наиболее точные оценки параметров выборочной средней, выборочной дисперсии и выборочной средней квадратической дают расчеты по исходному ряду данных и по дискретному вариационному ряду.
S2 = S2∙ n /(n – 1) = 19∙24/23 = 456/23 =19,83 - по интервальному вариационному ряду: S2 = S2∙ n /(n – 1) = 17,86∙24/23 = 18,63 Матричные игры с нулевой суммой 11.3.Нижняя и верхняя цены игры, седловая точка Для матрицы найдём нижнюю цену игры l=max{min{a[i,j]:j}:i} и верхнюю цену игры U=min{max{a[i,j]:i}:j} . 82 73 10 55 46 37 28 19 10 1 │ 73 64 9 46 37 28 19 10 1 92│ Седловая точка 57 55 46 52 50 48 47 58 56 55│ 55 46 8 28 19 10 1 92 83 74│ 46 37 7 19 10 1 92 83 74 65│ 37 28 6 10 1 92 83 74 65 56│ 28 19 5 1 92 83 74 65 56 47│ 19 10 5 92 83 74 65 56 47 38│ 10 1 4 83 74 65 56 47 38 29│ 1 92 3 74 65 56 47 38 29 20│ Эти величины совпадают если и только если матрица имеет седловую точку. Так называется элемент, являющийся минимальным в своей строке и максимальным в своем столбце. Цена игры лежит между нижней и верхней ценами игры. Игроки имеют оптимальные чистые стратегии если и только если матрица имеет седловую точку - в этом случае оптимальной стратегией 1-го игрока является неизменный выбор строки с седловой точкой, для 2-го игрока - неизменный выбор столбца с седловой точкой. 36 38 38 38 38 37 37 37 37 37│ 36 0 72 40 8 76 44 12 80 48 16│ 0 Седловая точка 0 40 8 76 44 12 80 48 16 84│ 0 1 8 76 44 12 80 48 16 84 52│ 1 a[1,1]=36 1 76 44 12 80 48 16 84 52 20│ 1 0 44 12 80 48 16 84 52 20 88│ 0 0 12 80 48 16 84 52 20 88 56│ 0 0 80 48 16 84 52 20 88 56 24│ 0 1 48 16 84 52 20 88 56 24 92│ 1 1 16 84 52 20 88 56 24 92 60│ 1 36 80 84 84 84 88 88 88 92 92 11.4.Аналитическое решение игр 2х2 Решение игр 2х2 можно найти по формулам. Пусть {a[i,j]} - матрица игры 2х2 . Если седловая точка в матрице есть, то решение игры ясно - в этом случае оп- тимальной стратегией 1-го игрока является неизменный выбор строки с седловой точкой, для 2-го игрока - неизменный выбор столбца с седловой точкой. Поэтому предположим, что седловой точки нет. Обозначим a=a[1,1]-a[1,2]-a[2,1]+a[2,2], b=a[2,2]-a[1,2]), c=a[2,2]-a[2,1] и d=a[2,2] . Пусть (x,1-x), (y,1-y) - оптимальные стратегии 1-го и 2-го игроков и v - цена игры, тогда x=c/a, y=b/a и v=d-cb/a . Зададим матрицу игры 2х2. Элементы матрицы игры - не более чем двузначные целые положительные или отрицательные числа. (Поясним, как выводятся вышеуказанные формулы. Математическое ожидание выигрыша 1-го игрока есть M[x,y]=x*y*a[1,1]+(1-x)*y*a[2,1]+x*(1-y)*a[1,2]+(1-x)*(1-y)*a[2,2]. После перемножения и приведения подобных членов это выражение записывают в виде: M[x,y]=a*(x-c/a)(y-b/a)+(d-cb/a) , где a,b,c,d - указанные выше числа. Теперь уже ясно, что оптимальные стратегии игроков есть (c/a,1-c/a), (b/a,1-b/a) и (d-cb/a) -цена игры). Оптимальные стратегии игроков I II Цена игры матрица 2 3 5/6 (2/6;4/6) 2.67 игры +-xx 6 1 1/6 a = 2-3-6+1= -6 b =1-3= -2 c=1-6= -5 d= 1 11.5.Оптимальное решение - максимин=минимакс Основная теорема матричных игр утверждает, что для любой матричной игры max{min M[P,Q]:Q}:P}=min{max{M[P,Q]:P}:Q}, т.е. во множестве смешанных стратегий есть седловая точка, дающая оптимальное решение игры ( M[P,Q] - есть средний выигрыш 1-го игрока при игре игроков со стратегиями P,Q соответственно) . Поэтому, если найти стратегию P*, на которой достигается максимум величины l(P)=min{M[P,Q]:Q} , то P* есть оптимальная стратегия 1-го. Для игр 2х2 это сделаем так: переберем с малым шагом значения x от 0 до 1, при каждом x находя l(x)=min{M[x,y]:0<=y<=1} : затем найдем x*, при кото- ром l(x) максимально; это максимальное значение есть приближенно цена игры, (x*;1-x*) есть приближенно оптимальная стратегия 1-го игрока; затем можно найти приближенно оптимальную стратегию 2-го игрока. Максимум l(x) находим в в два этапа: сначала с крупным шагом 0.1, затем с мелким шагом 0.01 . Пример: Пусть задана матрица 5 1 4 2 шаг-0.1 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 l(x) 2.0 1.9 1.8 1.7 1.6 1.5 1.4 1.3 1.2 1.1 1.0 шаг-01 0.00 0.05 l(x) 2.00 1.99 1.98 1.97 1.96 1.95 матрица 5 1 0.00; игры 4 2 1.00 (0.25;0.75) 2.00 I II Цена игры 11.6.Метод Брауна-Робинсона нахождения решения игры Оптимальные стратегии игроков и цену игры можно найти приближенно методом Брауна-Робинсона. Предположим, что 1-й играет со стратегией P. Если 2-й выберет j-й столбец, то его средний проигрыш будет M[P,j]=a[1,j]*p[1]+...+a[n,j]*p[n], значит 2-й должен выбрать столбец j, на котором величина M[P,j] минимальна. Аналогично пусть действует 1-й . Предположим, что они уже сыграли n партий, тогда за их стратегии P,Q принимают вектора частот выборов строк и столбцов. Очередные ходы должны быть наилучшими ответами на эти стратегии. Зададим матрицу 3х3, элементами которой являются числа от -9 до 9 и понаблюдаем за стабилизацией стратегий и цены игры. Стабилизация происходит весьма медленно: для стабилизации 2-го знака после запятой может потребоваться десятки тысяч партий, 3-го знака- сотни тысяч. Этим методом цену игры всегда можно определить, но стабилизации стратегий может не быть в некоторых специально сконструированных играх. Число сыгранных партий матрица -7 -5 -4 0.00 723300 -2 3 6 0.27 игры 5 4 2 0.73 0.36;0.00;0.64 3.092 I II Стратегии игроков цена игры 11.7.Игра со спичками Спички разложены в 5 групп. Игроки - Человек и компьютер по очереди берут спички. Можно брать только из одной группы и обязательно любое ненулевое количество спичек. Кто берет спички самый первый раз называется 1-м игроком, другой - 2-м игроком. Кто берет спички последним, тот и победитель. Список использованной литературы
|