Ѕаза знаний студента. –еферат, курсова€, контрольна€, диплом на заказ

курсовые,контрольные,дипломы,рефераты

¬оенные игры. »гры преследовани€ — ћатематика

ѕосмотреть видео по теме  урсовой

ћинистерство образовани€, здравоохранени€ и культуры

–еспублики  азахстан

¬”« ј¬»Ё 

 афедра Ё¬ћ

 урсова€ работа

ѕо дисциплине: Ђ“еори€ прин€ти€ решенийї

“ема: Ђ¬оенные игры. »гры преследовани€.ї

¬ыполнил:

—т-т гр «ѕќ—-96-1

√ринев ћ.¬.

ѕрин€л:

ƒоцент, к.ф.-м.н.

ѕшенин ≈.—.

јлматы 2000г.

¬ведение.

 огда собака гонитс€ за кроликом, то даже если она все врем€ видит его, она не знает его дальнейшего поведени€ и может руководствоватьс€ только знанием физических возможностей кролика и своих собственных. “аково своеобразие задачи преследовани€ одного управл€емого объекта другим управл€емым объектом, математическому описанию которой посв€щена данна€ работа.  онечно, здесь речь пойдет не о животных, а о технических объектах, но у этих объектов предполагаетс€ некотора€ свобода действий, аналогична€ свободе воли животных. «аранее† нужно сказать, что рассматриваемые в работе† технические объекты чрезвычайно элементарны, и весь вопрос ввиду его новизны находитс€ на очень низком уровне развити€. ¬ работе рассматриваютс€ игры, в которых участвуют два игрока: убегающий и преследующий. “акие игры преследовани€ называютс€ дифференциальными потому, что в них поведение обоих игроков описываетс€ дифференциальными уравнени€ми.

‘азовые координаты и управлени€.

“ипичными примерами дифференциальных игр €вл€ютс€ сражени€, воздушные бои, преследование судна торпедой, перехват самолета зенитной ракетой, охрана объектов. ≈сли один из игроков выключаетс€ из игры, мы получаем обычную задачу максимизации. ќна уже относитс€ к† вариационному исчислению и составл€ет основную часть теории управлени€.

††††††††††††††† –ешени€ игроков всегда заключаютс€ в выборе некоторых величин, называемых управлени€ми. ќни в свою очередь определ€ют собой значени€ других величин Ц фазовых координат. ѕоследние обладают тем свойством, сто знание их значений в любой момент времени полностью определ€ет течение† игры.

¬оенные игры.

‘азовые координаты должны быть такими величинами, которые характеризуют положение дел в той мере, в какой† по необходимости упрощенна€ модель задачи соответствует реальному процессу. ‘азовыми координатами могут, в частности, быть число людей, самолетов, танков, судов; может оказатьс€ целесообразным разделить их на группы по расположению† в различных районах или по какому-либо другому признаку, например по удаленности от линии фронта и т.д.

††††††††††† ѕусть арми€1 Ц Ђминимизирующа€ї - имеет в своем распор€жении управлени€ЕЕ; соответственно арми€2 Ц Ђмаксимизирующа€ї - имеет управлени€ ЕЕЕ. ¬ыбор управлений часто обусловлен обсто€тельствами. ѕредположим, например, что платой €вл€етс€ разница в живой силе† (или снар€жении и т.п.) в конце игры или в фиксированный момент времени “. ѕусть† x1 Ц соответствующа€ координата I-той армии, тогда плата равна x2 Ц x1. ћеханизм развити€ подобной игры лучше всего продемонстрировать на конкретных примерах.

††††††††††† ѕусть x1 Ц количество живой силы армии1 в некотором секторе; это количество может уменьшатьс€ за счет воздушных налетов противника. ѕусть x3 Ц число самолетов армии2 (противника), которые можно использовать дл€ этой цели через. „ерез y1 обозначим (<=y1<=1) обозначим долю общего числа самолетов x3 , которую противник решает использовать в некоторый момент времени. “еперь нужно из опыта или каким-либо другим образом определить, как ожидаемые потери в живой силе завис€т от числа† j1x3 посланных самолетов противника. ѕусть они пр€мопропорциональны j1x3 и коэффициент пропорциональности равен C.

††††††††††† ƒл€ того чтобы иметь возможность использовать мощный аппарат математического анализа, будем предполагать, что процесс €вл€етс€ не дискретным, а непрерывным. Ёто дает непрерывную аппроксимацию дискретной игры.

††††††††††† ѕредставим, что арми€1 получает пополнение с фиксированной скоростью r. “огда имеем уравнение

††††††††††††††††††††††††††††††††††† X`1=r-cy1x3 +Е††††††††† ††††††††††††††††††††††† (1)

ћноготочие в правой части уравнени€ означает различные другие члены, как, например, изменени€ в результате других действий армии2 или маневрировани€ живой силой армии1. если игра полностью симметрична, то имеем такое же уравнение, только† армии мен€ютс€ рол€ми.

††††††††††† ѕусть x4 Ц запас военного снар€жени€ армии1, который служит дл€ ее снабжени€. ѕусть b -† максимальна€ скорость такого снабжени€. ѕусть j1 (0<=j1<=1)† - дол€ от† b, которую арми€1 решает использовать в данный момент. “огда

††††††††††††††††††††††††††††††††††††††††††††††† X`4 = - bj1. †††††††††††††††† (2)

††††††††††† ѕри определении пространства состо€ний E мы будем требовать, чтобы выполн€лось условие x4³0. тогда (2) представл€ет собой ограничение на использование этого запаса и дает игроку возможность распор€жатьс€ этим запасом с учетом его ограниченности.

††††††††††† ¬ левых част€х уравнений (1) и (2) сто€т обычные производные от координат по времени. ”равнени€ такого типа служат основным средством описани€ развити€ дифференциальной игры. ќни называютс€ уравнени€ми движени€ и имеют вид:

††††††††††† X`ì †= fi(x1,Еxn, ji,Е, jn, ynЕyn), I=1,Еn††† (3)

»так, скорость изменени€ фазовых координат €вл€етс€ заданной функцией от фазовых координат и управлений обоих игроков.

»гры с движущимс€ объектом.

††††††††††† ¬озьмем в качестве примера движущегос€ объекта автомобиль и рассмотрим при этом уравнение движени€, фазовые координаты, управлени€ и различи€ между последними. јвтомобиль выбран потому, что его свойства общеизвестны. –ассуждени€ можно применить, лишь с малыми изменени€ми, к любому движущемус€ объекту. Ћетательные аппараты движутс€ в трехмерном пространстве, но принцип остаетс€ тот же.

††††††††††† √еометрическое положение объекта, например автомобил€, описываетс€ трем€ фазовыми координатами: x1,x2 Ц декартовы координаты некоторой фиксированной точки автомобил€ и x3 Ц угол, образуемый осью автомобил€ с фиксированным направлением, например направлением x1. ѕредполагаетс€, что движение происходит во всей плоскости x1,x2. ≈сли автомобиль фигурирует в дифференциальной игре, то нужно знать о нем больше. ѕредположим, сто автомобиль управл€етс€ с помощью мотора и рул€. ћотор управл€ет тангенциальным ускорением. Ёта величина, наход€ща€с€ под контролем игрока, €вл€етс€ управлением и будет обозначатьс€ через j1. „тобы иметь простой и единообразный вид границ уравнений, мы примем ускорение равным Aj1. «десь A Ц максимальное возможное ускорение, и управление j1 подчин€етс€ теперь ограничению вида 0£j1£1. “аким† образом, оно €вл€етс€ долей полного ускорени€ и находитс€ под контролем водител€. —корость x4 не находитс€ под непосредственным контролем водител€, но ее величину, как и величины x1,x2,x3, оба игрока должны принимать в расчет. —ледовательно, она должна рассматриватьс€ как фазова€ координата.

ѕоложение рул€ определ€ет кривизну траектории автомобил€. Ќо нереально считать, сто водитель может мен€ть ее произвольно. »меет смысл прин€ть кривизну траектории автомобил€ за еще одну фазовую координату x5 (очевидно, физически это есть угол поворота передних колес), а долю скорости ее изменен舆 - за управление j2 . »так , если W Ц максимальна€ скорость изменени€ величины x5 , то скорость, выбираема€ водителем, равна W j2, где -1 £ j2 £1.

¬ этих предположени€х движение автомобил€ будет определ€тьс€ следующими уравнени€ми движени€.

x`1 = x4 cos x3†††††††††††††† (1)

x`2 = x4 sin x3, † (2)

x`3 = x4x5,†††††††††††††††††††† (3)

x`4 = A j1,† 0£j1£1††††† (4)

x5 = W j2 , -1 £ j2 £1 (5).

«десь (1), (2) есть просто разложение скорости автомобил€ по ос€м координат; (3) устанавливает, что скорость изменени€ направлени€ равна скорости, умноженной на кривизну. „то касаетс€ (4), то скорость изменени€ скорости есть ускорение.

–езюмиру€, можем сказать, что величины x1Еx5 описывают те свойства автомобил€, которые существенны при его участии, скажем, в игре преследовани€. ќни называютс€ фазовыми координатами. ¬одитель управл€ет с помощью величин j1 (положение педали газа) и j1 (дол€ скорости вращени€ рул€). Ёти величины €вл€ютс€ управлени€ми, и только они одни в каждый момент времени наход€тс€ под контролем игрока. ќни, в отличие от фазовых координат, не могут быть изменены измерены противником.

ƒанна€ модель имеет недостаток† - неограниченна€ скорость. Ёто можно исправить, налага€ ограничени€ на† x4, но более естественно изменить само управление† (4). ¬о-первых, утверждение, что сила, развиваема€ мотором, пропорциональна величине, на которую отжата педаль газа, следует считать сверхупрощением динамики автомобил€. ¬о-вторых, самое важное, эта сила пропорциональна ускорению автомобил€, только если пренебрегать трением. ≈сли предположить, что трение пропорционально скорости и направлено в противоположном направлении, то получим улучшенный вариант уравнени€ (4):

x`4 = F(A j1) Ц Kx4 .

«десь A j1 (0 £ j1 £1) Ц величина, на которую отжата педаль газа, F Ц результирующа€ сила (на единицу массы автомобил€), развиваема€ мотором, а K Ц коэффициент трени€. “огда скорость будет ограничена величиной F(A)/K.

††††††††††† ƒруга€ существенна€ поправка состоит в ограничении кривизны x5.

††††††††††† »так, уравнени€ движени€ можно усложнить дл€ получени€ более точного соответстви€ с действительностью или упростить дл€ облегчени€ математических выкладок.

»гры преследовани€.

††††††††††† ћного примеров игр преследовани€ можно привести из области военного дела: торпеда и корабль, корабль и подлодка, танк и джип и т.д.

„тобы получить общую картину, будем обозначать преследовател€ через –, а преследуемого через ≈. —оответствующие движущиес€ объекты могут управл€тьс€ человеком или автоматически. ¬ более сложных случа€х участников игры может быть больше двух, например группа боевых самолетов противостоит эскадре вражеских бомбардировщиков или Ц уже из† другой области Ц в футболе несколько нападающих играют с удерживающим м€ч противником. ¬ общем случае – и ≈† - разумные противники с противоположными интересами. Ќо если каждый из них управл€ет лишь одним движущимс€ объектом, то символами† – и ≈ будут обозначатьс€ сами эти объекты. “ак, – может быть некоторой фиксированной точкой преследующего объекта, например его геометрическим центром. »гра преследовани€ обычно считаетс€ оконченной, когда произошел захват. Ёто означает, что рассто€ние –≈ стало меньше некоторой наперед заданной величины l.

††††††††††† ƒл€ по€снени€ идей остановимс€ на некоторых типичных моментах. «а ≈ обычно принимают вторгающийс€ бомбардировщик, самолет или управл€емый снар€д, а за – Ц защищающий перехватчик, также самолет или снар€д. ¬о-вторых, спрашиваетс€: как наилучшим образом должен преследовать ≈? ƒалее, если в каждый момент времени – знает и свое положение и положение ≈, то как† он должен в этот момент измен€ть свои управлени€? ѕод положением понимаютс€ не только координаты точек – или ≈, но и другие характеризующие состо€ние величины, такие, как направление полета, ориентаци€, скорость, короче Ц фазовые координаты.

¬о-вторых, нужно определить, что означает Ђнаилучшим образомї. ѕо терминологии теории игр необходимо выбрать плату.  ритерий наиболее очевиден, если захват всегда осуществим. ¬ том случае, когда интерес представл€ют только два исхода игры, будем говорить о проблеме как о† некоторой игре качества (в отличии от игры степени, которые имеют континуум возможных исходов). Ќо – может быть перехватчиком с ограниченным запасом горючего. “огда наиболее реальный критерий должен основыватьс€ на том, сможет ли произойти захват раньше некоторого определенного момента времени. ≈сли ≈ Ц бомбардировщик, цель которого† - достижение данного объекта, то наиболее интересным €вл€етс€ вопрос, сможет ли быть осуществлен захват прежде, чем ≈ выполнит свое назначение. ≈сли – использует снар€ды, ракеты или† другое подобное оружие, то захват состоит в том, чтобы оказатьс€ в зоне достижимости ≈. ≈сли же – не уверен, что попадет в цель точно, он может ставить своей задачей оказатьс€ в зоне достижимости ≈ в течение определенного времени.

††††††††††† ¬се вышеописанные случаи соответствуют дискретной, точнее, двузначной плате, и мы будем классифицировать соответствующие им игры как игры качества. Ќо бывают случаи, когда противники стрем€тс€ минимизировать или максимизировать определенную переменную величину. Ёта величина есть плата, и игра €вл€етс€ игрой степени.

††††††††††† „асто в качестве платы удаетс€ выбрать такую непрерывную величину, что она автоматически содержит в себе определенный выше дискретный критерий. Ќапример, предположим, что нас интересует только один вопрос: может ли быть осуществлен захват? ¬ качестве платы можно вз€ть врем€ захвата, причем цель – Ц сделать это врем€ по возможности меньшим, а цель ≈ Ц по возможности большим. Ѕесконечное врем€ соответствует случаю, когда захват неосуществим. “огда, если – действует в соответствии с этим предписанием, он , конечно, достигает своей основной цели вс€кий раз, когда захват осуществим. ѕритом сделает это в кратчайшее врем€. “еперь предположим, что вначале целью – был захват за врем€, не превосход€щее некоторого фиксированного “. минимизиру€ врем€ захвата –, разумеетс€, добьетс€ успеха, если у него есть дл€ этого возможность; нужно только вз€ть минимальную величину времени за захвата, которой смог добитьс€ –, и посмотреть, превосходит эта величина “ или нет.

††††††††††† Ёта мысль €вл€етс€ достаточно общей. ≈сли, скажем, первоначально было желательно узнать, сможет или нет ≈ достичь определенной приближенности к некоторому объекту, в качестве платы можно выбрать рассто€ние до объекта в момент захвата. »меетс€ в виду, что – стремитьс€ максимизировать это рассто€ние,† можно быть уверенным, что он не только выполнит свою задачу, защиты объекта, если это возможно, но и достигнет наибольшего резерва безопасности или же сделает все, что в его силах, если он окажетс€ не в состо€нии расстроить планы ≈.

††††††††††† »так, ответом на вопрос, что означает в играх Ђнаилучшим образомї, €вл€етс€ установление численного значени€ платы. ƒл€ игр качества это можно сделать несколько искусственно, приписав два (или более) числовых значени€ величине платы дл€ двух (или более) исходов. ЂЌаилучшим образомї дл€ – означает сделать эту плату наиболее малой.

††††††††††† ѕредположим, что плата выбрана; как – должен минимизировать ее? ≈сли он преследует снар€д ≈, как ему действовать? ƒолжен ли он, например, использу€ данные о положении ≈ , пытатьс€ экстраполировать будущее движение ≈ и маневрировать так, чтобы преградить ему путь?

†††††††††††  раткое размышление показывает, что такие вопросы бессмысленны. ќтвет зависит от того, как будет вести себ€ ≈. ≈сли он прин€л решение двигатьс€ по пр€мой с посто€нной скоростью, то –, разумеетс€, сможет преградить ему путь, причем довольно просто подсчитать, как это сделать наилучшим образом. Ќо если – всегда будет действовать так, то ≈, если он достаточно проницателен, может заманить – в ловушку. “аким образом, никакой план преследовани€ не будет дл€ – оптимальным, если противник движетс€ произвольно.

††††††††††† »з этого следует, сто нельз€ говорить об оптимальном преследовании, не определив, что такое оптимальное уклонение. Ќеобходимо одновременно рассматривать всевозможные способы поведени€ обоих противников, дл€ того чтобы разработать методы анализа игровых ситуаций.

††††††††††† ќптимальное уклонение можно классифицировать так же как оптимальное преследование. ¬се замечани€, сделанные выше относительно – и его цели преследовани€, сохран€ют свой смысл и† дл€ ≈ с его целью уклонени€. Ќапример, можно говорить о способах избежать захвата или по крайней мере предупредить его до истечении времени “. ≈сли за плату прин€ть рассто€ние до объекта в момент захвата, то можно обсуждать вопрос о том, как ≈ должен максимизировать это рассто€ние. ¬ военных задачах, разумеетс€, обе стороны рассматривают оба класса этих вопросов. ¬ыше обсуждались задачи игры и пон€ти€ платы только с точки зрени€ преследовател€ –, но это делалось лишь дл€ того, чтобы облегчить описание.

††††††††††† Ќа рисунке 1 — есть область расположени€ объекта, который – защищает от атакующего врага ≈; – и ≈ оба совершают простое движение с одинаковой скоростью и начинают двигатьс€† из положени€, указанного на рис.1. ѕримем здесь дл€ простоты, что захват означает совпадение точек – и ≈. ѕлатой €вл€етс€ рассто€ние† от точки захвата до — (если захват возможен); – должен максимизировать это рассто€ние, а ≈ Ц минимизировать его. ≈сли ≈ может достичь — и захвата не произойдет, то этот исход считаетс€ дл€ ≈ наилучшим.

††††††††††† ¬ообразим, что ≈ Ц носитель могущественного оружи€, скажем, €дерного, и если он не может достичь объекта, то стремитьс€ взорватьс€ как можно ближе к нему. —оответственно перехватчик – стремитьс€ встретить его в наиболее удаленной от — точке.

†††††††††††

.≈

††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††† —

.–

–исунок 1.

ј вот пример посложнее. ќн представл€ет собой игру преследовани€, где один из противников вынужден двигатьс€ так, чтобы кривизна его траектории не превышала некоторой величины. Ёто кинематическое ограничение типично.†

††††††††††† ƒано: автомобиль на бесконечной пустой площади, который пытаетс€ наехать на пешехода. “аким образом, рассматриваетс€ игра преследовани€, где – обладает превосход€щей скоростью, но меньшей маневренностью по сравнению с ≈. ѕреследователь – движетс€ с посто€нной скоростью w1, радиус кривизны его траектории ограничен заданной величиной R; P управл€ет выбором значени€ этой кривизны в каждый момент. ”бегающий ≈ обладает более простым движением. Ёто значит, что его скорость w2 фиксирована, и управление состоит в том, что в каждый момент выбираетс€ направление движени€. ¬ этом случае допустимы любые крутые повороты; траектори€ может не иметь касательной в каждой точке.

††††††††††† «ахват происходит, когда рассто€ние –≈ не больше заданной величины l, радиуса захвата. ѕреследователь об€зан быть† быстрее w1>w2.

Ќас интересуют два вопроса.

  1. »гра качества.  огда – может поймать ≈ ? ясно, что если R велико, l мало и w1 не очень превышает w2, то ≈ всегда может избежать захвата. ћожно считать, например, что он сделает это,† просто отступа€ в сторону вс€кий раз, когда по€вл€етс€ угроза захвата. ќграничение кривизны траектории преследовател€ запрещает ему слишком резкие повороты. ќн может промчатьс€ мимо ≈ и, вернувшись обратно дл€ новой попытки, может быть снова обманут тем же маневром ≈.

«адача состоит в том, чтобы определить точные услови€: значени€ R,l,w1/w2, которые разграничивают эти возможности.

  1. »гра степени с временем захвата в качестве платы. “еперь предположим, что – всегда может поймать, и выберем платой врем€, в течении которого происходит захват. ¬ терминах прин€той терминологии можно считать, что пешеход надеетс€ на прибытие спасени€ и потому, если он сам не может избежать захвата, то по крайней мере стараетс€ отсрочить его. –азумеетс€, – стремитьс€ действовать настолько быстро, насколько позвол€ют обсто€тельства.

≈сли вначале ≈ находитс€† более или менее впереди –, оптимальный ход игры очевиден. Ќа рис.2(а)† точка – изображает начальное положение преследовател€, его скорость направлена вверх; убегающий находитс€ в точке ≈, впереди – и, скажем, немного правее его. Ќа рисунке изображена часть окружности максимальной кривизны, допустимой дл€ траектории преследовател€; вектор скорости касаетс€ ее в точке –. согласно предписанию своей оптимальной стратегии, – должен начать движение по этой дуге, дела€ максимально крутой поворот вправо Ц до точки –1, где его скорость направлена на ≈. ƒалее он движетс€ по касательной, как показано. —оответственно ≈ движетс€ по той же касательной, и это простое преследование продолжаетс€ вдоль пр€мой вплоть до совершени€ захвата, скажем, в точке —.

††††††††††† ѕусть теперь – начинает преследование из положени€, когда ≈ находитс€ у него в тылу, как показано† на рис.2 (б). ≈сли – будет действовать, как описано выше, может случитьс€, что ≈ успеет попасть внутрь окружности максимальной кривизны раньше, чем – успеет его задавить.

††††††††††† ƒл€ осуществлени€ захвата – должен действовать менее пр€молинейно, например, как показано на рис.2(в). ¬начале он движетс€ прочь от ≈ и, отступив достаточно далеко, возвращаетс€ по дуге окружности, чтобы начать пр€мое преследование. —о своей стороны ≈, учитыва€, что врем€ €вл€етс€ платой, стремитс€ отсрочить захват. — этой целью он начинает свое отступление, сперва следу€ за –, скажем вдоль ≈≈1. ¬ некоторой точке ≈1 он поворачиваетс€ и убегает в направлении, выбранном так же, как в случае (а).

††††††††††† “акой тип преследовани€ будет называтьс€ маневром разворота. ќн составл€ет наиболее интересный случай с точки зрени€ математики игры степени.

–ис. 2(а)††††††††††††††††††††††††††††††††††††††††††††† †††††† .—

††††††††††††††††††††††† †††††††††††††††

††††††††††††††††††††††††††††††††††††††††††††† ≈

†††††††

††††††††††††† –1

††††††††††††††††††††††††††††† †R

††††† –†††††††††††††††† а

–ис.2 (б)


†††††††††††††††††† –

††††††††††††††††††††† l

††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††† †††† ††††††≈††††††††††

–ис. 2(в)


††††††††††† ††††††††††† ††R

††††††††††††††††††††††††††††††††††††††††††††††† †††† E1

†††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††† E


††††††††††††††††††††††† †††† R†††† ††††††† P

††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††††† ††††††††††† .C

ћинистерство образовани€, здравоохранени€ и культуры –еспублики  азахстан ¬”« ј¬»Ё   афедра Ё¬ћ  урсова€ работа ѕо дисциплине: Ђ“еори€ прин€ти€ решенийї “ема: Ђ¬оенные игры. »гры преследовани€.ї ¬ыполнил: —т-т гр «ѕќ—-96-1

 

 

 

¬нимание! ѕредставленна€  урсова€ находитс€ в открытом доступе в сети »нтернет, и уже неоднократно сдавалась, возможно, даже в твоем учебном заведении.
—оветуем не рисковать. ”знай, сколько стоит абсолютно уникальна€  урсова€ по твоей теме:

Ќовости образовани€ и науки

«аказать уникальную работу

ѕохожие работы:

—етевые методы в планировании
ѕоиск клик в графах
–егрессионный анализ в моделировании систем. »сследование посещаемости WEB сайта
¬ычисление интеграла фукции f (x) методом —импсона
ѕриближенное вычисление определенного интеграла при помощи квадратурной формулы „ебышева
“еори€ веро€тностей и математическа€ статистика
“ипичные дефекты в криптографических протоколах
—овременные криптографические методы
—интез —ј”
Ќахождение всех действительных корней алгебраического многочлена методом делени€ отрезка пополам (бисекции) и методом хорд и касательных с указанной точностью и учетом возможной кратности корней

—вои сданные студенческие работы

присылайте нам на e-mail

Client@Stud-Baza.ru