1 1. Operacijske raziskave ( opredelitev pojma) …so

Transcription

1 1. Operacijske raziskave ( opredelitev pojma) …so
1. Operacijske raziskave (opredelitev pojma)
…so interdisciplinarna veda. Nastala je iz nizov problemov, v katerih se ie optimalno stanje/gibanje
nekega sistema.
Gre za sklop metod, metodologijo, postopke, identifikacijo, algoritmacijo in implementacijo
problemov in njihovih reitev na podlagi delovanja/operacij sistema. So sredstvo za generiranje
alternativnih (optimalnih) reitev, med katerimi izbira nosilec odloanja.
2. Konveksna linearna kombinacija (dveh ali veih tok)
Konveksna linearna kombinacija dveh ali ve tok je linearna kombinacija, pri kateri so koeficienti <1
in >0, njihova vsota pa je 1.
Lin. komb. vektorjev/tok x1, x2, …, xn vektorskega prostora V s koeficienti p1, p2, …, pn p1x1 + p2x2 +…+ pnxn, kjer so koeficienti p1, p2, …, pn > 0 in < 1 ter velja: p1+p2+…+pn=1, se imenuje
konveksna linearna kombinacija/sestava danih vektorjev/tok.
Geom: Vsaka toka, ki je konveksna lin. komb. dveh tok, lei na daljici, ki ima ti dve toki za
krajii in obratno (vsako toko na daljici je mogoe izraziti kot konveksno lin. komb. kraji daljice).
3. Konveksne mnoice (poljubni dve toki)
Konveksne so mn. tok (M), za katere je znailno, da e sta x1 in x2 poljubna elementa te mnoice, je
tudi vsaka njuna konveksna linearna kombinacija element te mnoice. Lei v vekt. prostoru (V).
Geo: Poljubna mnoica M je konveksna, e je s poljubnima dvema tokama A in B iz M tudi cela
daljica AB v M.
primeri: ena sama toka; daljica, premica; krog, trikotnik, pravokotnik; ravnina, polravnina, toke med
dvema krakoma ostrega kota; krogla, kocka, tetraeder, valj, stoec, ves prostor,…
Toke konveksne mnoice delimo na ekstremne in neekstremne:
4. Ekstremna toka konveksne mnoice tok
…je vsaka toka, ki jo ni mogoe izraziti kot konv. linearno komb. nobenih dveh tok mnoice (npr.
krajii daljice; vse toke na povrini kocke+oglia)
5. Neekstremna toka konveksne mnoice tok
…je vsaka toka, ki jo je mogoe izraziti kot konv. linearno komb. vsaj dveh drugih tok mnoice
(npr. ostale toke kocke, brez ogli; notranje toke krogle – brez tistih, na povrini)
6. Konveksni polieder
… je omejena konveksna mnoica tok s konnim tevilom ekstremnih tok (na katere je napet)
vektorskega prostora V.
Vse konveksne linearne kombinacije poljubnega konnega tevila tok vektorskega prostora
sestavljajo konveksno mnoico, ki jo imenujemo konveksni polieder. Toke tega konveksnega
poliedra so potemtakem vse konveksne linearne kombinacije konnega tevila tok x1, x2, … xn,
katerih koeficienti pi (i=1…n) so < 1 in > 0, njihova vsota pa je 1. e je toka x konveksnega poliedra
linearna kombinacija tok x1, x2,x3 … xn, in e je toka x1 linearna kombinacija tok x2,x3 … xn, je
toka x tudi konveksna linearna kombinacija teh tok x2, x3,… xn.
e iz sistema tok x1, x2, … xn, izpustimo vse tiste toke, ki so konveksne linearne kombinacije
preostalih tok, se prvotno definirani konveksni polieder ne spremeni. Toke konveksnega poliedra je
mogoe izraziti kot konveksne linearne kombinacije ekstremnih tok.
7. Linearno programiranje kot posebna matematina metoda
…je panoga uporabne matematike, ki obiajno reuje probleme optimalne porabe ali alokacijo
kakrnihkoli sredstev, ki so na razpolago le v omejenih koliinah. Bistvo za linearno programiranje je,
da je namenska funkcija linearna in da so tudi vse pogojne neenabe ali enabe linearne.
Def: Lin. progr. je posebna matematina metoda, ki jo uporabljamo pri obravnavi problema vezanega
ekstrema z linearno namensko (kriterialno) funkcijo, kjer pogoje (omejitve) sestavlja sistem linearnih
enab oz. neenab z dodatno zahtevo, da imajo spremenljivke nenegativno vrednost.
1
Loimo dve vrsti linearnega programiranja: za minimum, ali za maksimum namenske funkcije.
8. Linearni program za minimum (oz. maksimum) namenske funkcije v obliki neenab oz.
enab
MIN: (za max sta le neenaaja obrnjena: )
Doloiti je treba vrednosti spremenljivk x1, x2, …, xs, ki zadoajo pogojem nenegativnosti in
a11x1 + ...+ a1s xs b1
linearnim enabam:
...
tako, da ima namenska (oz. kriterialna funkcija
am1x1 + ...+ amxs bm
f (x1,...,xs ) = c1X 1 + ...+ cs xs minimum.
m,n sta poljubni naravni tevili
aij, cj poljubna realna tevila
bi
poljumna nenegativna tevila
9. Linearni program za minimum (oz. maksimum) v matrini obliki
a11 ... a1s
x1
b1
c = c1 ... cs
A'= : ... :
x= :
b= :
am1 ... ams
xs
bm
Doloiti je treba vektor x, ki zadoa pogoju nenegativnosti in matrini neenabi A'x b, tako, da
ima namenska funkcija f(x)=cx minimum.
10. Linearni program za minimum (oz. maksimum) v vektorski obliki
Uvedemo vektorje:
b1
a11
a1s
1
s
0
p = : , p = : , ……. ,
p = : .
bm
am1
ams
Doloiti je treba vrednosti spremenljivk x1, x2, … xs, ki zadoajo pogojem nenegativnosti in
xi p1 + ...+ xs ps p0 tako, da ima namenska funkcija f(x1,x2,…,xs)=
vektorski neenabi
c1x1+c2x2+…+csxs minimum.
11. Dopolnilne spremenljivke (neenabe spremenimo v enabe)
kje pridejo v potev (pri max jih ni); navidezno spremenijo program; pripadajoi umetni vektorji
tvorijo st. bazo…
…uvedemo, ko moramo pogoje, ki nastopajo v obliki neenab spremeniti v enabe, da bi linearni
program postal primeren za numerino reevanje. Neenabi ai1 + ...+ ais xs b1 dodamo e en len,
da dobimo enabo:
ai1 + ...+ ais xs xs+i = b1
Tako dobimo nov program z pogojnimi enabami namesto neenab. Nato moramo za zaetek
numerinega reevanja v vsako pogojno enabo vstaviti e po eno umetno spremenljivko (s tem smo
lin. progr. spremenili le navidezno, saj umetna spremenljivka lahko zavzema le vrednost 0 in tako
optimalna reitev ostane nespremenjena. V programu za maksimum pa umetnih spremenljivk ni treba
uvajati, saj njihovo vlogo sprejemajo dopolnilne spremenljivke.
Umetni vektorji so enaki standardni bazi.
12. Umetne spremenljivke
Z njimi dobimo izhodino nedegenirano bazno mono reitev razirjeno formulacijo problema.
13. Strukturni vektorji, dopolnilni vektorji, umetni vektorji
2
Linearen program v vektorski obliki:
b1
p = :
bm
0
a11
p = :
am1
1
a1n
p = :
amn
n
Doloiti je treba vrednosti spremenljivk x1,x2,...xn, ki zadoajo pogojem xi 0(i = 1,2,...,n) in
vektorski enabi x1 p1 + ...+ xn pn = p0 , tako, da ima namenska funkcija f (x1,...,xn ) = c1x1 + ...+ cn xn
minimum.
Vektorje p1, ..., ps imenujemo STRUKTURNI vektorji. Vektorje ps+1, ..., ps+m imenujemo
DOPOLNILNI vektorji in ti so enaki vektorjem –e1, -e2,...,-em. To so torej z (-1) pomnoeni vektorji
standardne baze v vektorskem prostoru m-teric Vm. Vektorje ps+m+1, ..., pn pa imenujemo UMETNI
vektorji in so enaki standardni bazi e1,...,em vektorskega prostora Vm.
14. Mnoica K vseh monih reitev linearnega programa (opredelitev in lastnosti)
polieder; optimalna reitev se bo pojavila vsaj v eni reitvi tega konveksnega poliedra
Mona reitev je reitev, ki zadoa pogojem nenegativnosti in pogojni enabi Ax=b, ne glede na
vrednosti, ki jo ima zanj namenska funkcija. Za mone reitve veljajo izreki:
I.
Mnoica K vseh monih reitev linearnega programa je konveksna. Vzemimo, da je
konveksna mnoica monih reitev linearnega programa K neprazna in omejena (z konno
mnogo hiperravninami, zato je ta mnoica konveksni polieder).
II.
Med ekstremnimi tokami konveksnega poliedra K monih reitev lin. progr. obstaja vsaj
ena, v kateri ima namenska funkcija minimum. (e je le ena, je ta toka njegova ekstremna
toka, e pa ima minimum v ve poliedrovih tokah, tedaj ima minimum v ve ekstremnih
tokah in tudi v kakih neekstremnih tokah.)
III.
e ima namenska funkcija minimum v ve ekstremnih tokah konveksnega poliedra K,
ima minimum tudi v vseh tokah poliedra, ki so konveksne linearne kombinacije teh
ekstremnih tok (reitev je konveksni polieder: mnoica monih+optimalnih reitev).
!!!!Ker je vsaka optimalna reitev linearnega programa konveksna linearna kombinacija
samo tistih ekstremnih tok konveksnega poliedra monih reitev, ki so optimalne, je
mnoica optimalnih reitev tudi konveksni polieder.
IV.
+3-je izreki za bazne mone reitve
e obstaja kak km linearno odvisnih vektorjev p1,…,pk tako da velja vektorska ena
ba
x1p1+…+xkpk=p0, je ustrezna bazna mona reitev x=[x1, x2,…,xk,0,0,…,0]T ekstremna
to
ka konveksnega poliedra monih reitev
V.
vektorji p1,…,pk (km), ki ustrezajo kako bazni moni reitvi, ki je ekstremna to
ka
konveksnega poliedra monih reitev, so linearno neodvisni. ekstremna to
ka konv.
poli. K ima kve
jemu M pozitivnih koeficientov/koordinat.
VI.
Vsaki bazni moni reitvi lin. progr., ki je ekstremna to
ka konveksnega poliedra monih
reitev, je mono med vektorji p1,…,pn prirediti natan
no m linearno neodvisnih vektorjev
(bazo vektorskega prostora Vm)
Vsaka mona reitev ima po n komponent, kjer je n=s+m+m. Mona reitev je nebazna, e ima ve,
kot m pozitivnih komponent in je bazna, e ima m ali manj pozitivnih komponent.
Bazna reitev je nedegenerirana, e ima natanno m pozitivnih komponent in degenerirana, e ima
manj kot m pozitivnih komponent.
Mona reitev x je toka (ali vektor) vektorskega prostora V.
15. Mnoica optimalnih reitev linearnega programa (opredelitev in lastnosti)
vsaj v eni to
ki konveksnega poliedra bo reitev (ali pa v ve
ekstremnih to
kah) – e sta dve, potem je
reitev tudi vsaka linearna kombinacija teh dveh to
k
Optimalna mona reitev je reitev, ko vektor x zadoa vsem pogojem in ima hkrati zanj namenska
funkcija optimalno vrednost.
3
16. Grafino reevanje linearnega programa
narii primer, e imamo 2 spr.
vsak pogoj je ena polravnina;narii namensko funkcijo + vzporedni premik, dokler nima e kakne
skupne toke z reitvami (ali vogal, ali se prekriva s premico in bo reitev daljica)
17.
Metoda simpleksov (opis)
gre za zamenjavo v bazi do naslednje… ko bo mona reitev bolja
MS je najbolj splona metoda za numerino reevanje problemov LP. Izhajamo iz LP po uvedbi
dopolnilnih in umetnih spremenljivk. Najprej vzamemo neko znano bazno mono reitev, ki je
ekstremna toka konveksnega poliedra K monih reitev; vsaki od teh baznih monih reitev pa
ustreza doloena baza vektorskega prostora Vm. V bazi zamenjamo kak njen vektor s kakim
vektorjem, ki ga e ni, tako, da dobimo novo bazo, njej ustrezno novo ekstremno toko in njej
ustrezno novo vrednost namenske funkcije. e je nova vrednost manja od prejnje, dobimo boljo
reitev linearnega programa. Izberemo tako zamenjavo baznih vektorjev, da obstojeo mono lin.
reitev izboljamo. Postopek ponovimo tolikokrat, da dobimo po iterativnih izboljavah mone reitve
optimalno reitev.
18.
Prisojene cene (Zj – vrednost vektorja v bazi)
Zj vrednost vektorja, izraenega v enem iteracijskem koraku, na koncu pa …
+ za umetne !!!
+ za dopolnilne spremenljivke !!!
Reitev primarnega programa sta prisojeni ceni, ki ustrezata prvi moni bazni reitvi
Prisojene cene so tevila zj, ki so obiajno v spodnji vrstici tabele: zj pomeni vrednost vektorja pj v
primeru, ko je njegov sestav izraen z baznimi vektorji. Prisojena cena pomeni realno vrednost
sestavin vektorja pj, torej npr. tablete Tj. e je trna cena kakega vektorja oz. tablete veja od ustrezne
prisojene cene, ta vektor oz. tableta ne nastopi v optimalni reitvi.
19.
Dispozicija raunanja po metodi simpleksov (v koraku)
1) matematini zapis lin. programa 2) dopolnilne 3) 1 mona reitev; zamenjava v bazi
1) LP formuliramo v MA obliki, s pogoji nenegativnosti, s pogojnimi lin. neenabami ali enabami in
z linearno namensko funkcijo.
2) pogojne linearne neenabe in namensko funkcijo z dopolnilnimi spremenljivkami.
3) e gre za minimum namenske funkcije, uvedemo e umetne spremenljivke, sicer pa ne.
4) Sestavimo tabelo; pri tem pazimo, kateri vektorji so bazni: e gre za minimum namenske funkcije,
so bazni tisti vektorji, ki ustrezajo umetnim spremenljivkam; pri max pa tisti, ki ustrezajo dopolnilnim
spremenljivkam.
5) V zadnjo vrstico tabele zapiemo koeficiente am+1,j=zj-cj (j=0,1,...n)
6) Doloimo vektor pk, ki ga uvedemo v novo bazo:
• e gre za min namenske funkcije, doloimo v zadnji vrstici najvejo pozitivno vrednost
razlike zj-cj zk-ck=max(zj-cj ) Tej najveji vrednosti ustreza vektor pk, ki ga uvedemo
v novo bazo.
• !!!!e gre za max nam. funkcije, doloimo v zadnji vrstici po absolutni vrednosti najveje
negativno tevilo zj-cj zk-ck=max I(zj-cj )I za zj-cj < 0 temu tevilu ustreza vektor
pk, ki ga uvedemo v novo bazo.
7) Doloimo vektor pr, ki ga odstranimo iz baze. Vsako komponento vektorja p0 delimo z istoleno
komponento vektorja pk – pri tem upotevamo samo pozitivne komponente vektorja pk. Najmanji od
x
x
teh ulomkov : r = min i (ark>0) doloa vektor pr, ki ga odstranimo iz prvotne baze.
i
ark
aik
8) Vse koeficiente v tabeli transformiramo po transformacijskem zakonu: R'=SR
9) Po transformaciji dobimo novo mono reitev in njej ustrezno tabelo.
10) Ugotovimo, ali je mogoe novo mono reitev e izboljati. Izboljava je mona:
4
• e je v primeru min. namenske funkcije e kak koeficient v zadnji vrstici pozitiven
• e je v primeru max. namenske funkcije e kak koeficient v zadnji vrstici negativen
11) e je izboljava mona, iteracijo ponovimo, e pa izboljava ni mona, je dobljena mona reitev
optimalna.
20.
Interpretacija rezultatov linearnega programa (izpisa v POM-u)
prisojene cene …
21.
Primarni in dualni program (priredba in povezanost reitev)
kako so reitve povezane: min-max
Vsakemu linearnemu programu je mogoe prirediti drug linearen program. Oba programa sta tako
tesno povezana, da lahko izberemo optimalno mono reitev prvega br, ko poznamo optimalno
mono reitev drugega. Prvotni linearni program se imenuje primarni program, njemu prirejeni pa
dualni program. Programu na min torej priredimo program za max in obratno.
Primarni linearni program doloiti je treba vrednosti spremenljivk x1, x2…,xs, ki zadoajo pogojem
neengativnosti in linearnim neenabam, tako da ima namenska funkcija min.
Dualni program doloiti je treba vrednosti spremenljivk y1,y2,…,ym, ki zadoajo pogojem
nenegativnosti in linearnim neenabam, tako da ima namenska funkcija max.
e ima eden od obeh linearnih programov konno optimalno mono reitev, jo ima tudi drugi in
ekstremni vrednosti obeh namenskih funkcij sta enaki. e pa eden od programov nima konne
optimalne reitve, je drugi protisloven in nima nobene mone reitve.
22.
Normativna teorija odloanja, opisna teorija odloanja
Normativna teorija odloanja govori o tem, kako naj racionalni odloevalec oceni zaelenost posledic
preko zastavljenih ciljev in o tem, za katero izmed zastavljenih alternativ se odloiti, potem ko je e
opredelil svoj model odloanja.
Opisna teorija odloanja pa ugotavlja, kako se ljudje v resnici odloajo. Izkae se, da je odloanje
posameznikov pogosto precej drugano od 'racionalnega' (tistega, ki ga dani situaciji priporoa
normativna teorija). Med drugim se ukvarja z vpraanji, v kolikni meri je treba te razlike pripisati
dejavnikom, ki jih model ni zajel in v kolikni meri iracionalnosti odloevalcev.
23.
Stroga preferenna relacija in njene lastnosti
Odloevalec zna svoje elje izraziti s pomojo neke relacije.
ARB A>B (kadar je za odloevalca alternativa A bolj zaelena kot alternativa B).
Preferenna relacija ima naslednje lastnosti:
• Aksiom A asimetrinost: e za alternativi A in B velja A>B, potem ni res, da je B>A
• Aksiom T tranzitivnost: e za alternative A, B in C velja A>B in B>C, potem velja tudi
A>C
Strogo-delna urejenost relacija na neki mnoici, ki je asimetrina in tranzitivna
24.
Indeferenna relacija in njene lastnosti
…relacija med A in B, kadar med njima ne velja niti A>B niti B>A; odloevalec se lahko odloi, da
toda zaveda se njune enakovrednosti. Na ta nain je indiferenca porojena iz stroge preferenne
relacije.
Lastnosti indirerenne relacije:
• Refleksivnost: za vsako alternativo A je A~A
• Simetrinost: e za alternativo A in B velja A~B, potem je tudi B~A
Radi bi, da bi bila tudi ta relacija tranzitivna, kar v splonem e ne sledi iz do sedaj privzetih
aksiomov.
Aksiom 1 tranzitivnost indiference: e za alternative A, B in C velja A~B in B~C, potem
velja tudi A~C.
Stroga preferenna relacija in iz nje porojena indiferenna relacija imata naslednje lastnosti:
•
5
I. e za neke alternative A, B in C velja A~B in B>C, potem velja tudi A>C.
II. e za neke alternative A, B in C velja A>B in B~C, potem velja tudi A>C.
e veljajo aksiomi A, T, I ekvivalenna relacija (ki je tudi indiferenna relacija). Vedno pa velja
ena relacija: ali B>A ali A>B ali A~B
25.
ibka preferenna relacija in lastnosti L1, L2, L3, L4
AB A je vsaj tako dober kot B; odnosno velja, da B ni bolji od A.
Poljubna 2 objekta sta primerljiva po tej relaciji stroga sovisnost/univerzalna primerljivost.
…ima naslednje lastnosti:
L1~ Univerzalna primerljivost: za poljubni alternativi A in B velja vsaj ena od mo
nosti AB ali BA
L2~ Tranzitivnost: e za neke alternative A, B in C velja AB in BC, potem velja tudi AC.
L3~ Konsistentnost indiference s ibko preferenco: za poljubni alternativi A in B velja A~B natanko
tedaj, kadar velja AB in BA.
L4~ Konsistentnost stroge preference s ibko preferenco: za poljubni alternativi A in B velja AB
natanko tedaj, kadar ni res, da je B>A.
e na neki mo
nosti obstaja relacija, ki je univerzalno primerljiva in tranzitivna, pravimo, da ta
relacija to mno
ic ibko ureja.
26.
Ordinalna vrednostna funkcija (opredelitev, obstoj in enolinost)
ibka preferenna relacija bo izra
ena na ekvivalenten nain s pomojo ordinalnih vrednostnih
funkcij, ki jih bomo vpeljali. Omejili se bomo le na primer, ko imamo konno mnogo alternativ.
Zgled 2.3.1: Direktor eli zaposliti praktikanta. Izbira med A, B, C in D. AD, DB, AB, AC, AD,
CB, CD
Asimetrinost je vidna v tabeli (glede na diagonalo).
Tranzitivnost: s permutacijo elementov mno
ice dose
emo, da so krogci pod diagonalno, kri
ci pa nad
njo.
kandidati so razvreni v 3 razrede: A; C in B,D. Indiferenni razredi {A}, {C}, {B,D}
Lastnosti indiferenni razredi imajo naslednje lastnosti:
• Za poljubni 2 alternativi A in B velja A~B natanko tedaj, kadar je I(A)=I(B)
• Za poljubni 2 alternativi A in B je bodisi I(A)I(B)=0 bodisi I(A)=I(B)
• e za neki alternativi A in B velja A>B in je CI(A) ter DI(B) potem je tudi C>B
Mno
ica alternativ razpade an paroma disjunktne indiferenne razrede, med katerimi obstaja relacija
stroge preference >, ki jo simbolino zapiemo I(A)>I(B).
Realna funkcija r je ordinalna vrednostna funkcija, ki se ujema s ibko preferenno relacijo Z, e zanjo
velja r(A)v(B) natanko tedaj, ko velja AB
V zgledu smo dobili 3 indif. razrede, ki so opisani na naslednji nain {A}>{C}>{B,D}. Podobno
lahko definiramo indif. razrede vsake ibke preferenne relacije, kar bomo storoili s pomojo
ordinalne vrednostne funkcije.
Imejmo neko realno funkcijo v definiramo na alternativah. Zanjo reemo, da je ordinalna vrednostna
funkcija, ki se ujema s ibko preferenno relacijo Z, e zanjo velja: v(A)v(B) natanko takrat, ko je
AB. Predstavitev ibke preferenne relacije z ordinalno vrednostno funkcijo ima praktine prednosti,
saj so nam realna tevila zelo blizu. Ima pa tudi konceptualne prednosti, saj je celotna relacija
predstavljena s konno mnogo tevili.
Pojem ordinalna pomeni, da je pomembno le to, katera vrednost je veja in katera manja, ne smemo
pa jih setevati, raunati,…
27.
Intervalna vrednostna funkcija (aksioma U1 in U2)
6
Preferen
ne relacije povedo le katera alternativa je bolj zaelena, ne pa v kakni meri. Za izmero tega
vpeljemo pojem zamenjave. (AB) pomeni, da alternativo B zamenjamo z A. Poleg ibke preference
in alternativah vpeljemo e ibko preferenco na zamenjavah. Takrat velja (AB)z(CD), da je
zamenjava B z A odlo
evalcu vsaj tako ve
kot zamenjava D s C.
Dobro je imeti vrednosti funkcije v, ki se ujema z obema relacijama.
Aksiom U1: ujemanje z relacijo na alternativah. Za poljubni alternativi A in B velja AB
natanko takrat, ko v(A)v(B)
Aksiom U2: ujemanje z relacijo na zamenjavah. Za poljubne alter. A, B, C, D naj velja
(AB) z(CD) natanko takrat, ko velja v(A)-v(B)v(C)-v(D)
Realno funkcijo na alternativah, ki izpolnjuje aksiom U1 samo poimenovali ordinalna vrednostna
funkcija. Kadar funkcija v izpolnjuje oba aksioma U1 in U2, jo imenujemo intervalna vrednostna
funkcija.
28.
Zadostni pogoji za obstoj intervalne vrednostne funkcije (P1, P2, P3, P4, P5, R1, R2)
P1: relaciji na alternativah in z na zamenjavah sta univerzalno primerljivi in tranzitivni, zato
pravimo, da sta ibki preferen
ni relaciji na alternativah oz na zamenjavah.
P2: za poljubni alternativi A in B velja AB natanko tedaj, ko velja (AB) z (CD)
P3: za poljubne alternative A, B, C, D velja (AB) z (CD) natanko tedaj, ko velja
(DC) z (BA)
P4: za poljubne alt. A, B, C, D, E, F iz dejstva, da je (AB) z (DE) in (BC) z (EF) SLEDI,
da je (AC) z (DF).
P5: za poljubno alt. B v standardnem zaporedju velja, da obstaja kve
jemu kon
no mnogo lenov Ak
z lastnostjo BzAk
Pogoja reljivosti:
R1: za poljubne alt. B, C, D obstaja taka alt. A, da velja (AB) ~z (CD)
R2: za poljubni alt. A, C obstaja taka alt. B, da velja (AB) ~z (BC)
e ibki preferen
ni relaciji zado
ata zadostnim pogojem od P1 do P5 in pogojema reljivosti R1,
R2, tedaj obstaja intervalna vrednostna funkcija, ki se z njima ujema.
29.
Pozitivna afina transformacija intervalne vrednostne funkcije
Funkcije oblike f ( x) = x + pri > 0 imenujemo pozitivna afina transformacija. e sta poleg
zadostnih pogojev od P1 do P5 izpolnjena e pogoja reljivosti R1 in R2, potem je intervalna
vrednostna funkcija enoli
na do pozitivne afine transformacije. Pravimo, da so pozitivne afine
transformacije dopustne transformacije intervalnih vrednostnih funkcij.
30.
Tabela odloanja
…je na
in shemati
nega prikazovanja rezultatov predhodne analize odlo
anja.
Vse dejavnike, ki vplivajo na opazovani pojav, razdelimo na 2 skupini:
(1) dejavniki, na katere lahko odlo
evalec vpliva. Med te dejavnike opredelimo alternative/izbire.
(2) v (2) pa so zunanji dejavniki (stanja narave), na katere ne moremo vplivati, imajo pa posledice na
rezultat njegovih odlo
itev. Ti dejavniki pa dolo
ajo stanja.
Alternative morajo biti opredeljene tako, da so izbire lahko le izklju
ujo
e in vseobsegajo
e (ni
alternativ, ki ne bi bile vklju
ene v model).
Pri dolo
itvi stanj pa morajo biti upotevani vsi tisti dejavniki opazovanega problema odlo
anja, na
katere odlo
evalec nima vpliva. Stanja morajo biti dolo
ena tako, da se zgodi natanko eno stanje.
Stanje, ki se v resnici zgodi, imenujemo resni
no stanje. V teoriji verjetnosti re
emo, da tvorita
mnoica alternativ kot mnoica stanj popolni sistem dogodkov.
V tabeli odlo
anja so alternative/izbire vrstice tabele; stanja pa so stolpci. Za vsako alternativo in
vsako stanje vpiemo v tabelo posledico te alternative v tem stanju.
Vijposledice alternative Ai, ko se zgodi Sj, za i=1,2,…,m in j=1,2,…,n (predpostavljamo, da so
tevila intervalne vrednostne funkcije. Posledice so odvisne od sprejetih odlo
itev in stanja, ki
dejansko nastopi. Izkaejo se lahko tevilsko ali opisno.
7
31.
Odloanje v gotovosti, odloanje s tveganjem, odloanje v popolni negotovosti
Kadar je stanje eno (n=1), je odloanje bolj enostavno, kot v primeru n>1, saj odloevalec tono
ve posledice odloitve. odloanje v gotovosti.
V splonem je stanj ve in tvorijo popoln sistem dogodkov. V primeru, da je odloevalec pozna
verjetnost stanj (P(sj)), pravimo, da gre za odloanje s tveganjem. Ker menimo, da so posledice
odloitev izraene z vrednostmi, dobljenimi s pomojo intervalne vrednostne funkcije, lahko
n
izraunamo priakovano vrednost i-te alternative Ai = Vij P( s j ) .
j =1
Obiajno je v tem primeru vredn. funk. Neka uporabnostna funkcija (priakovana vrednost je
priakovana uporabnost). V tem primeru se odloimo za tisto alternativo, pri kateri je ta priakovana
uporabnost najveja.
Najteji pa so problemi odloanja v popolni negotovosti. V tem primeru je stanj ve in o tem,
katero stanje se bo uresniilo, nimamo nobenih informacij (poznamo 4 kriterije za odloanje):
32.
Waldov kriterij maksimalno minimalnega vraila
Poiemo v vsaki vrstici tabele odloanja (za vsako alternativo) element z najmanjo vrednostjo
(vrailom). Potem pa se odloimo za tisto vrstico/alternativo, pri kateri je ta element najveji. To je
najveje izmed najmanjih vrail oz maksimalno minimalno vrailo. Stopnja varnosti alternative Ai.:
pesimistien (upoteva le, kar je slabega)
S i = min Vij S k = max S i
j =1,..., m
i =1,..., m
33.
Hurwiczev kriterij (krit. S Hurwiczovim optimistino pesimistinim indeksom)
Minimizirati najvejo izgubo je preve pesimistino, max najveji dobiek pa je preve optimistino.
Odloevalec izbere svoj optimalni pesimistini indeks [0,1] , s katerim se bo postavil nekam med
oba ekstrema. e je Oi najveji, Si pa najmanji element i-te vrstice tabele odloanja, potem
odloevalec po H kriteriju maksimizira S i + (1 )Oi po vseh i (alternativah).
Stopnja optimizma alternativ Ai: Oi = max Vij . Pri danem indeksu bo po H izbrana alternativa Ai,
j =1,..., n
pri katerem je S K + (1 )Ok = max[S i + (1 )Oi ] .
i =1,..., m
H kriterij ima prednost pred W, da lahko pri njegovi uporabi s spreminjanjem optimistino
pesimisstinega indeksa vplivali na to, v koliki meri je optimistien oz pesimistien.
34.
Savagev kriterij minimalno maksimalnega obalovanja
Vsaki tabeli odloanja priredimo tabelo obalovanj po pravilu, da vsak 'dobiek' v nekem okencu
prvotne tabele odloanja odtejemo od najvejega 'dobika' v istem stolpcu. Tako dobljeno tevilo
pomeni, koliko bi izgubili, e bi se odloili za alternativo, ki jo doloa ta vrstica in bi se zgodilo
stanje, ki ga doloa ta stolpec, v primerjavi z najvejim monim dobikom istega stanja. Obalovali
bomo torej zamujeno prilonost (razlika med najvejim monim dobikom v tem stanju in naim
dejanskim dobikom). Wi = max Vij najveja izmed vrednosti stanja Sj. Najveje obalovanje:
i =1,..., m
i = max rij izberemo alternativo Ak, pri kateri k = min i
j =1,..., n
i =1,..., m
35.
Laplaceov kriterij enakega verjetja
Izraunamo povpreje vsake vrstice tabele odloanja, potem pa se odloimo za vrstico/alternativo, pri
kateri je to povpreje max. To je verjetno najstareji kriterij odloanja, zasnovan na predpostavki, da
je to, da o stanju niesar ne vemo, enakovredno s tem, da so vsa stanja enako verjetna. Kriterij:
1 n
t i = Vij izberemo alternativo Ai, kjer je t , = max t i
i =1,..., m
n j =1
36.
Aksiomi racionalnega odloanja, lastnosti tirih kriterijev
8
Lastnosti, za katere elimo, da jih izpolnjujejo kriterij odloanja ~ aksiomi racionalnega odloanja:
1) Razvrstitev alternativ: kriterij razvrsti alternative od najbolj do najmanj zaelene, pri emer
dopua monost, da je ve alternativ razvrenih na isto mesto.
2) Neodvisnost od tabele: e stanja ali alt. vpiemo v tabelo v kakem drugem vrstnem redu, potem
mora dati kriterij smiselno isti rezultat.
3) Neodvisnost od vrednostne lestvice: e vsem vrednostim v tabeli pritejemo isto konstanto ali jih
pomnoimo z isto pozitivno konstanto, potem mora dati kriterij iste rezultate
4) Stroga dominantnost: e je pri dveh alt./vrsticah tabele vrednost v eni vrstici veja od vrednosti v
drugi in v vseh stolpcih hkrati, potem mora kriterij razvrstiti prvo od teh dveh alternativ pred drugo.
5) Neodvisnost od irelavantnih alternativ: dve tabeli odloanja se razlikujeta le po tem, da je v drugi
ena alternativa ve kot v prvi. Tedaj mora kriterij odloanja rangirati v obeh primerih vse ostale
alternative enako.
6) Neodvisnost od pritevanja konstante k stolpcu: e k vsem vrednostim nekega stolpca tabele
odloanja pritejemo isto konstanto, potem mora kriterij rangirati alt. enako kot prej.
7) !!! Neodvisnost od permutacije vrstice: e so v neki tabeli v 2 vrsticah iste vrednosti, eprav v
prenesenem/permutiranem vrstnem redu, mora kriterij odloanja obe vrstici rangirati enako.
Neodvisnost od ponovitve stolpca: e v neki tabeli enega od stolpcev ponovimo, mora kriterij vse alt.
rangirati enako kot prej.
Prvih 6 lastnosti je primernih za vsako odloitveno pravilo, ne glede ali se uporablja v popolni
negotovosti ali ne. 7 in 8 predstavljata poizkus karateriziranja okoliin popolne negotovosti.
Vsi 4 kriteriji zadoajo prvim 4 aksiomom.Vendar Savagev ne izpolnjuje 5, 7; Hurwiczev ne 6;
Waldov ne 6; in Laplacev ne 8
37.
Ali obstaja kriterij odloanja v popolni negotovosti, ki zadoa vsem 8 aksiomom
racionalnega odloanja? (izrek 3.4.1) ne
Izrek 3.4.1: V popolni negotovosti ne obstaja krit., ki bi zadoal vsem 8 aksiomom rac. odloanja. Ta
rezultat nas vzpodbudi k premisleku o pravilnosti privzetka vseh 8 lastnosti/aksiomov. Tudi po
ponovnem premisleku prvi 4 aksiomi niso vpraljivi. ele pri 5. se prvi pojavijo dvomi
38. ENOSTAVNA LOTERIJA, SESTAVLJENA LOTERIJA, POMONI EKSPERIMENT:
Vpeljimo pojem loterije (v ojem pomenu besede). To bo vsaka porazdelitev verjetnosti po konno
mnogo zadetkih. Mnoico vseh zadetkov bomo oznaili z X = {x1, x2, . . ., xn}. Tipino loterijo lahko
predstavimo z zapisom l = <p1, x1; p2, x2; . . . ; pn, xn >, kjer je 0 <= pi <=1 verjetnost za zadetek xi
za i =1, 2, . . ., n, torej je vsota vseh p-jev enaka 1. Fiksirajmo mnoico zadetkov X in si oglejmo vse
loterije s temi zadetki. Loterijo na teh zadetkih, kot smo jo opredelili v ojem pomenu te besede,
poimenujemo tudi enostavna loterija.
Sestavljene loterije so loterije oblike <q1, l1; q2, l2; . . . ; qm, lm> kjer je qi verjetnost za zadetek li, ki
pomeni vstop v loterijo li za i=1,2, . . . , m. Seveda je spet 0 <= qi <=1 za i =1, 2, . . ., m in vsota vseh
q-jev je enaka 1.
Tvegana alternativa. Z verjetnostjo p se zgodi posledica x1 (najbolja monost), z verjetnostjo 1- p
pa posledica xn (najslaba monost). Tu opisani tvegani alternativi pravimo pomoni eksperiment in
jo oznaimo z x1 p xn.
39. Uporabnostna funkcija na mnoici L (aksioma UF1, UF2)
Aksiom UF1. (Ujemanje z relacijo na loterijah) Za poljubni l1 in l2 iz L velja l1>=l2 natanko tedaj,
kadar je u(l1)>=u(l2).
Aksiom UF2. (Formula o matematinem upanju) Za poljubno loterijo l = <p1, l1; p2, l2; . . . ; pm,
lm> velja
m
u(l)= p i u (l i ) .
i =1
9
40. Zadostni in potrebni pogoji za obstoj uporabnostne funkcije na mnoici L (VNM1, VNM2,
VNM3, R, N)
Aksiom VNM1. (Preference na loterijah) Mnoico L ureja neka ibka preferenna relacija.
Aksiom VNM2. (Neodvisnost loterij) e za l1 L in l2 L velja l1 < l2, potem velja l1 q l3 < l2 q
l3 za vsako tevilo q strogo med 0 in 1 neodvisno od izbire l3 L.
Aksiom VNM3. (Arhimedska lastnost na loterijah) e za l1, l2, l3 L velja l1<l2 in l2 < l3, potem
obstajata taki tevili p in q strogo med 0 in 1, da je l1 p l3 < l2 in l2 < l1 q l3 .
Aksiom R. (Redukcija loterij) Izidi loterije l = <q1, l1; q2, l2; . . . ; qs, ls> naj predstavljajo vstope v
loterije, ki so enakovredne naslednjim enostavnim loterijam lj = <pj1, x1; pj2, x2; . . . ; pjn, xn >, za j
= 1, 2,...,s. Naj za enostavno loterijo l' = <p1, x1; p2, x2; . . . ; pn, xn > velja pi = q1 p1i + q2 p2i + +
qs psi za i=1,2,...,n. Tedaj mora biti l ~ l'.
Aksiom N. (Neindiferentnost) Med zadetki obstajata taka zadetka xi in xj, da je xi < xj.
41. Strateko ekvivalentni uporabnostni funkciji
Naj bosta u in v uporabnostni funkciji na mnoici L. Zanju reemo, da sta strateko ekvivalentni,
kadar predstavljata isto preferenno relacijo. To pomeni, za poljubni loteriji l, l' L velja, da je u(l)
>= u(l') natanko tedaj, kadar je v(l) >= v(l').
Pod pogoji VNM1, VNM2, VNM3, R in N sta dve uporabnostni funkciji na L strateko ekvivalentni
natanko tedaj, kadar obstaja med njima pozitivna afina transformacija.
50. Uporabnostna funkcija za dve vzajemno uporabnostno neodvisna kriterija
(izrek 5.1.4.).
Naj bosta X in Y vzajemno uporabnostno neodvisna in naj bo u(x, y) uporabnostna funkcija na X Y .
Tedaj za poljubna x0 X in y0 Y obstaja taka konstanta k, da velja
u(x, y) = u(x0, y0) + (x) + (y) + k (x) (y)
(5.1.1)
kjer je (x) = u(x, y0) u(x0, y0) in (y) = u(x0, y) u(x0, y0).
Funkcija (x) je robna uporabnostna funkcija kriterija X, saj je strateko ekvivalentna funkciji u(x, y0)
. Funkcija (y) je strateko ekvivalentna funkciji u(x0, y), torej je robna uporabnostna funkcija
kriterija Y.
Zapiimo zdaj izraz (5.1.1.) e nekoliko drugae. Odtejmo u(x0, y0) na obeh straneh, pomnoimo s
konstanto k in pritejmo 1, da dobimo
1+ k (u(x, y) u(x0, y0)) = (1 + k (x)) (1 + k (y)).
Loimo tri primere:
1. e je konstanta k strogo pozitivna, je
w(x, y) = 1 + k (u(x, y) u(x0, y0))
k funkciji u(x, y) strateko ekvivalentna uporabnostna funkcija, funkcija w1(x) =1 + k(x) je robna
uporabnostna funkcija kriterija X, funkcija w2(y) = 1 + k(y) je robna uporabnostna funkcija kriterija
Y in velja
w(x, y) = w1(x) w2(y).
2. e je konstanta k strogo negativna, je uporabnostna funkcija
w(x, y) = (1 + k (u(x, y) u(x0, y0)))
strateko ekvivalentna k funkciji u(x,y), funkcija w1(x) = (1 + k (x)) je robna uporabnostna funkcija
kriterija X, funkcija w2(y) = (1 + k(y)) je robna uporabnostna funkcija kriterija Y in velja
w(x, y) = w1(x) w2(y).
3. e pa je konstanta k enaka 0, je funkcija
w(x, y) = u(x, y) u(x0, y0)
10
strateko ekvivalentna k funkciji u(x,y), funkcija w1(x) = (x) je robna uporabnostna funkcija kriterija
X, funkcija w2(y) = (y) je robna uporabnostna funkcija kriterija Y in velja
w(x, y) = w1(x) + w2(y).
V prvih dveh primerih reemo, da je uporabnostna funkcija multiplikativna, v tretjem pa, da je
aditivna. V splonem pa lahko reemo, da je uporabnostna funkcija po dveh vzajemno neodvisnih
kriterijih vselej bodisi multiplikativna bodisi aditivna.
51. Linearna vrednostna funkcija. Opredelitev in pogoji!
Za vrednostno funkcijo v, definirano na P (pravokotnik v ravnini), pravimo, da je linearna vrednostna
funkcija, e je oblike
v(x) = w1 x1 + w2 x2 + … + wq xq,
kjer so w1, w2, …, wq nenielne konstante, ki jim reemo utei. Ta funkcija opredeljuje neko
preferenno relacijo na P. V tem primeru so kriteriji vzajemno preferenno neodvisni in so vse robne
preferenne urejenosti spet podane z linearnimi vrednostnimi funkcijami.
Rekli bomo, da se i-ti in j-ti kriterij konstantno relativno kompenzirata, e obstaja taka konstanta ij,
da velja
(x1, …, xi, …, xj, …, xq ) (x1, …, xi + ij k, …, xj k, …, xq ) ,
za vse x P in za vsak k. To pomeni: e se vrednost j-tega kriterija zmanja za tevilo k, se to
zmanjanje lahko kompenzira s poveanjem vrednosti i-tega kriterija za tevilo ijk. tevilu ij
reemo kompenzacijski faktor.
Kompenzacijski faktorji v linearni vrednostni funkciji so
ij =
wj
wi
.
11
Zanje velja:
1. Za vse i, j je ij ji = 1.
2. Za vse i, j, l je il = ij jl .
e se poljubna dva kriterija konstantno relativno kompenzirata, potem so indiferenne krivulje v
dveh razsenostih vzporedne premice, v treh pa vzporedne ravnine.
Eksistenco linearne vrednostne funkcije zagotavljajo naslednji trije pogoji:
Aksiom LIN1. Mnoico alternativ P = q ureja ibka preferenna relacija f .
~
Aksiom LIN2. Poljubna dva kriterija se konstantno relativno kompenzirata.
Aksiom LIN3. (Monotonost) Obstaja taka alternativa x f (0, 0, …, 0), da za vsak
~
y P in vsak > 0 velja y + x f y.
~
Izrek 5.2.1. Na mnoici alternativ P = q obstaja linearna vrednostna funkcija usklajena s
preferenno relacijo f natanko tedaj, kadar veljajo aksiomi LIN1, LIN2 in LIN3.
~
52. Enolinost linearne vrednostne funkcije in standardna oblika.
Linearne vrednostne funkcije so enoline do podobnostnih transformacij. Tako pravimo vsaki realni
funkciji oblike (x) = x, kjer je > 0.
Trditev 5.2.2. Dve linearni vrednostni funkciji
q
v(x) =
w x
i i
in
v(x) =
q
wx
i i
i =1
i =1
se ujemata z isto preferenno relacijo
natanko takrat, kadar
obstaja tak > 0, da je v(x)= v(x),
oziroma ekvivalentno, kadar je wi = wi za vse i=1, 2, … , q.
Z izbiro tevila lahko doseemo, da ima eden od kriterijev, recimo prvi, ute +1 ali 1. S tem
pogojem je linearna vrednostna funkcija povsem enolino doloena, zato v tem primeru pravimo, da
ima standardno obliko.
53. Skupinsko odloanje in drubena izbira.
Gre za to, kako lahko v neki skupini ljudi iz hotenja posameznikov pridemo po im bolj pravini poti
do odloitve cele skupine.
•
Skupine navadno odloajo preko neke vrste glasovanja. Med modeli skupinskega odloanja je
najpogosteje uporabljano naelo enostavne veine. Po tem naelu pogosto odloajo poslovni
odbori velikih podjetij ali drutev, uporabljajo ga v parlamentih in e marsikje. Delovanje
najlaje razloimo na preprostem primeru.
Zaradi enostavnosti izraanja vpeljimo nekaj pojmov. Vsem posameznikom v skupini, ki o
em odloa, recimo volivci.
•
Druga monost je, da za poljubni dve alternativi obvelja relacija za skupino natanko tedaj,
kadar glasuje za to relacijo ve lanov skupine, kot za nasprotno. Kadar obstaja alternativa, ki
jo v primerjavi z vsako drugo alternativo ocenjuje veina volivcev kot boljo, ji reemo
Condorcetov zmagovalec. Ta ne obstaja vselej.
•
Condorcetov paradoks je verjetno eden od glavnih razlogov, zakaj pojma enostavne veine
navadno ne posploujemo na ta nain. Eden od nainov, ki se uporablja, je glasovanje po
parih z izloanjem. To pomeni, da najprej izberemo dve alternativi ter glasujemo med njima,
nato pa zavremo tisto, ki je dobila manj glasov, ''zmagovalko'' primerjamo s tretjo itd.
12
•
V politi
nem odlo
anju so zelo popularne dvokrone volitve. V prvem krogu volitev zmaga
alternativa, ki je najbolj ve
ve
ini, torej ve
kot polovici volivcev. e take alternative ni, se v
drugem krogu pomerita le tisti dve alternativi, ki sta dobili najve
glasov v prvem krogu. Tudi
ta metoda ni brez pomanjkljivosti
•
Metoda vrstinih vsot: Bordovo tetje Privzamemo, da noben volivec ni indiferenten med
nobenima dvema alternativama. Ideja je v tem, da vsak volivec vse alternative, med katerimi
se odlo
a, uredi povrsti, pravimo, da jih rangira. Vsak rang, to je zaporedno tevilo alternative
v tej ureditvi od najbolj do najmanj zaelene, pa da alternativi dolo
eno tevilo to
k. Ti rangi
se potem setejejo in zmaga tista alternativa, ki ima najmanjo vsoto to
k. Eden od glavnih
problemov tega pravila je, da je njegov rezultat odvisen od izbora alternativ, ki smo jih vzeli v
obzir.
•
Poskusi izboljanja volitvenih postopkov: Nansenov in Coombov algoritem V obzir vzamemo
najprej vse mone alternative. Volivci jim dolo
ijo range, nato pa v Nansenovem algoritmu
izlo
imo tiste alternative, ki imajo najve
jo vsoto rangov, v Coombovem pa tiste, ki jih najve
volivcev uvrsti na zadnje mesto. Zdaj ponovimo ta postopek na preostalih alternativah. Zmaga
tista alternativa, ki ostane neizlo
ena. Potem ko pridemo do "zmagovite" alternative, celotni
postopek ponovimo na preostalih. Tako dobimo drugo alternativo, itd.
58.Sr funkcije veta: e pri neki alternativi B obstaja neka potencialna koalicija K volivcev, z mo
jo
k in neka podmnoica alternativi A', z mo
jo –w(k), za katero velja, da je za vsako alternativo AA'
in za vsakega volivca iK izpolnjeno a>iB, potem ima ta potencialna koalicija mo
veta, s katero
lahko izlo
i vsako alternativo, ki ni A', med drugi tudi alternativo B. Vse tiste alternative za katere
taka potencialna koalicija in taka druina alternativ ne obstajata pa uvrstimo v sr funkcije veta. Za
neko funkcijo ne vemo ali ima neprazno sr, za proporcionalno funkcijo veta pase izkae, da njena
sr vselej neprazna. Sr je neprazna natanko tedaj, kadar je navzgor omejena s proporcionalno
funkcijo veta – le-ta je torej tudi optimalna funkcija veta, saj daje vsaki koaliciji najve
je mono t.
Pravic do veta, ki nas e zmerom privede do neprazne mnoice alternativ, za katere veto ni bil
uporabljen.
59. in 6o. Igra: model neke konfliktne situacije/dogajanja, v katerem so posledice odvisne od
odlo
itev udeleencev igre, lahko tudi zunanjih dejavnikov. Privzamemo da so igralci racionalni
odlo
evalci. Vsak ocenjuje posledice igre s svojo preferen
no relacijo. Strateka igra (mat model
konfliktne situacije). Mnoica igralcev N={1,2…n}, z mnoico alternativ 1 ozna
imo mnoico
alternativ i-tega igralca za iN. Ko igrallec iz mnoice alternativ izbere eno Ai nastane profil izbora
A=(A1,A2…An), oznaka A=(Ai)iN. Mnoica vseh profilov izbora je in je enaka kartezi
nemu
produktu (A1A2…An) mnoic alternativ posameznih igralcev. Igra je kon
ana, ko je mnoica
profilov izbora kon
ana. Za vsak profil izbora A pri poljubnem iN vpeljemo oznako Ai=(Aj)jN{i}. To je zoeni profil izbora (izpustimo alternativo Ai). Profil izbora A*, za katerega
velja ui(A*)>=ui(A*-i,B) za vse Bi in vsak iN, poimenujemo rvnoteni profil. Velja, da noben
igralec ne more samo z zamenjavo svojega izbora alternative spremeniti tako, da bi mu bila posledica
potem ve
.
Razlika med p. odlo
anja vs. Strateke igre: v p.o. je rezultat odvisen od odlo
eval
eve alternative in
morebitnih zunanjih dejavnikov, pri s.i. pa so posledice poleg obojega odvisne od odlo
itev vseh
drugih igralcev.
61. ={A1,…An} mnoica alternativ 1. igralca in ={B1,…Bn} mn. alternativ 2. igralca. Profili
izbora oz. posledice so dvojice (Ai,Bj) za i=1,2…m in j=1,2…n. Za vsako posledico poznamo
uporabnost posledice za prvega igralca u(Ai,Bj) in drugega –u(Ai,Bj). Uporabnosti zapiemo v
uporabnostno matriko:
13
U= napii na roko
Ker je za uporabnostno matriko igra natan
no dolo
ena, imenujemo kon
ne antagonisti
ne strateke
igre med dvema igralcema kar matrine igre.
Operacijske raziskava; odgovori na vpraanja 62 – 65.
62. Sedlo matrine igre, uporabnost matrine igre ali vrednost matrine igre.
Profil (A*, B*), pri katerem je
u ( A , B ) = max min u ( Ai , B j ) = min max u ( Ai , B j ) ,
Ai A B j B
B j B Ai A
to imenujemo sedlo matrine igre.
Primer: Matri
na igra je podana s pla
ilno matriko
2 1 5
2 6 1 .
3 5 4
V tej igri so dobi
ki prvega igralca hkrati izgube drugega igralca. Vsak od teh igralcev ima na izbiro
tri alternative. e na primer igralec 1 izbere svojo tretjo alternativo (tretjo vrstico) in igralec 2 izbere
svojo drugo alterantivo (drugi stolpec), pla
a drugi igralec prvemu 5 d.e. Uporabimo Waldov kriterij
za prvega igralca. Minimalna vrednost prve vrstice je 1, druge 1 in tretje 3. Najve
ja od teh vrednosti
je 3, doseena na se
i
u tretje vrstice s prvim stolpcem. Uporabimo Waldov kriterij e za drugega
igralca. Po stolpcih so najve
je vrednosti po vrsti 3, 6 in 5. Najmanja od teh vrednosti je 3, doseena
na se
i
u tretje vrstice s prvim stolpcem. To je torej primer igre s sedlom z vrednostjo igre 3. Z
izborom tretje vrstice si igralec 1 zagotovi, da bo dobil vsaj 3 d.e., z izborom prvega stolpca pa si
igralec 2 zagotovi, da ne bo izgubil ve
kot 3 d.e. V tej igri torej igralca zlahka najdeta optimalni na
in
igre, to je ravnoteni profil.
Kadar ima matri
na igra sedlo (A*,B*), imenujemo vrednost u(A*,B*) uporabnost matrine igre ali
vrednost matrine igre.
63. Izrek o minimaksu.
Pokazali smo, da je vsak ravnoteni profil matri
ne igre tudi njeno sedlo. Izkae se, da to velja tudi v
obratni smeri. Temu spoznanju pravimo izrek o minimaksu:
Izrek 2.1. Za matri
no igro velja:
1. e ima igra ravnoteni profil, potem je vsak njen ravnoteni profil tudi njeno sedlo.
2. e ima igra sedlo, potem je vsako njeno sedlo tudi njen ravnoteni profil.
64.Meana raziritev matrine igre.
Nova igra je v nekem smislu raziritev prvotne matri
ne igre. Prvotni alternativi prvega igralca AiA
ustreza med meanimi strategijami ''neprava'' porazdelitev, opredeljena s pi = 1 in pj = 0 za j i. Tem
strategijam pravimo iste strategije za razliko od ''resni
no'' meanih strategij. Analogno vpeljemo
pojem istih strategij drugega igralca. Tako smo mnoico alternativ A razirili do mnoice novih
alternativ prvega igralca P(A), mnoico B pa do mnoice P(B). Funkcijo u, ki je kot uporabnostna
funkcija prvega igralca definirana na A x B, smo razirili do funkcije u(p, q) = E(u | p,q), ki je
definirana na P(A)xP(B). Na istih strategijah se uporabnost profila izbora ujema z uporabnostjo
neposrednega izida. Nova strateka antagonisti
na igra je torej raziritev prvotne, zato ji pravimo
meana raziritev matrine igre.
14
65. Strateki ravnoteni profil, izrek 2.3. oz. 7.5.
Poljubni matrini igri smo priredili njeno meano raziritev. e ima ta meana raziritev ravnoteni
profil, ga imenujemo strateki ravnoteni profil matrine igre.
Izrek 2.3. Vsaka matrina igra ima strateki ravnoteni profil.
Dokaz.
Lema (pomoni izrek) 2.2.
1.
Vsaka linearna preslikava je hkrati konveksna in konkavna funkcija.
2.
Uporabnostna funkcija u(p, q) = pTU q je zvezna, kvazikonkavna in kvazikonveksna.
3.
Mnoica P(A) je neprazna, konveksna, zaprta in omejena podmnoica Ñm. Mnoica P(B) je
neprazna, konveksna, zaprta in omejena podmnoica Ñn.
Po tretji toki leme sta mnoici alternativ obeh igralcev v meani raziritvi matrine igre neprazni,
konveksni, zaprti in omejeni podmnoici Ñm oziroma Ñn. Po drugi toki leme je uporabnostna
funkcija prvega igralca u kvazikonkavna in zvezna. Uporabnostna funkcija drugega igralca je enaka -u
in je prav tako zvezna. Ker je po drugi toki leme funkcija u tudi kvazikonveksna, je funkcija -u
kvazikonkavna. Zato lahko uporabimo izrek 1.1, po katerem ima meana raziritev obravnavane igre
ravnoteni profil.
15