Rinnakkaisuus

Transcription

Rinnakkaisuus
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
Rinnakkainen ohjelmointi
Tässä osassa tutustutaan rinnakkaiseen ohjelmointiin. Aluksi käsitellään rinnakkaisen
ohjelmoinnin käsitteitä ja rinnakkaisuuden hallintamekanismeja yleisesti. Tämän
jälkeen perehdytään hieman Javan rinnakkaisuuden toteutukseen ja pintapuolisesti
C++-kielen nykystandardin rinnakkaisuusominaisuuksiin. Lopuksi tarkastellaan lyhyesti
rinnakkaisuuden toteutuksia muissa ohjelmointikielissä. Rinnakkaisuutta käsitellään
Maarit Harsun kirjassa [Har] luvussa 8 ja Sebestan [Seb] luvussa 13.
1. Yleistä rinnakkaisuudesta
Peräkkäinen ohjelma (sequential program) koostuu toisiaan seuraavista käskyistä,
joita suoritetaan peräkkäin, kunnes ohjelma päättyy. Peräkkäisellä ohjelmalla on selkeä
suorituspolku ja se on deterministinen, ts. samalla syötteellä ohjelma antaa aina saman
tuloksen. Rinnakkainen ohjelma (concurrent program, parallel program) sen sijaan
suorittaa kahta tai useampaa toimintaa yhtä aikaa. Rinnakkaisella ohjelmalla ei ole yhtä
suorituspolkua ja sen antama tulos voi riippua myös toimintojen suoritusjärjestyksestä.
Rinnakkainen ohjelma voidaan suorittaa



Antamalla yhden prosessorin huolehtia eri toiminnoista (multiprogramming).
Käyttöjärjestelmän on tuettava moniajoa.
Antamalla kukin tehtävä eri prosessorin (tai prosessoriytimen) suoritettavaksi
samassa koneessa (multiprocessing).
Hajauttamalla eri toiminnot toisiinsa kytkettyihin koneisiin (distributed
programming).
Kahdessa jälkimmäisessä tapauksessa on kysymys aidosta fyysisestä
rinnakkaisuudesta. Ensimmäisessä tapauksessa rinnakkaisuus on siinä mielessä harhaa,
että yksi prosessoriydin voi suorittaa vain yhden konekielisen käskyn kerrallaan.
Käyttöjärjestelmä voi kuitenkin huolehtia siitä, että kukin toiminto saa keskusyksiköltä
suoritusaikaa niin, että toiminnot suoritetaan rinnakkain. Tässä tapauksessa puhutaan
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
myös loogisesta rinnakkaisuudesta. Usein rinnakkaisuuden tarkastelu jaetaan
loogisesti neljään tasoon:
Komentotaso
Prosessorin konekielisiä käskyjä suoritetaan yhtä aikaa
Lausetaso
Ohjelmointikielen lauseita suoritetaan yhtä aikaa
Aliohjelmataso
Aliohjelmia suoritetaan yhtä aikaa
Ohjelmataso
Ohjelmia suoritetaan yhtä aikaa
Ensimmäisen ja viimeisen tason rinnakkaisuuteen ei liity ohjelmointikielten kysymyksiä,
joten tässä tarkastellaan kahta keskimmäistä tasoa.
2. Prosesseista ja säikeistä
Prosessi on käyttöjärjestelmän tapa ajaa useita ohjelmia rinnakkain yhdessä
prosessorissa - yleensä yhtä prosessia vastaa yksi suoritettava ohjelma.
Käyttöjärjestelmä takaa prosesseille jonkinasteisen riippumattomuuden muista
prosesseista. Turvasyistä prosessit eivät saa yleensä jakaa muistialuetta. Näin ollen
niiden välinen kommunikaatio pitää hoitaa muilla mekanismeilla.
Prosessin ominaisuudet riippuvat käyttöjärjestelmästä. Yleisimmin prosessien
suorittaminen perustuu aikajakoon: kukin prosessi keskeytetään aika ajoin ja toinen
prosessi päästetään suoritukseen. Prosessi voi elinkaarensa aikana olla seuraavissa
tiloissa:



Uusi (new) - prosessi on luotu.
Ajossa (runnning) - prosessin koodia suoritetaan.
Odotustilassa (waiting) - prosessin suoritus on estetty, koska se odottaa jotakin
tapahtumaa (IO - tapahtuma, signaali jne.).
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto


815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
Valmiustilassa (ready) - prosessi on valmiina suoritukseen, kun se saa aikaa
keskusyksiköltä.
Lopetettu (terminated) - prosessin suoritus on lopetettu.
Käyttöjärjestelmä huolehtii prosessien priorisoinnista, ts. siitä kuinka paljon prosessi
saa suoritusaikaa muihin prosesseihin verrattuna. Prosessin keskeyttäminen vaatii aina
sen keskeytyshetkisen tilan tallentamisen, jotta prosessi saataisiin uudelleen
asianmukaisesti suoritukseen. Prosessin ominaisuuksia (prosessin tila, CPU-rekisterien
arvot, muistinhallintatiedot jne.) säilytetään ns. prosessikontrollilohkossa (Process
Control Block, PCB), joka tallennetaan prosessin keskeytyessä. Näin ollen prosessien
rinnakkainen suorittaminen kuluttaa ylimääräisiä resursseja.
Prosessi on (erityisesti UNIXissa) "raskaansarjan" suoritusyksikkö. Yksittäinen ohjelma
saadaan kevyemmin rinnakkaiseksi jakamalla se säikeisiin. Säie on peräkkäisesti
toimiva käskyjono, joka toimii muista säikeistä riippumatta; säikeellä on oma
ohjelmalaskuri ja pino. Saman prosessin säikeet käyttävät kuitenkin tämän prosessin
muistialuetta ja käyttöjärjestelmän resursseja, ts. ne voivat käsitellä samoja tiedostoja
sekä oheislaitteita. Säikeille annetaan suoritusaikaa samaan tapaan kuin
prosesseillekin, paitsi että aikajako suoritetaan ohjelman saaman ajan puitteissa ja
säikeet priorisoidaan ohjelmallisesti. Säikeiden yhteydenpito voi tapahtua kuten
prosessienkin, mutta lisäksi niillä on yhteinen muistialue, jota voidaan käyttää
kommunikaatiossa. Säikeen luominen kuluttaa aikaa keskimäärin kolmasosan uuden
prosessin luomisesta.
Säikeiden luomiselle ja synkronoinnille käyttöjärjestelmätasolla on olemassa standardi
Pthread (POSIX : IEEE standardit, osa 1003.1). Standardissa kuvataan säikeen
käyttäytyminen, ei kuitenkaan itse toteutusta. Yleensä Pthread-toteutuksia on tehty
UNIX-järjestelmissä, Windows-ympäristössä ei tavallisesti tueta Pthread-standardia.
Huomaa, että jokainen ohjelma koostuu ainakin yhdestä säikeestä, kaikissa ohjelmissa
on pääohjelma, joka on säie.
Säie voi olemassaolonsa aikana olla viidessä eri tilassa:
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto





815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
Uusi (new) säie
o Säie on luotu, mutta ei vielä käynnistetty
Ajettava (runnable)
o Säie voi toimia, heti kun se saa keskusyksiköltä aikaa suorittaakseen
operaatioitansa
Ajossa (running)
o Keskusyksikkö suorittaa parhaillaan säiettä
Estetty (blocked)
o Säie voisi toimia, mutta jokin seikka estää sen
Kuollut (dead)
o Säikeen suoritus on päättynyt lopullisesti
Kun uusi säie luodaan, se pitää vielä käynnistää jollakin käskyllä. Tällöin se menee
ajettavaan tilaan. Ajettavat säikeet ovat joko toiminnassa tai jonossa odottamassa
keskusyksikköaikaa. Säie pysyy ajettavana, kunnes sen toiminta estetään tai se kuolee.
Estetty säie voi jälleen mennä ajettavaan tilaan, kun sen estävä seikka lakkaa
vaikuttamasta. Kuollutta säiettä ei sen sijaan voi enää herättää eloon.
Prosesseja ja säikeitä käyttöjärjestelmien kannalta käsitellään mm. teoksessa [Sil], luvut
4 ja 5.
Ohjelmointikieliin liittyvät kysymykset koskevat pääasiallisesti monisäikeisiä ohjelmia,
joten jatkossa tarkastellaan monisäieohjelmointia.
3. Rinnakkaisen ohjelman oikeellisuuskriteerit
Ohjelman kirjoittaminen rinnakkaiseksi tuo mukanaan monia etuja: ohjelman vasteajat
saadaan optimoitua, ohjelma voi suorittaa IO -toimintoja samaan aikaan laskennallisten
operaatioiden kanssa, ohjelma voi kommunikoida useiden muiden ohjelmien kanssa
jne. Rinnakkaisuus tuo myös mukanaan useita ongelmia, joita ei esiinny peräkkäisissä
ohjelmissa. Rinnakkaisen ohjelman oikeellisuuskriteerit voidaan jakaa kahteen
pääkategoriaan (ks. esimerkiksi [Lea] 1.3):
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto


815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
Turvallisuus (safety)
o Olioille ja muuttujille ei tapahdu mitään ei-toivottua
Eloisuus (liveness)
o Kaikki tarkoitetut toimenpiteet suoritetaan joskus
3.1. Turvallisuus
Rinnakkaisessa ohjelmoinnissa hyvin yksinkertaisetkin operaatiot voivat mennä vikaan
suoritusjärjestyksen muuttuessa. Oletetaan esimerkiksi, että kaksi säiettä S1 ja S2
suorittavat samalle kokonaislukumuuttujalle x operaation x = x+1. Toivottu lopputulos
on muuttujan x arvon kasvaminen kahdella. Kuitenkin tietokone suorittaa operaation x
= x+1 niin, että muuttujan arvo luetaan ensin muistipaikasta rekisteriin, rekisterin arvoa
kasvatetaan ja sitten uusi arvo kopioidaan rekisteristä muistipaikkaan. Näin ollen
operaatio ei ole atomaarinen. Jos säikeet S1 ja S2 suorittavat operaationsa peräkkäin,
saadaan haluttu lopputulos, mutta koska S1 ja S2 toimivat toisistaan riippumatta, voi
suoritusjärjestys olla esimerkiksi seuraava:
S1
S2
S1
S1
S2
S2
:
:
:
:
:
:
lue x
lue x
x = x+1
kirjoita x
x = x+1
kirjoita x
Operaation tuloksena muuttuja x kasvaa vain yhdellä, mikä ei ole toivottu lopputulos.
Vastaavalla tavalla metodi voi palauttaa ennalta-arvaamattomia arvoja jos kaksi säiettä
kutsuu sitä rinnakkain. Metodia, joka toimii millä tahansa kutsujärjestyksellä oikein,
sanotaan säieturvalliseksi (thread safe).
Edelleen muuttujan samanaikainen kirjoittaminen ja lukeminen voi tuottaa kummallisia
arvoja, samoin kuin kahden säikeen yhtäaikainen kirjoittaminen samaan muuttujaan.
Tällaisia virhetilanteita sanotaan Luku/Kirjoituskonflikteiksi tai
Kirjoitus/Kirjoituskonflikteiksi. Edellä mainituista virhetilanteista voidaan käyttää
yleisnimitystä kilpailutilanne (englanninkielisissä lähteissä race condition).
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
3.2. Eloisuus
Turvallisen, ts. konflikteista vapaan, ohjelman voi kirjoittaa käyttämällä ainoastaan yhtä
säiettä. Tällä tavalla menetetään kuitenkin rinnakkaisuuden edut. Näin ollen
turvallisuus ja eloisuus ovat ohjelman suunnittelussa jossain määrin vastakkaisissa
vaakakupeissa. Eloisassa ohjelmassa kaikki aiotut operaatiot suoritetaan joskus;
huomaa että mitään aikarajaa ei kuitenkaan aseteta. Reaaliaikaisessa ohjelmoinnissa
on yleensä asetettu maksimiaikoja määrättyjen operaatioiden kestolle.
Yleisimmin operaatio jää suorittamatta, koska sen säie odottaa jonkin resurssin
vapautumista. Tällaisia tapauksia voivat olla:




toinen säie on lukinnut metodin, jota yritetään suorittaa,
metodi lukkiutuu odottaen toisen säikeen suorittamaa tapahtumaa,
metodi odottaa IO -toimintoa (toisesta prosessista tai laitteesta),
jotkin toiset säikeet tai ohjelmat käyttävät kaikki keskusyksikköresurssit.
Lisäksi operaatio saattaa jäädä suorittamatta jonkin ajonaikaisen virheen tai
poikkeuksen takia.
Listassa mainituista ongelmista selvitään yleensä yrittämällä suorittaa operaatio,
kunnes se onnistuu. Joskus kuitenkin ohjelma voi ajautua tilaan, jossa operaation
suoritus on mahdoton pysyvästi. Tällainen tilanne voi olla esimerkiksi


Lukkiutuminen (deadlock)
o Säie S1 on lukinnut olion X ja yrittää lukita oliota Y; samanaikaisesti säie S2
on lukinnut olion Y ja yrittää lukita oliota X. Tällöin kumpikaan säie ei
pääse etenemään. Tämä voi tapahtua myös useammalle säikeelle
syklisesti.
Nälkiintyminen (starvation)
o Säie ei saa lainkaan keskusyksiköltä ajoaikaa (voi johtua useista syistä).
Eloisuuteen liittyy läheisesti suorituskyky, jota voidaan mitata erilaisin kriteerein.
Vaikka tarkkoja aikarajoja ohjelman suorittamille operaatioille ei asetettaisikaan, on
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
selvää, että lähes jokaisen ohjelman on noudatettava jonkinlaisia
suorituskykykriteerejä. Tässä ei kuitenkaan tarkemmin paneuduta suorituskyvyn
mittareihin.
4. Synkronointi
Ohjelman oikeellisuuden varmistamiseksi säikeiden on yleensä jaksotettava
toimintansa niin, että ongelmatapauksia ei ilmene. Tätä sanotaan säkeiden
synkronoinniksi (synchronization), joka voi ilmetä kilpailun synkronointina
(competition synchronization) ja yhteistoiminnan synkronointina (cooperation
synchronization). Kilpailun synkronointia tarvitaan, kun kaksi säiettä yrittää toisistaan
riippumatta käyttää jotakin resurssia ja on vaara, että tästä aiheutuu resurssin tilan
rikkoutuminen. Kilpailun synkronointi toteutetaan yleensä siten, että säie pyytää
joltakin synkronointioliolta resurssin käyttöoikeutta ja vapauttaa resurssin jälleen
muiden säikeiden käyttöön lopetettuaan operaationsa. Yhteistoiminnan synkronointia
taas tarvitaan, kun jonkin säikeen A operaation suorittaminen riippuu toisen säikeen B
toiminnasta, jolloin säie A joutuu odottamaan, kunnes säie B saa suoritettua
operaationsa. Käytännön ohjelmissa tarvitaan yleensä molempia synkronoinnin lajeja,
mutta useammin kilpailun synkronointia.
Synkronoinnin onnistuminen taataan yleensä jollakin rakenteellisella mekanismilla;
tyypillisiä rakenteita ovat semaforit ja monitorit. Lisäksi viestinvälitystä (message
passing) käytetään synkronoinnin toteuttamisessa. Viestinvälitystä käytetään
synkronoinnin perusmekanismina Ada-kielessä, jossa rinnakkaisia ohjelman osia
kutsutaan tehtäviksi (task). Tehtävien välinen viestinvälitys voi olla synkronoitu tai
synkronoimaton (asynchronous). Synkronoidun viestinvälityksen perusideana on se,
että tehtävä voi olla varattu (busy), jolloin se ei vastaanota viestiä muilta tehtäviltä.
Yleensä viesteihin liittyy jokin toiminto vastaanottavassa tehtävässä, jolloin tämän
tulee olla valmis käsittelemään viesti. Tehtävät suunnitellaan niin, että ne voivat
ilmaista valmiudestaan jossakin kohtaa suoritustaan, jolloin ne jäävät odottamaan
toisen tehtävän viestiä. Kohtaamiseksi (rendezvous) sanotaan tilannetta, jossa
viestinvälitys on synkronoitua. Tällöin tunnetaan sekä lähettäjätehtävän että
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
vastaanottajatehtävän suorituksen vaihe viestin siirtyessä. Ada-kieliseen rinnakkaiseen
ohjelmointiin voi tutustua tarkemmin teoksesta [Kur], luku 7.
4.1. Semaforit
Semaforit ovat vanhimpia rinnakkaisen ohjelmoinnin rakenteita, Dijkstra esitteli ne
vuonna 1968 suunnittelemansa THE -käyttöjärjestelmän yhteydessä (E.W. Dijkstra,
"The structure of 'THE' multiprogramming system", Communications of ACM, 11 (5),
1968, 341 - 346 ). Käyttöjärjestelmän toiminta perustui muutamaan rinnakkain
toimivaan prosessiin, jotka synkronoitiin kovopohjaisesti Dijkstran semaforiksi
kutsumalla mekanismilla. Nimitys johtuu rautateillä käytettävistä opastimista, joilla
pyritään estämään törmäyksiä.
Semafori pitää yllä kokonaislukumuuttujaa, joka kertoo kullakin hetkellä jäljellä olevien
lupien (permits) määrän ja jonka arvo on ei-negatiivinen. Yleensä tämä määrä kuvaa
säikeitä, joille voidaan antaa lupa toimia yhtä aikaa. Kun säie haluaa toimintaan, se
pyytää lupaa semaforilta, joka myöntää sen mikäli lupia on jäljellä. Muussa tapauksessa
säie joutuu odottamaan luvan vapautumista; kun säie luopuu toiminnastaan, sen on
ilmoitettava tämä semaforille. Kun S on semafori, näitä operaatioita merkitään usein


WAIT(S) tai P(S) (hollanninkielinen lyhenne - proberen = testaa ),
SIGNAL(S) tai V(S) (hollanninkielinen lyhenne - verhogen = kasvata ).
Semaforeja voidaan käyttää monin tavoin. Itse asiassa monet käyttöjärjestelmät ja
kielet ovat valinneet semaforin ainoaksi rinnakkaisuuden kontrollirakenteeksi. Myös
Windows ja UNIX-järjestelmissä on suora tuki semaforeille.
Moniin rinnakkaisen ohjelmoinnin ongelmiin voidaan löytää ratkaisu käyttämällä
semaforeja; kuitenkin niiden käyttö vaatii huolellista ohjelmointia. Semaforien
varomaton käyttö koodissa johtaa usein virhetilanteisiin. Tyypillinen koodissa esiintyvä
virhe on (semafori S):
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
P(S);
CriticalSection;
P(S); // Pitää olla V(S);
Tämä johtaa säikeen lukkiutumiseen, koska semaforia ei lainkaan vapauteta. Edelleen
semaforien avulla voi helposti kirjoittaa lukkiutuvan ohjelman esimerkiksi seuraavasti
(semaforit S1 ja S2):
Säie T1:
Säie T2:
T11:P(S1);
T21:P(S2);
T12:P(S2);
T22:P(S1);
V(S2);
V(S1);
V(S1);
V(S2);
Mikäli säikeet suorittavat kaksi ensimmäistä käskyään järjestyksessä T11,T21,T12,T22,
ohjelma lukkiutuu, koska säikeellä T1 on semaforin S1 lukko hallussaan ja säikeellä T2
semaforin S2 lukko. Näin ollen kumpikaan säie ei pääse etenemään.
Virheherkkyytensä takia semaforeja käytetäänkin varsin vähän korkean tason
ohjelmoinnissa. Käyttöjärjestelmätasolla ne sen sijaan ovat yleisesti käytössä.
4.2. Monitorit
Semaforit otettiin käyttöön rinnakkaisessa ohjelmoinnissa, jotta vältyttäisiin
keskusyksikköaikaa kuluttavilta odotussilmukoilta sekä saataisiin yleiskäyttöinen
mekanismi rinnakkaisuuden hallintaan. Semaforeilla voidaankin ratkaista useita
rinnakkaisen ohjelmoinnin ongelmia, mutta ne eivät ohjelmointiteknisesti sovellu hyvin
rakenteiseen ohjelmointiin. Oikein käytettyinä semaforit ovat hyvä työkalu, mutta
niiden virheetön käyttö on monimutkaisissa ohjelmissa vaikeaa. Dijkstra ehdottikin
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
tiettävästi ensimmäisenä (1971) datan kapseloinnin käyttämistä pääsynvalvontaan
rinnakkaisissa ohjelmissa; Dijkstra käytti tällaisesta kontrolliyksiköstä nimeä "sihteeri",
mutta ei esittänyt konkreettista toteutusehdotusta. Monitorin periaatteen esitti Brinch
Hansen vuonna 1972 (Brinch Hansen: Structured multiprogramming, Communications
of the ACM, 15 (7) 574 - 578, 1972), ja C.A.R.Hoare kehitti perusideaa eteenpäin
esittelemällä vuonna 1974 monitorin käsitteen. Monitoria voidaan pitää
rakenteellisena rinnakkaisuuden hallinnan mekanismina (ks. C.A.R. Hoare, "Monitors:
an operating system structuring concept", Communications of ACM, 17 (10) 549-557,
1974 ).
Monitori on olio, joka kapseloi halutut toiminnot sisäänsä niin, että niitä pääsee
suorittamaan vain monitorin suostumuksella. Vain yksi säie voi kerrallaan suorittaa
toimintoja - tällöin sanotaan että säikeellä on hallussaan monitorin lukko (lock).
Monitorilla on myös odotusjoukko (wait set), johon sijoitetaan toimintoja
suorittamaan haluavat säikeet. Kun lukkoa hallussaan pitävä säie luopuu siitä, jokin
odotusjoukon säie saa lukon haltuunsa ja oikeuden suorittaa monitorin valvomia
toimintoja. Säie luopuu lukosta ilmoittamalla (signal, notify) siitä odotusjoukon
säikeille. Monitorin yleisimmän määritelmän perusteella monitorilla voi olla useita
odotusjoukkoja, joihin odottavat säikeet sijoitetaan ehtomuuttujien (condition
variables) perusteella. Tällöin säikeen on odottamaan mennessään ilmoitettava, mistä
ehtomuuttujasta odottaminen riippuu (wait(condVar))ja ilmoittavan säikeen on
kohdistettava ilmoituksensa määrätylle ehtomuuttujalle (notify(condVar)).
Monitorien ilmoituskäytännön toteutuksessa käytetään kolmea perustyyppiä:



Ilmoita ja poistu (signal and exit)
o Lukosta luopuvan säikeen on välittömästi poistuttava monitorista
ilmoituksen tehtyään
Ilmoita ja odota (signal and wait)
o Ilmoituksen saanut säie alkaa välittömästi ilmoituksen saatuaan suorittaa
toimintojaan ja ilmoittaja odottaa, kunnes tämä on lopettanut, minkä
jälkeen ilmoittaja jatkaa toimintojaan.
Ilmoita ja jatka (signal and continue)
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
o
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
Ilmoituksen saanut säie odottaa, kunnes ilmoittaja poistuu monitorista ja
alkaa tämän jälkeen suorittaa toimintojaan.
Kaksi jälkimmäistä tyyppiä muistuttavat toisiaan siinä suhteessa, että ilmoitus voidaan
tehdä metodin keskellä; ensimmäisen tyypin ilmoitusta on heti seurattava return-lause.
Monitorien ja semaforien toteutusvoima on sama; semafori voidaan toteuttaa
monitorien avulla ja päinvastoin. Ensimmäinen kieli, johon sisällytettiin monitorien
käytön tuki, oli Concurrent Pascal 1970-luvun puolivälissä.
5. Rinnakkaisuus Javassa
Seuraavaksi käsitellään rinnakkaisuuden toteutusta Java-kielessä. Aluksi tutustutaan
Javan säikeisiin ja sitten synkronointimekanismeihin.
5.1. Javan säikeet
Javan säikeet jaetaan kahteen luokkaan:


Käyttäjäsäikeet (user threads)
o Varsinaiset säikeet
Demonisäikeet (daemon threads)
o Taustalla toimivat säikeet
Lisäksi jokaisella säikeellä on prioriteetti; korkean prioriteetin säikeet saavat
suorituksessa etusijan alhaisen prioriteetin säikeisiin nähden. Kun Javan virtuaalikone
käynnistyy, on yleensä yksi käyttäjäsäie toiminnassa (käynnistetyn pääohjelman säie).
Lisäksi virtuaalikone suorittaa yhtä tai useampia demonisäikeitä, jotka hoitavat
taustalla toimivaa roskankeruuta jne. Virtuaalikone suorittaa säikeitä, kunnes ohjelma
lopetetaan kutsumalla hyväksytysti Runtime-luokan exit-metodia tai kun kaikki
käyttäjäsäikeet ovat lopettaneet toimintansa. Javassa uuden säikeen voi luoda kahdella
eri tavalla:

Kirjoittamalla luokka, joka perii Thread -luokan,
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
Luokan run-metodi on ylikirjoitettava,
Kirjoittamalla luokka, joka toteuttaa Runnable-rajapinnan,
o Luokassa on toteutettava run-metodi.
o

Jälkimmäinen tapa on hieman kevyempi ja sallii perinnän.
Javassa Thread -luokan oliot kontrolloivat säikeitä. Uuden säikeen luominen aloitetaan
uuden Thread -olion luomisella; tämän jälkeen säie konfiguroidaan (annetaan sille
prioriteetti, nimi jne. - voidaan tehdä luomisen yhteydessä) ja lopulta säie laitetaan
suoritukseen kutsumalla sen start -metodia. Huomaa, että säikeen toiminta kirjoitetaan
run -metodiin, mutta ajo aloitetaan start -metodilla, jolloin järjestelmä kutsuu run metodia. Säiettä suoritetaan, kunnes run -metodista palataan, alati toimivan säikeen
voi siis tehdä kirjoittamalla run -metodiin ikuisen silmukan. Seuraavassa esimerkissä
toimii (pääohjelmasäikeen lisäksi) kaksi säiettä rinnakkain:
class DemoThread extends Thread
{
private int delay;
private String line;
public DemoThread(String name,String toSay,int dTime){
super(name);
line = toSay;
delay = dTime;
}
public void run()
{
while(true) {
System.out.println(this.getName() + " says: " + line);
try{
Thread.sleep(delay);
}
catch(InterruptedException ie){
return;
}
} // while true
}
}
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
public class EkaTredit
{
public static void main(String [] argv )
{
DemoThread DT1 = new DemoThread("Eka jouhi","HUI!",300);
DemoThread DT2 = new DemoThread("Toka jouhi","hai!",600);
DT1.start();
DT2.start();
}
}
Pääohjelmassa luodaan kaksi säiettä, jotka tulostavat nimensä ja annetun lausahduksen
ja vaipuvat uneen annetuksi ajaksi. Suoritettaessa ohjelmaa konsolille tulostuu noin
kaksi "HUI!":ta yhtä "hai!":ta kohti. Sama toiminto saadaan aikaan käyttämällä
Runnable -rajapintaa seuraavasti:
class DemoRunnable implements Runnable
{
private int delay;
private String objName;
private String line;
public DemoRunnable(String name,String toSay,int dTime)
{
objName = name;
line = toSay;
delay = dTime;
}
public void run()
{
while(true){
System.out.println(objName + " says: " + line);
try
{
Thread.sleep(delay);
}
catch(InterruptedException ie)
{
return;
}
} // while true
}
}
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
public class EkaRun
{
public static void main(String [] argv )
{
DemoRunnable DR1 = new DemoRunnable(
"Eka olio","HUI!",300);
DemoRunnable DR2 = new DemoRunnable(
"Toka olio","hai!",600);
new Thread(DR1).start();
new Thread(DR2).start();
}
}
Huomaa, että koodi on lähes samanlainen kuin ensimmäisessä ohjelmassa, paitsi että
pääohjelmassa luodaan uudet säikeet, joissa Runnable-olioiden run-metodit
suoritetaan. Säikeet luodaan antamalla niille luomisen yhteydessä parametrina
Runnable-olio.
5.2. Synkronointi Javassa
Monitorit ovat Javan sisäänrakennettu synkronointimekanismi. Ensin tutkitaan, miten
Javassa toteutetaan kilpailun synkronointi. Kirjoitetaan Java -kielellä syklinen puskuri,
jota käytetään usein, kun yksi säie tuottaa toiselle säikeelle dataa ja data on saatava
talteen, kunnes se on luettu. Kun käytetään äärellistä puskuria, se voidaan toteuttaa
taulukkona. Etuna on kirjoituksen ja lukemisen nopeus ja yksinkertaisuus, mutta
toisaalta on pidettävä huoli siitä, että täyteen puskuriin ei enää kirjoiteta. Syklisessä
puskurissa (circular buffer) puskurin viimeisen paikan jälkeen kirjoitetaan aina
ensimmäiseen jne. Tässäkin tapauksessa on luonnollisesti pidettävä huoli siitä, että
täyteen puskuriin ei enää kirjoiteta, koska silloin tietoa häviää. Luokkaan kirjoitetaan
metodit put ja take, joilla kirjoitetaan puskuriin ja luetaan siitä.
Ensin on pidettävä huoli siitä, että metodeja put ja take ei kutsuta yhtä aikaa kahdesta
säikeestä, koska tällöin puskuri saattaisi mennä sekaisin. Tämä onnistuu kirjoittamalla
metodit synkronoiduiksi. Jokainen olio Javassa voi toimia monitorina. Näin ollen
jokaisella oliolla Javassa on lukko (lock), joka estää suorittamasta useita synkronoituja
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
metodeja yhtä aikaa. Kun säie kutsuu olion synkronoitua metodia, se ottaa haltuunsa
olion lukon; tällöin mitkään muut säikeet eivät voi kutsua olion mitään synkronoitua
metodia, vaan niiden toiminta estetään, kunnes ensimmäinen säie luopuu lukosta, ts.
ensiksi kutsutusta synkronoidusta metodista palataan tai säie siirtyy metodia
suorittaessaan odotustilaan. Metodista palaaminen voi tapahtua joko normaalisti tai
virheen tai poikkeuksen seurauksena. Tavallisia, ei-synkronoituja metodeja sen sijaan
voidaan kutsua samanaikaisesti toisistakin säikeistä.
Metodi voidaan määritellä synkronoiduksi lisäämällä sen esittelyyn sana synchronized.
Tästä komennosta on toinenkin muoto synchronized(lukkoOlio), jolla voidaan lukita
jokin muu olio (tässä tapauksessa lukkoOlio) kuin metodin omistava olio, näin voidaan
lukita myös koodilohko eikä tarvitse rajoittua koko funktioon. Näin saadaan luokan
hahmotelmaksi seuraava:
public class
{
protected
protected
protected
protected
CircularBuffer
final Object[] buffer;
int putPtr = 0;
int takePtr = 0;
int queuedItems = 0;
public CircularBuffer(int size) throws IllegalArgumentException
{
// Check first that size is OK
if( size <= 0)
throw new IllegalArgumentException();
buffer = new Object[size];
}
public synchronized void put(Object obj)
{
// Put object in buffer
buffer[putPtr] = obj;
// Increase putPtr cyclically and increase current size
putPtr = (putPtr +1) % buffer.length;
queuedItems++;
}
public synchronized Object take()
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
{
Object retObj = buffer[takePtr];
// Increase takePtr cyclically and decrease current size
takePtr = (takePtr +1) % buffer.length;
queuedItems--;
return retObj;
}
}
Nyt kilpailun synkronointi on toteutettu, mutta koodissa on se ongelma, että tyhjästä
puskurista voidaan lukea ja täyteen puskuriin kirjoittaa. Koodin tulisi toimia niin, että
lukeva säie pysähtyy, ellei mitään luettavaa ole. Säie saa jatkaa toimintaansa vasta
sitten, kun jokin kirjoittajasäie käy kirjoittamassa alkion taulukkoon. Kirjoittava säie
puolestaan pysähtyy kohdatessaan täyden puskurin ja saa jatkaa toimintaansa vasta,
kun jokin lukijasäie käy lukemassa alkion täydestä puskurista. Tämä saadaan aikaan
yhteistoiminnan synkronoinnilla. Tähän käytetään monitorin odotus- ja
ilmoituskäytäntöä. Jokaisella oliolla on monitorina odotusjoukko (wait set), johon
voidaan vaikuttaa vain Object -luokan metodeilla wait(), notify() ja notifyAll() sekä
Thread -luokan metodilla interrupt(). Olion odotusjoukko koostuu niistä säikeistä,
joiden toiminta on estetty kutsumalla säikeestä olion wait() -metodia. Javan
virtuaalikone pitää sisäisesti yllä odotusjoukkoa kullekin oliolle eikä päästä säikeitä
suoritukseen ennen kuin odotuksen ilmoitetaan loppuvan tai se loppuu jonkin
poikkeustoiminnon seurauksena. Jotta säie voisi kutsua olion wait-metodia, sillä on
oltava hallussaan olion lukko. Toisin sanoen, metodia voi koodissa kutsua ainoastaan
synkronoidussa metodissa tai synkronoidun lohkon sisältä. Sama pätee notify- ja
notifyAll -metodeihin.
Kun säie siirtyy odotustilaan, se luonnollisesti myös vapauttaa olion lukon. Säie voi
vapautua odotuksesta, mikäli:


Jokin toinen säie kutsuu olion notify() -metodia. Tällöin jokin olion odotusjoukon
säikeistä vapautuu. Valinnan tekee järjestelmä satunnaisesti.
Jokin toinen säie kutsuu olion notifyAll() -metodia. Tällöin kaikki olion
odotusjoukon säikeet vapautuvat
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto

815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
Jokin toinen säie keskeyttää (interrupt) odottavan säikeen. Tällöin heitetään
poikkeus InterruptedException.
Kun säie vapautuu, se kilpailee normaaliin tapaan muiden säikeiden kanssa olion
synkronoinnissa. Jos säie on keskeytetty, InterruptedException heitetään vasta silloin,
kun säikeelle annetaan kontrolli olioon.
Näin saadaan wait ja notify -metodeja käyttämällä korrekti ratkaisu sykliselle puskurille:
public class CircularBuffer
{
protected final Object[] buffer;
protected int putPtr = 0;
protected int takePtr = 0;
protected int queuedItems = 0;
public CircularBuffer(int size) throws IllegalArgumentException
{
// Check first that size is OK
if( size <= 0)
throw new IllegalArgumentException();
buffer = new Object[size];
}
public synchronized void put(Object obj) throws InterruptedException
{
// Wait while buffer is full
while(queuedItems == buffer.length)
wait();
// Put object in buffer
buffer[putPtr] = obj;
// Increase putPtr cyclically and increase current size
putPtr = (putPtr +1) % buffer.length;
queuedItems++;
// Signal if put to empty buffer
if(queuedItems == 1)
notifyAll();
}
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
public synchronized Object take() throws InterruptedException
{
// Wait while buffer is empty
while(queuedItems == 0)
wait();
Object retObj = buffer[takePtr];
// Increase takePtr cyclically and decrease current size
takePtr = (takePtr +1) % buffer.length;
queuedItems--;
// Signal if taken from full buffer
if(queuedItems == (buffer.length-1) )
notifyAll();
return retObj;
}
}
Huomaa, että ilmoitus tarvitsee antaa ainoastaan silloin, kun luetaan alkio täydestä
puskurista tai kun kirjoitetaan tyhjään puskuriin.
Java-kielisen rinnakkaisen ohjelmoinnin perusteisiin voi tutustua tarkemmin esimerkiksi
teoksesta [Arn], luku 9 ja kirjan [Ves] luvusta 19.
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
6. Rinnakkaisuus C++:ssa
C++-kielen standardiin C++11 on lisätty rinnakkaisuuden tuki. Käsitellään tässä lyhyesti
sen ominaisuuksia. Säikeitä voidaan luoda standardikirjaston luokan std::thread avulla.
Kun luokasta luodaan olio ja annetaan sille parametrina funktio, tämä suoritetaan
uudessa säikeessä seuraavaan tapaan:
#include <iostream>
#include <thread>
void terve(){
std::cout << "Terve. Olen saie " << std::this_thread::get_id() << std::endl;
}
int main(){
std::thread saie(terve);
saie.join();
std::cout << "Ohjelman loppu!" << std::endl;
return 0;
}
C++-ohjelma loppuu aina, kun sen pääohjelman säie päättyy. Siksi ohjelmaan on lisätty
join-metodin kutsu, joka pakottaa pääohjelman odottamaan säikeen päättymistä.
C++:n säikeestä voidaan tehdä taustasäie kutsumalla sen metodia detach. Taustasäiettä
ei voi odottaa toisessa säikeessä kutsumalla join-metodia.
Luokan std::mutex olion lock-metodilla voidaan lukita jokin koodin osa niin, että sitä voi
suorittaa vain yhdestä säikeestä kerrallaan, esimerkiksi ohjelmassa
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
#include
#include
#include
#include
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
<iostream>
<vector>
<thread>
<mutex>
class Laskuri {
private:
std::mutex lukko;
int arvo;
public:
Laskuri() : arvo(0) {}
int getArvo(){ return arvo; }
void kasvata(){
lukko.lock();
++arvo;
lukko.unlock();
}
};
int main(){
Laskuri counter;
std::vector<std::thread> saikeet;
for(int i = 0; i < 5; ++i){
saikeet.push_back(std::thread([&counter](){
for(int i = 0; i < 10000; ++i){
counter.kasvata();
}
}));
}
for(auto& saie : saikeet){
saie.join();
}
std::cout << counter.getArvo() << std::endl;
return 0;
}
viisi säiettä kasvattaa Laskuri-muuttujan counter-attribuutin arvo 10000 kertaa kukin.
Koska muuttujan kasvattaminen sijaitsee lukitussa koodin osassa, voidaan olla varmoja,
että attribuutin arvo lopuksi on 50000. Mikäli koodi muutettaisiin muotoon
void kasvata(){
++arvo;
}
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
ohjelmassa jotkin arvon päivitykset menisivät hyvin todennäköisesti hukkaan ja
ohjelma tulostaisi jonkin lukua 50000 pienemmän arvon. Koodi vapautuu muiden
säikeiden käyttöön vasta, kun kutsutaan mutex-olion metodia unlock.
C++:ssa ei ole suoraan monitoria vastaavaa luokkaa, mutta kielen ehtomuuttujien
(luokka std::condition_variable) ja mutex-olioiden avulla voidaan toteuttaa lukitus ja
signalointi. Tässä ei perehdytä asiaan tarkemmin, kuten ei muihinkaan C++:n
rinnakkaisuusominaisuuksiin. Asiasta kiinnostunut voi perehtyä asiaan esimerkiksi
cppreference-sivuston säikeitä käsittelevästä osasta
(http://en.cppreference.com/w/cpp/thread).
7. Rinnakkaisuus muissa kielissä
Ensimmäinen rinnakkaisia toimintoja tukeva ohjelmointikieli oli IBM:n 1960 - luvun
puolivälissä kehittämä PL/I. Tässä kielessä rinnakkaisuuden toteutus ei kuitenkaan
onnistunut erityisen hyvin; muiltakin osin PL/I koettiin ongelmalliseksi. Sitä käytettiin
kuitenkin melko yleisesti 1970-luvulla. Ensimmäinen oliokieli Simula (jonka yleisimmin
käytetty versio julkaistiin vuonna 1967) tuki myös rinnakkaisuutta, joskin hieman
alkeellisesti, ns. vuorottelualiohjelmien (coroutines) muodossa. Joidenkin lähteiden
mukaan Simula on ensimmäinen rinnakkaisuutta tukenut kieli.
1970-luvulla valtakielten joukkoon nousivat Pascal ja C, joista kumpikaan ei tue
rinnakkaisuutta. Molemmista on kuitenkin kehitetty piirrettä tukevat versiot
(Concurrent Pascal, Concurrent C). Concurrent Pascal oli ensimmäinen ohjelmointikieli,
jossa otettiin käyttöön monitorit. Concurrent C:n kehittivät Bellin laboratorioissa
Narain Gehani ja William D. Roome. Nämä eivät kuitenkaan ole erityisen yleisessä
käytössä. Kuitenkin rinnakkaisia C-ohjelmia on kirjoitettu varsin paljon, koska niillä
voidaan ottaa suoraan käyttöön käyttöjärjestelmän rinnakkaisuuden toteutus.
Vuonna 1983 julkaistu Ada sisälsi tuen rinnakkaiselle ohjelmoinnille. Adan
synkronointimekanismi perustui viestinvälitykseen. Vuonna 1995 Adasta julkaistiin uusi
versio, jossa rinnakkaisuuden tukea on parannettu. Lisätietoja rinnakkaisuuden
toteutuksista eri kielissä on teoksissa [Lou] (luku 13) ja [Seb] (luku 13).
Ari Vesanen, Tietojenkäsittelytieteiden laitos, Oulun
yliopisto
815338A Ohjelmointikielten periaatteet: Rinnakkainen ohjelmointi
Microsoftin suunnittelema C# on toteutukseltaan varsin paljon Javan kaltainen. Myös
rinnakkaisuus on siinä toteutettu pääosin samaan tapaan kuin Javassa, vaikka
merkittäviä erojakin kielten välillä on ([Seb], kappale 13.8). Sebestan mukaan C#:n
säikeet ovat ominaisuuksiltaan hieman edistyneempiä kuin Javan.
Lähteet
[Arn] Arnold, Ken Gosling, James. The Java Programming Language, Second Edition,
Addison-Wesley 1998.
[Har] Harsu, Maarit. Ohjelmointikielet, Periaatteet, käsitteet, valintaperusteet,
Talentum 2005.
[Kur] Kurki-Suonio Reino. Ada-kieli ja ohjelmointikielten yleiset perusteet. MODEEMI ry
Tampere 1983.
[Lea] Lea, Doug. Concurrent Programming in Java, design Principles and Patterns,
Second Edition, Addison-Wesley 2000.
[Lou] Louden, Kenneth C. Programming Languages, Principles and Practice, PWS-KENT
1993.
[Seb] Sebesta, Robert W. Concepts of Programming Languages 10th edition, Pearson
2013.
[Sil] Silberschatz A., Galvin P., Gagne G.Operating System Concepts, Sixth Edition, John
Wiley & Sons 2003.
[Ves] Vesterholm, M., Kyppö, J., Java-ohjelmointi, Talentum 2006.