Priporočilni sistem v kinematografih

Transcription

Priporočilni sistem v kinematografih
PERSONALIZACIJA
Priporočilni sistem v kinematografih
Rok Hribar
64080481
Solkan, 13.1.2011
Uvod
Ponavadi priporočilni sistemi delujejo na podlagi soldelovalnega filtriranja (collaborative
filterin), kar pomeni, da sistem primerja uporabnika z drugimi uporabniki glede na njihov
okus, in mu tako priporoči film, pri katerem je nek drug uporabnik v njem užival. Na primer če
je Janezu in Jožetu ušeč isti film kot meni in če sta oba visoko označila nek film ti ta sistem
ta film tudi priporoči. Težava pri tem pa je, da ta priporočilni sistem ne more priporočiti
vsebine dokler skupina uporabnikov ne oceni te vsebine.
Tako so razvili sistem za priporočanje filmov, ki temelji na razširitvi sodelovalnega filtriranja.
Tako so v filtriranje dodali še igralce, režiserje in filmske zvrsti. Ta sistem nam lahko priporoči
nove vsebine, ki bi nam lahko bile ušeč. Pridobili so tudi na točnosti priporočil.
Metode priporočil
V sodelovalnem filtriranju nam priporočilni agent povezuje uporabnike z drugimi uporabniki,
ki so v preteklosti izkazali podobne potenciale. V filtriranju na podlagi vsebine pa nam agent
poveže uporabnike, ki so podobno ocenili predmete in tako predpostavimo, da jim bodo
vsebine z podobnimi predmeti všeč, kot na primer igralci, režiserji in filmske zvrsti. Vsaka
metoda se posamezno zelo težko uporablja, saj imajo veliko slabosti. Sodelovalno filtriranje
ima problem, saj za njegovo uporabo potrebujemo že vnaprej postavljena mnenja o vsebinah
od velike skupine uporabnikov(hladni zagon).
Sistemi, ki delujejo izključno na podlagi vsebine priporočajo samo tiste predmete, ki so
podobni tistim, ki jih je uporabnik že prej ocenil. Takšni sistemi nikoli ne razkrijejo uporabniku
novih predmetov, ampak le tiste ki so znotraj tega niza. Primer: če uporabnik oceni le vojne
filme v katerem ne igra veliko igralcev je zelo velika verjetnost da nam bo priporočilni sistem
ponudil le vojne filme s tistimi igralci kot so igrali v ocenjenem filmu. Prejšnje delo združuje
pozitivne vidike v obeh tehnikah na dva načina. Ena metoda usvarja dva priporočilna sklopa
po enega iz vsake tehnike, potem pa združuje rezultate. Druga tehnika pa sodeluje prek
vsebin, razširja vsako oceno uporabnika in nato primerja z ocenami drugih uporabnikov s
pomočjo algoritma sodelovalnega filtriranja.
Kinematografski priporočilni sistem
Ta sistem so zgradili na že obstoječih spletnih straneh kinematografov. Srce sistema je
priporočilni sistem (slika1), ki vsebuje priporočilnega agenta in z njim povezane podatkovne
baze. Interakcija z uporabnikom poteka preko spletnega brskalnika. Sistem shranjuje
podatke v podatkovne baze, v večih spletnih strežnikih Kot kaže slika 1, baze vsebujejo
informacije o uporabnikih in ocenah katere so oni vnesli v uporabniški vmestnik.
Rok Hribar 64080481
Stran2
Slika 1
Delno avtomatiziran in delno ročni proces zbira in preverja podatke o filmu iz večih virov, kot
so novice, arhiv zbirk in namenskih ponudnikov vsebin. Slika 2 prikazuje shemo za
priporočilni proces.
Slika 2
Rok Hribar 64080481
Stran3
Najprej sodelovalno filtriranje
Zgornja vrstica v sliki 2 opisuje sodelovalni postopek filtriranja. Ta vključuje iskanje
podskupine uporabnikov s podobnim okusom, kot ga ima trenutni uporabnik. Sistem sestavi
seznam filmov z obema sklopoma ocen in izračuna korelacijo med njima. Ta izračun nam
poda vrednost Pearsonovega koeficienta r. Tako lahko pridobimo večji seznam filmov , ki bi
lahko bili našemu uporabniku ušeč. Koeficient vsebuje vrednosti od -1 do 1. Če je koeficient
0 pomeni da še nima nobene povezave, bliže ko je 1 večja je korelacija in če je koeficient
blizu -1 pomeni negativno korelacijo. Tehtano sredino enako predvidene ocene za film
izračunamo iz naslednje enačbe:
Ko so vsi zračuni končani agent shrani seznam filmov in predvidene ocene. Sistem shrani
tudi število podobnih uporabnikov, da izvemo natančnost priporočila. Sistem lahko to število
uporabi v sekundarnem sortirnem polju za podajanje priporočil. Sistem nato napovedane
vrednosti odda sistemu za filtriranje glede na vsebino.
Filtriranje glede na vsebino rezultatov iz sodelovalnega filtriranja
Za vsak element ki se ocenjuje v filmu (igralec, režiser in zvrst filma) se vpisani podatki
shranijo v ustrezna polja v bazi. To pomeni, da če določen film ocenimo z 5 se ta vrednost
prepiše v polje igralcev, ki igrajo v tem filmu, v polje režiserja, ki je režiral film in v polje zvrsti
katere je film. Ko se ta proces zaključi za vse ocene nam agent preračuna povprečne
vrednosti za vsa polja (igralec, režiser in zvrst filma). Te vrednosti nam povejo kateri elementi
so uporabniku všeč in kateri ne.
Slika 3
Rok Hribar 64080481
Stran4
Prikazovanje priporočil
Sistem je zgrajen tako, da administrator lahko izklaplja ali vklaplja algoritme filtriranja.
Vstvarjanje priporočil zahteva veliko strežniških virov, tako da je pogosto ponovno
preračunavanje nezaželeno.
To lahko rešimo tako, da ko se ustvari priporočilni set, ga shranimo v pomnilnik za
preostanek seje, če bo potrebno ponovno preračunavanje. Slika 3 prikazuje sistem za
spletno uporabo.
Kinematografsko bazirana priporočila
Sistem vključuje spletni avtomatiziran sistem, ki pridobi vse predstave, ki jih neki kino
prikazuje. Tako naprimer vpišemo kje se nahajamo, in nam sistem poda vse kinematografe
okoli nas. Tako se odločimo za enega in sistem nam za tem takoj poda priporočila filmov
kateri se predvajajo v tem kinu. To prikazuje slika 4.
Slika 4
Test zmogljivosti sistema
Sistem je bil testiran s podatki od 100.000 filmov, ocenjenih od 943 uporabnikov. Podatke je
zbirala Univerza v Minnesoti USA in so se zbirali od Septembra 1997 do Aprila 1998 na
njihovi spletni strani MovieLens. Ocene so se dodeljevale s pomočjo zvezdic; ena zvedica
pomeni slabo, 5 zvezdic pa zelo dobro. Test je vseboval avtomatično generirana priporočila
za naključnih 200 uporabnikov. Pri testu so uporabili 4 tehnike: samo sodelovalno filtriranje,
samo filtriranje glede na vsebino, sodelovalno skozi vsebinsko filtriranje in testiranje in
Rok Hribar 64080481
Stran5
tekoče filtriranje na podlagi vsebine prek sodelovalnega filtriranja. Tako vidimo kako dobro
sistem napove oceno za določen predmet, ki je ključno merilo uspeha priporočilnega uspeha.
Pri testiranju so prišli do spoznanja, da ima ta sistem pomankljivosti. Ena izmed njih se kaže
v primeru če uporabnik oceni tri komedije Robbina Williamsa s petimi točkami in 2 njegovi
drami oceni z eno točko pride do tega da sistem ne bo predlagal Williamsovih komedij pa
čeprav je gledalec v njih užival.
Izboljševanje sistema
Priporočilni sistem sicer deluje . Potrebno bi bilo le zmanjšati učinek srednje vrednosti, ki se
opazi v testiranju. To bi se dalo rešiti z ustvarjanjem bolj kompleksnejših skupin, da bi bil
naprimer vsak igralec , režiser ali žaner kot samostojni element.
Rok Hribar 64080481
Stran6