Priporočilni sistem v kinematografih
Transcription
Priporočilni sistem v kinematografih
PERSONALIZACIJA Priporočilni sistem v kinematografih Rok Hribar 64080481 Solkan, 13.1.2011 Uvod Ponavadi priporočilni sistemi delujejo na podlagi soldelovalnega filtriranja (collaborative filterin), kar pomeni, da sistem primerja uporabnika z drugimi uporabniki glede na njihov okus, in mu tako priporoči film, pri katerem je nek drug uporabnik v njem užival. Na primer če je Janezu in Jožetu ušeč isti film kot meni in če sta oba visoko označila nek film ti ta sistem ta film tudi priporoči. Težava pri tem pa je, da ta priporočilni sistem ne more priporočiti vsebine dokler skupina uporabnikov ne oceni te vsebine. Tako so razvili sistem za priporočanje filmov, ki temelji na razširitvi sodelovalnega filtriranja. Tako so v filtriranje dodali še igralce, režiserje in filmske zvrsti. Ta sistem nam lahko priporoči nove vsebine, ki bi nam lahko bile ušeč. Pridobili so tudi na točnosti priporočil. Metode priporočil V sodelovalnem filtriranju nam priporočilni agent povezuje uporabnike z drugimi uporabniki, ki so v preteklosti izkazali podobne potenciale. V filtriranju na podlagi vsebine pa nam agent poveže uporabnike, ki so podobno ocenili predmete in tako predpostavimo, da jim bodo vsebine z podobnimi predmeti všeč, kot na primer igralci, režiserji in filmske zvrsti. Vsaka metoda se posamezno zelo težko uporablja, saj imajo veliko slabosti. Sodelovalno filtriranje ima problem, saj za njegovo uporabo potrebujemo že vnaprej postavljena mnenja o vsebinah od velike skupine uporabnikov(hladni zagon). Sistemi, ki delujejo izključno na podlagi vsebine priporočajo samo tiste predmete, ki so podobni tistim, ki jih je uporabnik že prej ocenil. Takšni sistemi nikoli ne razkrijejo uporabniku novih predmetov, ampak le tiste ki so znotraj tega niza. Primer: če uporabnik oceni le vojne filme v katerem ne igra veliko igralcev je zelo velika verjetnost da nam bo priporočilni sistem ponudil le vojne filme s tistimi igralci kot so igrali v ocenjenem filmu. Prejšnje delo združuje pozitivne vidike v obeh tehnikah na dva načina. Ena metoda usvarja dva priporočilna sklopa po enega iz vsake tehnike, potem pa združuje rezultate. Druga tehnika pa sodeluje prek vsebin, razširja vsako oceno uporabnika in nato primerja z ocenami drugih uporabnikov s pomočjo algoritma sodelovalnega filtriranja. Kinematografski priporočilni sistem Ta sistem so zgradili na že obstoječih spletnih straneh kinematografov. Srce sistema je priporočilni sistem (slika1), ki vsebuje priporočilnega agenta in z njim povezane podatkovne baze. Interakcija z uporabnikom poteka preko spletnega brskalnika. Sistem shranjuje podatke v podatkovne baze, v večih spletnih strežnikih Kot kaže slika 1, baze vsebujejo informacije o uporabnikih in ocenah katere so oni vnesli v uporabniški vmestnik. Rok Hribar 64080481 Stran2 Slika 1 Delno avtomatiziran in delno ročni proces zbira in preverja podatke o filmu iz večih virov, kot so novice, arhiv zbirk in namenskih ponudnikov vsebin. Slika 2 prikazuje shemo za priporočilni proces. Slika 2 Rok Hribar 64080481 Stran3 Najprej sodelovalno filtriranje Zgornja vrstica v sliki 2 opisuje sodelovalni postopek filtriranja. Ta vključuje iskanje podskupine uporabnikov s podobnim okusom, kot ga ima trenutni uporabnik. Sistem sestavi seznam filmov z obema sklopoma ocen in izračuna korelacijo med njima. Ta izračun nam poda vrednost Pearsonovega koeficienta r. Tako lahko pridobimo večji seznam filmov , ki bi lahko bili našemu uporabniku ušeč. Koeficient vsebuje vrednosti od -1 do 1. Če je koeficient 0 pomeni da še nima nobene povezave, bliže ko je 1 večja je korelacija in če je koeficient blizu -1 pomeni negativno korelacijo. Tehtano sredino enako predvidene ocene za film izračunamo iz naslednje enačbe: Ko so vsi zračuni končani agent shrani seznam filmov in predvidene ocene. Sistem shrani tudi število podobnih uporabnikov, da izvemo natančnost priporočila. Sistem lahko to število uporabi v sekundarnem sortirnem polju za podajanje priporočil. Sistem nato napovedane vrednosti odda sistemu za filtriranje glede na vsebino. Filtriranje glede na vsebino rezultatov iz sodelovalnega filtriranja Za vsak element ki se ocenjuje v filmu (igralec, režiser in zvrst filma) se vpisani podatki shranijo v ustrezna polja v bazi. To pomeni, da če določen film ocenimo z 5 se ta vrednost prepiše v polje igralcev, ki igrajo v tem filmu, v polje režiserja, ki je režiral film in v polje zvrsti katere je film. Ko se ta proces zaključi za vse ocene nam agent preračuna povprečne vrednosti za vsa polja (igralec, režiser in zvrst filma). Te vrednosti nam povejo kateri elementi so uporabniku všeč in kateri ne. Slika 3 Rok Hribar 64080481 Stran4 Prikazovanje priporočil Sistem je zgrajen tako, da administrator lahko izklaplja ali vklaplja algoritme filtriranja. Vstvarjanje priporočil zahteva veliko strežniških virov, tako da je pogosto ponovno preračunavanje nezaželeno. To lahko rešimo tako, da ko se ustvari priporočilni set, ga shranimo v pomnilnik za preostanek seje, če bo potrebno ponovno preračunavanje. Slika 3 prikazuje sistem za spletno uporabo. Kinematografsko bazirana priporočila Sistem vključuje spletni avtomatiziran sistem, ki pridobi vse predstave, ki jih neki kino prikazuje. Tako naprimer vpišemo kje se nahajamo, in nam sistem poda vse kinematografe okoli nas. Tako se odločimo za enega in sistem nam za tem takoj poda priporočila filmov kateri se predvajajo v tem kinu. To prikazuje slika 4. Slika 4 Test zmogljivosti sistema Sistem je bil testiran s podatki od 100.000 filmov, ocenjenih od 943 uporabnikov. Podatke je zbirala Univerza v Minnesoti USA in so se zbirali od Septembra 1997 do Aprila 1998 na njihovi spletni strani MovieLens. Ocene so se dodeljevale s pomočjo zvezdic; ena zvedica pomeni slabo, 5 zvezdic pa zelo dobro. Test je vseboval avtomatično generirana priporočila za naključnih 200 uporabnikov. Pri testu so uporabili 4 tehnike: samo sodelovalno filtriranje, samo filtriranje glede na vsebino, sodelovalno skozi vsebinsko filtriranje in testiranje in Rok Hribar 64080481 Stran5 tekoče filtriranje na podlagi vsebine prek sodelovalnega filtriranja. Tako vidimo kako dobro sistem napove oceno za določen predmet, ki je ključno merilo uspeha priporočilnega uspeha. Pri testiranju so prišli do spoznanja, da ima ta sistem pomankljivosti. Ena izmed njih se kaže v primeru če uporabnik oceni tri komedije Robbina Williamsa s petimi točkami in 2 njegovi drami oceni z eno točko pride do tega da sistem ne bo predlagal Williamsovih komedij pa čeprav je gledalec v njih užival. Izboljševanje sistema Priporočilni sistem sicer deluje . Potrebno bi bilo le zmanjšati učinek srednje vrednosti, ki se opazi v testiranju. To bi se dalo rešiti z ustvarjanjem bolj kompleksnejših skupin, da bi bil naprimer vsak igralec , režiser ali žaner kot samostojni element. Rok Hribar 64080481 Stran6