Multivariate analysis

Transcription

Multivariate analysis
Naslov predmeta:
Multivariantna analiza
ECTS: 7
Predavanja:
Vaje:
Laboratorijske vaje:
30 ur
30 ur
15 ur
Letnik/semester: drugi/tretji
Študijski program: Univerzitetni študijski program
prve stopnje Uporabne družbene študije
Jezik: Slovenski, angleški
Cilji / kompetence
Učna enota prispeva k razvoju naslednjih splošnih in
predmetnospecifičnih kompetenc:
 obvladanje raziskovalnih metod, postopkov
in procesov na področju družbenih ved;
 razvoj kritične in samokritične presoje;
 sposobnost za reševanje konkretnih
družbenih in delovnih problemov z uporabo
družboslovnih znanstvenih metod in
postopkov;
 sposobnost pridobivanja, selekcije,
ocenjevanja in umeščanja novih informacij
in zmožnost interpretacije v kontekstu
družboslovja;
 sposobnost uporabe informacijskokomunikacijske tehnologije in sistemov na
področju družbenih ved;
 razvoj veščin in spretnosti pri uporabi
znanja na področju družbenih ved s pomočjo
reševanja teoretičnih ali empiričnih
problemov.
Opis vsebine
 Uvod. Predmet in metode multivariatne
analize. Sodobni pristopi in trendi
raziskovanja v statistiki.. Primeri uporabe.
Povezanost s sorodnimi področji (strojno
učenje, umetna inteligentnost, podatkovno
rudarjenje, odkrivanje zakonitosti)
 Osnove matrične algebre. Notacija in
osnovni pojmi (skalar, vektor, matrika,
enakost vektorja in matrike, transpon
matrike). Osnovne računske operacije nad
vektorji in matrikami. Rang matrike. Inverz
matrike. Pozitivno definitne matrike.
Determinante. Sled. Ortogonalnost. Lastne
vrednosti in lastni vektorji. Spektralni
razcep.
 Visokorazsežni podatki. Geometrijski
pomen. Aritmetična sredina in razpršenost
slučajne spremenljivke. Kovarianca in
korelacija. Vektor aritmetičnih sredin in
razpršenosti večrazsežnega podatkovja.
Kovariančna in korelacijska matrika.
Linearne kombinacije spremenljivk.
Razdalje med vektorji.
 Večrazsežna normalna porazdelitev.
Gostota. Lastnosti.
 Analiza variance. Pregled statističnih testov
na enem / dveh vektorjih aritmetičnih
sredin. ANOVA. MANOVA. Načrtovanje
Subject title:
Multivariate analysis
Lectures:
Tutorials: Lab work:
30 hours
30 hours
15 hours
Year/semester: second/third
Study programme: Applied social studies
Language: Slovene, English
Objectives
The educational unit contributes to the development
of the following general and specific competences:
 familiarity with research methodology in the
social sciences;
 development of critical and self-critical
judgement;
 ability for retrieving concrete social and
occupational problems using social science
methods and procedures;
 ability for acquiring, selecting, assessing,
and installing new information and the
capability of interpreting them in the context
of the social sciences;
 ability to use information sources and
communication technologies;
 developing skills and exprertness by solving
theoretical or empirical problems.
Course content
 Introduction. Objectives. State-of-the-art
approaches and current trends in statistics.
Applications. Connections to field-based
sciences (machine learning, artificial
intelligence, data mining, knowledge
discovery.)
 Matrix algebra. Notation and basic
defininions (scalar, vector, matrix, equality
of vectors and matrices, transpose). Basic
operations with vectors and matrices. Rank.
Inverse. Positive definite matrices.
Determinants. Trace. Ortogonal vectors and
matrices. Orthogonal and ortonormal matrix.
Eigenvalues and eigenvectors. Spectral
decomposition.
 High-dimensional data. Geometry of highdimensional space. Mean and variance of
univariate random variable. Covariance and
correlation. Mean vectors. Covariance
matrix. Correlation matrix. Linear
combinations of variables. Distance between
vectors.
 Multivariate normal distribution. Density.
Properties.
 Multivariate analysis of variance. Review of
tests on one or two mean vectors. ANOVA.
MANOVA. Experiment design.
 Multiple regression. Statistical model.
eksperimenta.
Večkratna regresija. Statistični model.
Parcialni odvod. Metoda najmanjših
kvadratov. Testiranje domnev.
Determinacijski koefdiocient.
 Diskriminantna analiza. Diskriminantna
funkcija za dva razreda in posplošitev na
več razredov. Standardizirana
diskriminantna funkcija. Interpretacija
diskriminantne funkcije. Diskriminantna
analiza in večkratna regresija.
 Kanonična korelacijska analiza. Kanonična
korelacija in kanonične spremenljivke.
Lastnosti kanoničnih korelacij. Interpretacija
(standardizirani koeficienti, rotacija).
 Analiza glavnih komponent. Glavne
komponente in njihov geometrijski pomen.
Izločanje glavnih komponent. Izbira števila
glavnih komponent. Interpretacijs glavnih
komponent. Rotacija.
 Faktorska analiza. Faktorski model.
Ocenjevanje nasičenosti in komunalitet.
Metoda glavnih komponent. Izbira števila
faktorjev. Rotacija faktorjev. Faktorski
dosežki..
 Razvrščanje v skupine. Mere podobnosti in
različnosti. Hierarhično razvrščanje.
Nehierarhično razvrščanje. Izbira števila
skupin.
Temeljna literatura
 Izenman, A. J. (2008). Modern Multivariate
Statistical Techniques. New York, NY:
Springer.
 Hair, J. F. (2006). Multivariate data
analysis. Englewood Cliffs, NJ: PrenticeHall.
 Hastie, T., Tibshirani, R. in Friedman, J.
(2009). The Elements of Statistical
Learning. New York, NY: Wiley.
 Omladič, V. (1997). Uporaba linearne
algebre v statistiki. Ljubljana: Fakulteta za
družbene študije.
Required literature
 Izenman, A. J. (2008). Modern Multivariate
Statistical Techniques. New York, NY:
Springer.
 Hair, J. F. (2006). Multivariate data
analysis. Englewood Cliffs, NJ: PrenticeHall.
 Hastie, T., Tibshirani, R., & Friedman, J.
(2009). The Elements of Statistical Learning.
New York, NY: Wiley.
 Omladič, V. (1997). Uporaba linearne
algebre v statistiki. Ljubljana: Fakulteta za
družbene študije.
Predvideni študijski dosežki
Znanje in razumevanje:
 se seznani s teoretskimi osnovami in s
praktičnimi vidiki statističnih metod iz
področja multivariatne statistike;
 se usposobi za izvedbo najzahtevnejše
statistične analize: za izvedbo raziskav, kjer
se obravnava povezava med večimi
statističnimi spremenljivkami hkrati;
 se nauči uporabljati nekaj najaktualnejših
programskih orodij za to najzahtevnejšo
statistično analizo.
Intended learning outcomes
Knowledge and understanding:
 understanding and knowledge of the basic
concepts and classical methods of the
contemporary multivariate analysis;
 understanding and correct application of
different multivariate statistical methods and
procedures, knowledge transfer of statistical
methods into different scientific fields
dealing with multivariate data;
 knowledge of using an appropriate software
for statistical analysis.
Prenesljive/ključne spretnosti in drugi atributi:
 prenos znanja multivariatne analize na
različna strokovna in znanstvena področja,
Transferable/Key skills and other attributes:
 knowledge transfer of multivariate analysis
methods into different areas dealing with






Partial derivative. Method of least squares.
Tests of significance. Determination
coefficient.
Discriminant analysis. Discriminant
function for two classes. Discriminant
analysis for several groups. Standardized
discriminant function. Interpretation of
discriminant functions. Relationship
between discriminant analysis and multiple
regression.
Canonical correlation analysis. Canonical
correlation and canonical variate. Properties
of canonical correlations. Interpretation
(standardized coefficients, rotation).
Principal component analysis. Principal
components. Geometric basis of principal
component. Extraction of principal
components. Choosing the number of
components. Interpretation of principal
components. Rotation.
Factor analysis. Factor model. Estimation of
loadings and communalities. Principal
component method. Choosing the number of
factors. Rotation. Factor scores.
Cluster analysis. Measures of similarity and
disimilarity. Hierarchical clustering.
Nonhierarchical clustering. Choosing the
number of clusters.
kjer se uporabljajo statistična analiza.
data analysis.
Metode poučevanja in učenja
 predavanja z aktivno udeležbo študentov
(razlaga, diskusija, vprašanja, primeri,
reševanje problemov);
 vaje, kjer bodo študentje pri konkretnih
statističnih problemih ponovili, utrdili in
dodatno osvetlili pojme in metode, spoznane
na predavanjih;
 Laboratorijske vaje: študentje bodo spoznali
nekaj najaktualnejših programskih orodij za
statistično obdelavo podatkov. Vaje bodo
potekale v manjših skupinah, tako da bo
imel vsak študent na razpolago en
računalnik. Študentje v manjših skupinah
pripravijo projekt, ki vključuje konkreten
statistični problem. Študentje problem rešijo
z metodami, spoznanimi na predavanjih in
vajah.
Pogoji za vključitev v delo oziroma za opravljanje
študijskih obveznosti
Študent/študentka mora pred pristopom k izpitu
pripraviti in zagovarjati projekt.
Načini ocenjevanja in ocenjevalna lestvica
 pisni izpit (50 %);
 dva kolokvija, projektna naloga (50 %);
 ocenjevalna lestvica v skladu s Pravilnikom
o preverjanju in ocenjevanju znanja.
Learning and teaching methods
 lectures with active students participation
(explanations, discussion, questions,
examples, problem solving);
 tutorials (students will recall, reinforce, and
shed light on the concepts and methods
taught on lectures);
 lab work (students will learn modern
methods of computer use for statistical data
analysis. The lab work is organized in small
groups with one computer per student.
Students should prepare and defense project
report. The project work includes real-life
statistical analysis and covers the methods
presented in class).
Nosilec in predavatelj predmeta:
Author of the curriculum and lecturer
Izr. Prof. dr. Janez Povh
Assoc. prof., Janez Povh, Ph.D.
Prerequisites
A succesful seminar preparation and defense is a
prerequisite.
Assessment and grading scale
 written exam (50%);
 two preliminary exams, project work (50%);
 grading scale according to Rules on
knowledge assessment and grading.