Multivariate analysis
Transcription
Multivariate analysis
Naslov predmeta: Multivariantna analiza ECTS: 7 Predavanja: Vaje: Laboratorijske vaje: 30 ur 30 ur 15 ur Letnik/semester: drugi/tretji Študijski program: Univerzitetni študijski program prve stopnje Uporabne družbene študije Jezik: Slovenski, angleški Cilji / kompetence Učna enota prispeva k razvoju naslednjih splošnih in predmetnospecifičnih kompetenc: obvladanje raziskovalnih metod, postopkov in procesov na področju družbenih ved; razvoj kritične in samokritične presoje; sposobnost za reševanje konkretnih družbenih in delovnih problemov z uporabo družboslovnih znanstvenih metod in postopkov; sposobnost pridobivanja, selekcije, ocenjevanja in umeščanja novih informacij in zmožnost interpretacije v kontekstu družboslovja; sposobnost uporabe informacijskokomunikacijske tehnologije in sistemov na področju družbenih ved; razvoj veščin in spretnosti pri uporabi znanja na področju družbenih ved s pomočjo reševanja teoretičnih ali empiričnih problemov. Opis vsebine Uvod. Predmet in metode multivariatne analize. Sodobni pristopi in trendi raziskovanja v statistiki.. Primeri uporabe. Povezanost s sorodnimi področji (strojno učenje, umetna inteligentnost, podatkovno rudarjenje, odkrivanje zakonitosti) Osnove matrične algebre. Notacija in osnovni pojmi (skalar, vektor, matrika, enakost vektorja in matrike, transpon matrike). Osnovne računske operacije nad vektorji in matrikami. Rang matrike. Inverz matrike. Pozitivno definitne matrike. Determinante. Sled. Ortogonalnost. Lastne vrednosti in lastni vektorji. Spektralni razcep. Visokorazsežni podatki. Geometrijski pomen. Aritmetična sredina in razpršenost slučajne spremenljivke. Kovarianca in korelacija. Vektor aritmetičnih sredin in razpršenosti večrazsežnega podatkovja. Kovariančna in korelacijska matrika. Linearne kombinacije spremenljivk. Razdalje med vektorji. Večrazsežna normalna porazdelitev. Gostota. Lastnosti. Analiza variance. Pregled statističnih testov na enem / dveh vektorjih aritmetičnih sredin. ANOVA. MANOVA. Načrtovanje Subject title: Multivariate analysis Lectures: Tutorials: Lab work: 30 hours 30 hours 15 hours Year/semester: second/third Study programme: Applied social studies Language: Slovene, English Objectives The educational unit contributes to the development of the following general and specific competences: familiarity with research methodology in the social sciences; development of critical and self-critical judgement; ability for retrieving concrete social and occupational problems using social science methods and procedures; ability for acquiring, selecting, assessing, and installing new information and the capability of interpreting them in the context of the social sciences; ability to use information sources and communication technologies; developing skills and exprertness by solving theoretical or empirical problems. Course content Introduction. Objectives. State-of-the-art approaches and current trends in statistics. Applications. Connections to field-based sciences (machine learning, artificial intelligence, data mining, knowledge discovery.) Matrix algebra. Notation and basic defininions (scalar, vector, matrix, equality of vectors and matrices, transpose). Basic operations with vectors and matrices. Rank. Inverse. Positive definite matrices. Determinants. Trace. Ortogonal vectors and matrices. Orthogonal and ortonormal matrix. Eigenvalues and eigenvectors. Spectral decomposition. High-dimensional data. Geometry of highdimensional space. Mean and variance of univariate random variable. Covariance and correlation. Mean vectors. Covariance matrix. Correlation matrix. Linear combinations of variables. Distance between vectors. Multivariate normal distribution. Density. Properties. Multivariate analysis of variance. Review of tests on one or two mean vectors. ANOVA. MANOVA. Experiment design. Multiple regression. Statistical model. eksperimenta. Večkratna regresija. Statistični model. Parcialni odvod. Metoda najmanjših kvadratov. Testiranje domnev. Determinacijski koefdiocient. Diskriminantna analiza. Diskriminantna funkcija za dva razreda in posplošitev na več razredov. Standardizirana diskriminantna funkcija. Interpretacija diskriminantne funkcije. Diskriminantna analiza in večkratna regresija. Kanonična korelacijska analiza. Kanonična korelacija in kanonične spremenljivke. Lastnosti kanoničnih korelacij. Interpretacija (standardizirani koeficienti, rotacija). Analiza glavnih komponent. Glavne komponente in njihov geometrijski pomen. Izločanje glavnih komponent. Izbira števila glavnih komponent. Interpretacijs glavnih komponent. Rotacija. Faktorska analiza. Faktorski model. Ocenjevanje nasičenosti in komunalitet. Metoda glavnih komponent. Izbira števila faktorjev. Rotacija faktorjev. Faktorski dosežki.. Razvrščanje v skupine. Mere podobnosti in različnosti. Hierarhično razvrščanje. Nehierarhično razvrščanje. Izbira števila skupin. Temeljna literatura Izenman, A. J. (2008). Modern Multivariate Statistical Techniques. New York, NY: Springer. Hair, J. F. (2006). Multivariate data analysis. Englewood Cliffs, NJ: PrenticeHall. Hastie, T., Tibshirani, R. in Friedman, J. (2009). The Elements of Statistical Learning. New York, NY: Wiley. Omladič, V. (1997). Uporaba linearne algebre v statistiki. Ljubljana: Fakulteta za družbene študije. Required literature Izenman, A. J. (2008). Modern Multivariate Statistical Techniques. New York, NY: Springer. Hair, J. F. (2006). Multivariate data analysis. Englewood Cliffs, NJ: PrenticeHall. Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning. New York, NY: Wiley. Omladič, V. (1997). Uporaba linearne algebre v statistiki. Ljubljana: Fakulteta za družbene študije. Predvideni študijski dosežki Znanje in razumevanje: se seznani s teoretskimi osnovami in s praktičnimi vidiki statističnih metod iz področja multivariatne statistike; se usposobi za izvedbo najzahtevnejše statistične analize: za izvedbo raziskav, kjer se obravnava povezava med večimi statističnimi spremenljivkami hkrati; se nauči uporabljati nekaj najaktualnejših programskih orodij za to najzahtevnejšo statistično analizo. Intended learning outcomes Knowledge and understanding: understanding and knowledge of the basic concepts and classical methods of the contemporary multivariate analysis; understanding and correct application of different multivariate statistical methods and procedures, knowledge transfer of statistical methods into different scientific fields dealing with multivariate data; knowledge of using an appropriate software for statistical analysis. Prenesljive/ključne spretnosti in drugi atributi: prenos znanja multivariatne analize na različna strokovna in znanstvena področja, Transferable/Key skills and other attributes: knowledge transfer of multivariate analysis methods into different areas dealing with Partial derivative. Method of least squares. Tests of significance. Determination coefficient. Discriminant analysis. Discriminant function for two classes. Discriminant analysis for several groups. Standardized discriminant function. Interpretation of discriminant functions. Relationship between discriminant analysis and multiple regression. Canonical correlation analysis. Canonical correlation and canonical variate. Properties of canonical correlations. Interpretation (standardized coefficients, rotation). Principal component analysis. Principal components. Geometric basis of principal component. Extraction of principal components. Choosing the number of components. Interpretation of principal components. Rotation. Factor analysis. Factor model. Estimation of loadings and communalities. Principal component method. Choosing the number of factors. Rotation. Factor scores. Cluster analysis. Measures of similarity and disimilarity. Hierarchical clustering. Nonhierarchical clustering. Choosing the number of clusters. kjer se uporabljajo statistična analiza. data analysis. Metode poučevanja in učenja predavanja z aktivno udeležbo študentov (razlaga, diskusija, vprašanja, primeri, reševanje problemov); vaje, kjer bodo študentje pri konkretnih statističnih problemih ponovili, utrdili in dodatno osvetlili pojme in metode, spoznane na predavanjih; Laboratorijske vaje: študentje bodo spoznali nekaj najaktualnejših programskih orodij za statistično obdelavo podatkov. Vaje bodo potekale v manjših skupinah, tako da bo imel vsak študent na razpolago en računalnik. Študentje v manjših skupinah pripravijo projekt, ki vključuje konkreten statistični problem. Študentje problem rešijo z metodami, spoznanimi na predavanjih in vajah. Pogoji za vključitev v delo oziroma za opravljanje študijskih obveznosti Študent/študentka mora pred pristopom k izpitu pripraviti in zagovarjati projekt. Načini ocenjevanja in ocenjevalna lestvica pisni izpit (50 %); dva kolokvija, projektna naloga (50 %); ocenjevalna lestvica v skladu s Pravilnikom o preverjanju in ocenjevanju znanja. Learning and teaching methods lectures with active students participation (explanations, discussion, questions, examples, problem solving); tutorials (students will recall, reinforce, and shed light on the concepts and methods taught on lectures); lab work (students will learn modern methods of computer use for statistical data analysis. The lab work is organized in small groups with one computer per student. Students should prepare and defense project report. The project work includes real-life statistical analysis and covers the methods presented in class). Nosilec in predavatelj predmeta: Author of the curriculum and lecturer Izr. Prof. dr. Janez Povh Assoc. prof., Janez Povh, Ph.D. Prerequisites A succesful seminar preparation and defense is a prerequisite. Assessment and grading scale written exam (50%); two preliminary exams, project work (50%); grading scale according to Rules on knowledge assessment and grading.