Data Analyst & Scientists
Transcription
Data Analyst & Scientists
Data Analyst & Scientists 220שעות לימוד אקדמיות ראש המסלול :ד"ר רונן מאיר תיאור ההכשרה בעולם העסקי של היום ,נתונים ,מידע וחיזוי הם העתיד של כל ארגון .כמויות המידע שנאספות בארגונים ובאנושות כולה גדלות בקצב מסחרר והשליטה בהם הופכת לחשובה מאי פעם .רוב יישומי התוכנה בעולם נדרשים לבצע פעולות קריטיות של עיבוד ,אחסון, ניתוח ,חיזוי ,דיווח והצגת הנתונים .מסלול הכשרה זה ,הינו כרטיס הכניסה לעולם המרתק של Data Analysis & Scienceהמשלב בין טכנולוגיה לעסקים. תיאור תפקיד Data Analyst & Scientists Data Science & Analyticsהינה היכולת להפיק ידע מנתונים ומידע .מסלול מקצועי וייחודי זה ,מכשיר לתפקיד של אנליסט ומדען נתונים ( .)Data Analyst & Scientistsבמסגרת תפקיד זה ,מדעני נתונים והאנליסטים ,מסוגלים ליישם את כישוריהם בעיבוד ,אחסון, ניתוח וחיזוי נתונים בכדי להשיג מגוון רחב של תוצאות עסקיות עבור הארגון .כמו כן ,הינם בעלי יכולת לייצר פרטים חזותיים ,לטפל במקורות המידע השונים ,לנתח את המידע ולהציג להנהלה את הידע הרלוונטי לקבלת החלטות. בשנים האחרונות ,הקימו ארגונים רבים מחסני נתונים ומערכות BIאך עם זאת ,מרביתם אינם יודעים כיצד להשתמש בתבונה בנתונים אשר אגרו .מסלול הכשרה זה ,כולל בתוכו את המיומנויות הנדרשות לטפל ולנתח מידע בכלי BIולהשתמש במודלים לחיזוי ) (Predictive Analyticsועוד ... קהל יעד המסלול מיועד לאקדמאים בתחומי הניהול/כלכלה/סטטיסטיקה/מתמטיקה/מדעי המחשב ו/או למועמדים בעלי רקע טכנולוגי ועסקי מוכח. דרישות קדם הכרות טובה עם אקסל -חובה. ראש מסלול ההכשרה ד"ר רונן מאירי בעל דוקטורט מאוניברסיטת תל אביב בתחום חקר ביצועים ,התמחות ב- ,Data Miningבעל תואר MBAותואר MScבפיסיקה במכניקה סטטיסטית מאוניברסיטת תל אביב .דר' מאירי בעל ניסיון של 51שנה בפיתוח מודלים לחיזוי בתחומים שונים לרבות שיווק ישיר ,פיננסים ,WEB ,טלקום ,אקטואריה ,רשתות חברתיות ועוד... המסלול מועבר על ידי מדריכים מנוסים מתחום הטכנולוגי והעסקי בעלי ניסיון רב בתחום הנתונים והמידע. " "Gartnerצופים ,כי עד שנת 2002יהיה מחסור בכ 200 -אלף עובדים בתחום הData - Scienceבארצות הברית. סילבוס מפורט Part 0: Querying Data Using T-SQL Language Setting up development environment o Introducing SQL server Management Studio Querying Data Using T-SQL Language o Basic Concepts of Databases o Retrieving Data: SELECT Statement o Filtering Data: WHERE, Logical Operators and Expressions o Organizing Retrieved Data: ORDER BY, GROUP BY, TOP o Using System Supplied Scalar Functions o Multiple Table Access: JOINs and UNION o Query Writing Using Sub Queries – Single Row and Multiple Row o Updating Data Using DML Statements: UPDATE, INSERT, DELETE Part 2: Database Desgin, Code objects & Advanced T-SQL Data Modeling Basics and Data Objects o RDBMS Modelling Basics: Relations and Normalizations o SQL Server Data Types o Creating Schemas, Tables, Keys and Constraints o DDL - Data Definition Language: Create, Drop, Alter & Truncate T-SQL Programming - Implementing Code Objects: Views, Stored procedures, Functions, Triggers & Error Handling o Implementing Parameters With T-SQL Scripts o Advanced Query Writing - Complex Sub Queries, Group By, Joins and Except o Understanding The Role Of Indexes: Clustered And Non Clustered Part 3: Introduction to BigData, Hadoop & MapReduce What is BigData and why it is important to my business? Bringing BigData to my organization - concepts and guidelines. BigData on relational databases - why do and why not? Overview and market leaders. Introduction to Hadoop Introduction to MapReduce Part 4: Excel 2010 Advanced Basic Excel Overview Logical and statistical functions Financial and date functions Lookups and data tables Advanced data management Exporting and importing Analytical tools PivotTables and PivotCharts Macros and custom functions PowerView & PowerPivot Part 5: Data Warehouse & BI Fundamentals Business Intelligence(BI) and Data Warehousing(DWH) Defining Data Warehouse Concepts and Terminology Designing and Implementing a Data Warehouse Part 6: Introduction to ETL & DATA Integration (SSIS) Introduction to ETL architecture Basic Data Integration using SSIS Dynamic Processes Containers Data Flow Transformations Logging SSIS Package Events Part 7: BI OLAP (SSAS) Understanding analysis services solutions using SSAS Creating Data Sources and Data Source Views Creating a Cube Configuring Dimensions Defining Attribute Hierarchies Working with Measures Part 8: Reporting Services (SSRS) Introduction to Microsoft SQL Server Reporting Services Report design & Parameters Overview of Report Builder Part 9: IBM Cognos Software Introduction to IBM Cognos Software Capabilities of Cognos Connection Building basic reports with Query Studio Advanced Query Studio Overview of Analysis Studio Introduction to Framework Manager Part 10: Predictive Analytics , צריך להציג תחזיותAnalytics הדור הבא של.ניתוח נתונים והפקת לקחים בדיעבד אינם מספיקים החוכמה, הנתונים קיימים במערכות השונות בארגונים, כיום. תובנות והצעות לפעולה מתאימה,מגמות בחלק זה נלמד לתכנן ולבנות מודלים לחיזוי המתבססים על.היא לדעת לנבא את המגמה הצפויה לעתיד .R תסריטים עסקיים ומימושם באמצעות שפת Introduction to R o R history o S language o Syntax o Data Objects o Basic functions o Import/export o Tasks Descriptive Statistics o Summary o Box plot o Density o Multiple o Task Regression Linear o Simple regression o Nonlinear – transformations o Outlier o Over fitting o Correlation o Task Regression Logistic o The GLM family o The logistic model o Likelihood function o AIC function o Stepwise process o Task Direct Marketing - the BBB dataset o RFM model o Probability of purchasing a book – stepwise regression o Expected income –Two step regression o Task Decision Trees o Decision Tree o CHAID o BBB dataset o Task Clustering o K-means o Hierarchical Clustering o Task Time Series o Regression o ARMA o Task Other methods overview and summary o Collaborative Filtering o Text Mining o Survival Analysis o Summary