Data Analyst & Scientists

Transcription

Data Analyst & Scientists
‫‪Data Analyst & Scientists‬‬
‫‪ 220‬שעות לימוד אקדמיות‬
‫ראש המסלול‪ :‬ד"ר רונן מאיר‬
‫תיאור ההכשרה‬
‫בעולם העסקי של היום‪ ,‬נתונים‪ ,‬מידע וחיזוי הם העתיד של כל ארגון‪ .‬כמויות המידע‬
‫שנאספות בארגונים ובאנושות כולה גדלות בקצב מסחרר והשליטה בהם הופכת לחשובה‬
‫מאי פעם‪ .‬רוב יישומי התוכנה בעולם נדרשים לבצע פעולות קריטיות של עיבוד‪ ,‬אחסון‪,‬‬
‫ניתוח ‪,‬חיזוי‪ ,‬דיווח והצגת הנתונים‪ .‬מסלול הכשרה זה‪ ,‬הינו כרטיס הכניסה לעולם המרתק‬
‫של ‪ Data Analysis & Science‬המשלב בין טכנולוגיה לעסקים‪.‬‬
‫תיאור תפקיד ‪Data Analyst & Scientists‬‬
‫‪ Data Science & Analytics‬הינה היכולת להפיק ידע מנתונים ומידע‪ .‬מסלול מקצועי וייחודי‬
‫זה‪ ,‬מכשיר לתפקיד של אנליסט ומדען נתונים (‪ .)Data Analyst & Scientists‬במסגרת‬
‫תפקיד זה‪ ,‬מדעני נתונים והאנליסטים‪ ,‬מסוגלים ליישם את כישוריהם בעיבוד‪ ,‬אחסון‪,‬‬
‫ניתוח וחיזוי נתונים בכדי להשיג מגוון רחב של תוצאות עסקיות עבור הארגון‪ .‬כמו כן‪ ,‬הינם‬
‫בעלי יכולת לייצר פרטים חזותיים‪ ,‬לטפל במקורות המידע השונים‪ ,‬לנתח את המידע‬
‫ולהציג להנהלה את הידע הרלוונטי לקבלת החלטות‪.‬‬
‫בשנים האחרונות‪ ,‬הקימו ארגונים רבים מחסני נתונים ומערכות ‪ BI‬אך עם זאת‪ ,‬מרביתם‬
‫אינם יודעים כיצד להשתמש בתבונה בנתונים אשר אגרו‪ .‬מסלול הכשרה זה‪ ,‬כולל בתוכו‬
‫את המיומנויות הנדרשות לטפל ולנתח מידע בכלי ‪ BI‬ולהשתמש במודלים לחיזוי‬
‫)‪ (Predictive Analytics‬ועוד ‪...‬‬
‫קהל יעד‬
‫המסלול מיועד לאקדמאים בתחומי הניהול‪/‬כלכלה‪/‬סטטיסטיקה‪/‬מתמטיקה‪/‬מדעי המחשב‬
‫ו‪/‬או למועמדים בעלי רקע טכנולוגי ועסקי מוכח‪.‬‬
‫דרישות קדם‬
‫הכרות טובה עם אקסל ‪ -‬חובה‪.‬‬
‫ראש מסלול ההכשרה‬
‫ד"ר רונן מאירי בעל דוקטורט מאוניברסיטת תל אביב בתחום חקר ביצועים‪ ,‬התמחות ב‪-‬‬
‫‪ ,Data Mining‬בעל תואר ‪ MBA‬ותואר ‪ MSc‬בפיסיקה במכניקה סטטיסטית מאוניברסיטת תל‬
‫אביב‪ .‬דר' מאירי בעל ניסיון של ‪ 51‬שנה בפיתוח מודלים לחיזוי בתחומים שונים לרבות‬
‫שיווק ישיר‪ ,‬פיננסים‪ ,WEB ,‬טלקום‪ ,‬אקטואריה‪ ,‬רשתות חברתיות ועוד‪...‬‬
‫המסלול מועבר על ידי מדריכים מנוסים מתחום הטכנולוגי‬
‫והעסקי בעלי ניסיון רב בתחום הנתונים והמידע‪.‬‬
‫"‪ "Gartner‬צופים‪ ,‬כי עד שנת‬
‫‪ 2002‬יהיה מחסור בכ‪ 200 -‬אלף‬
‫עובדים בתחום ה‪Data -‬‬
‫‪ Science‬בארצות הברית‪.‬‬
‫סילבוס מפורט‬
Part 0: Querying Data Using T-SQL Language


Setting up development environment
o Introducing SQL server Management Studio
Querying Data Using T-SQL Language
o Basic Concepts of Databases
o Retrieving Data: SELECT Statement
o Filtering Data: WHERE, Logical Operators and Expressions
o Organizing Retrieved Data: ORDER BY, GROUP BY, TOP
o Using System Supplied Scalar Functions
o Multiple Table Access: JOINs and UNION
o Query Writing Using Sub Queries – Single Row and Multiple Row
o Updating Data Using DML Statements: UPDATE, INSERT, DELETE
Part 2: Database Desgin, Code objects & Advanced T-SQL


Data Modeling Basics and Data Objects
o RDBMS Modelling Basics: Relations and Normalizations
o SQL Server Data Types
o Creating Schemas, Tables, Keys and Constraints
o DDL - Data Definition Language: Create, Drop, Alter & Truncate
T-SQL Programming - Implementing Code Objects:
Views, Stored procedures, Functions, Triggers & Error Handling
o Implementing Parameters With T-SQL Scripts
o Advanced Query Writing - Complex Sub Queries, Group By, Joins and Except
o Understanding The Role Of Indexes: Clustered And Non Clustered
Part 3: Introduction to BigData, Hadoop & MapReduce

What is BigData and why it is important to my business?

Bringing BigData to my organization - concepts and guidelines.

BigData on relational databases - why do and why not?

Overview and market leaders.

Introduction to Hadoop

Introduction to MapReduce
Part 4: Excel 2010 Advanced










Basic Excel Overview
Logical and statistical functions
Financial and date functions
Lookups and data tables
Advanced data management
Exporting and importing
Analytical tools
PivotTables and PivotCharts
Macros and custom functions
PowerView & PowerPivot
Part 5: Data Warehouse & BI Fundamentals



Business Intelligence(BI) and Data Warehousing(DWH)
Defining Data Warehouse Concepts and Terminology
Designing and Implementing a Data Warehouse
Part 6: Introduction to ETL & DATA Integration (SSIS)






Introduction to ETL architecture
Basic Data Integration using SSIS
Dynamic Processes
Containers
Data Flow Transformations
Logging SSIS Package Events
Part 7: BI OLAP (SSAS)






Understanding analysis services solutions using SSAS
Creating Data Sources and Data Source Views
Creating a Cube
Configuring Dimensions
Defining Attribute Hierarchies
Working with Measures
Part 8: Reporting Services (SSRS)



Introduction to Microsoft SQL Server Reporting Services
Report design & Parameters
Overview of Report Builder
Part 9: IBM Cognos Software






Introduction to IBM Cognos Software
Capabilities of Cognos Connection
Building basic reports with Query Studio
Advanced Query Studio
Overview of Analysis Studio
Introduction to Framework Manager
Part 10: Predictive Analytics
,‫ צריך להציג תחזיות‬Analytics ‫ הדור הבא של‬.‫ניתוח נתונים והפקת לקחים בדיעבד אינם מספיקים‬
‫ החוכמה‬,‫ הנתונים קיימים במערכות השונות בארגונים‬,‫ כיום‬.‫ תובנות והצעות לפעולה מתאימה‬,‫מגמות‬
‫ בחלק זה נלמד לתכנן ולבנות מודלים לחיזוי המתבססים על‬.‫היא לדעת לנבא את המגמה הצפויה לעתיד‬
.R ‫תסריטים עסקיים ומימושם באמצעות שפת‬
 Introduction to R
o R history
o S language
o Syntax
o Data Objects
o Basic functions
o Import/export
o Tasks
 Descriptive Statistics
o Summary
o Box plot
o Density
o Multiple
o Task
 Regression Linear
o Simple regression
o Nonlinear – transformations
o Outlier
o Over fitting
o Correlation
o Task
 Regression Logistic
o The GLM family
o The logistic model
o Likelihood function
o AIC function
o Stepwise process
o Task
 Direct Marketing - the BBB dataset
o RFM model o Probability of purchasing a book – stepwise regression
o Expected income –Two step regression
o Task
 Decision Trees
o Decision Tree
o CHAID
o BBB dataset
o Task
 Clustering
o K-means
o Hierarchical Clustering
o Task
 Time Series
o Regression
o ARMA
o Task
 Other methods overview and summary
o Collaborative Filtering
o Text Mining
o Survival Analysis
o Summary