בשנים האחרונות יש גידול משמעותי בכמות הנתונים המיוצרת בעולם, שהופך לעולם המונע על ידי נתונים (Data Driven World). יחד עם הגידול בנתונים, ישנה עלייה במגוון היישומים מבוססי הנתונים בתחומים השונים: רפואה, מדיה חברתית, פיננסים, תכנון עירוני, רכבים חכמים, ערים חכמות ועוד. לאור זאת, מומחה הנתונים הפך לאחד המקצועות המבוקשים ביותר, המאתגרים ביותר והמתגמלים ביותר בחברות, ונחשב למקצוע העתיד.
מומחה הנתונים נדרש לתת פתרונות מדעיים לאתגרים הכרוכים בעבודה עם כמויות גדולות ומגוונות של נתונים, ביצוע מחקרים להפקת תובנות עסקיות מנתונים עבור הארגון (Business Intelligence), טיוב וסידור המידע המשמש למחקרים, והפעלת אלגוריתמים ומודלים שונים של כריית נתונים ו- Machine Learning על המידע שנאסף.
הכישורים הנדרשים לעולם הנתונים מתמקדים בתהליכים הבאים:
- אינטגרציה – איסוף מידע ממגוון מערכות ועבודה עם כמויות גדולות של מידע (Big Data) ועיבוד מידע לא מובנה (Unstructured).
- חקירה – תכנות וניתוח סטטיסטי, יצירת חיבור בין בסיסי נתונים שונים.
- ניתוח אנליטי – חיזוי, כריית מידע, אופטימיזציה, עיבוד מידע טקסטואלי ואנליזה לנתונים.
- הצגה – פרסום תוצאות על בסיס ניתוח המידע שנאסף.
בתוכנית נכיר את הכלים איתם עובד ה-Data Science בהתבסס על שפות הפיתוח Python ו-R. בסיומה, יגישו הסטודנטים עבודת גמר המתבססת על מחקר נתונים הכולל כל שלבי הפיתוח וההטמעה שנלמדו בתכנית.
- תואר ראשון באחד מהתחומים הבאים: מערכות מידע / כימיה / הנדסת תעשיה וניהול / הנדסה ביו רפואית / כלכלה / מנהל עסקים / פיזיקה / מתמטיקה.
- רקע בתכנות – חובה.
- מתאים לבוגרי קורס BI של היחידה ללימודי המשך בעלי תואר ראשון בהתאם לקריטריונים ורקע בתכנות.
- נדרשת אוריינטציה טכנולוגית.
- מעבר מבחן התאמה + ראיון אישי.
- כל המשתתפים יידרשו להשתתף בקורסי הרקע המהווים חלק מתוכנית הלימודים (תכנות ב-R, Python, מסדי נתונים ותכנות ב-SQL) קורסי הרקע יקנו למשתתפים את הידע הנדרש לתכנית הלימודים.
משך הלימודים כ-8 חודשים. המפגשים יתקיימו פעמיים בשבוע בשעות 17:30-21:30.
תכנית הלימודים מורכבת מ-255 שעות אקדמיות.
- תכנות ב-R
- תכנות ב-Python
- סטטיסטיקה והסתברות ב-R
- אקונומטריקה
- למידה סטטיסטית ב-R
- למידת מכונה (Machine Learning)
- למידה עמוקה
- פרויקט מסכם
מטרת התוכנית
התכנית תכין את הסטודנטים להיות מומחי נתונים עם יכולת עבודה עצמאית וכחלק מצוות מולטי דיסציפלינרי. התכנית תספק את הידע ואת הכלים הדרושים כדי לפתח פרויקטים של למידת מכונה (Machine Learning) וליישם אותו במערכות הייצור. בסוף התכנית הסטודנט יהיה מוכנים ל:
- עבודה על פרויקט מדעי נתונים.
- עבודה בסביבה משותפת.
- לכתוב פרוטוקול מחקר לפני תחילת הפרויקט.
- לספק נתונים נקיים ומכנים לאנליזה.
- לפתח מודלים מנבאים בשימוש כלים מתאימים.
- להיות מסוגל לנתח ולבצע בקרת איכות של פרויקטים.
- לכתוב דו"ח סיכום המסביר את המתודולוגיה ששימשה את הפרויקט והמודלים שפותחו יחד עם תקוף המודלים.
- הטמעת המודלים שפותחו והדרכה של משתמשי הקצה לעשות שימוש נכון ומושכל בהם.
יתרונותיה הבולטים של התוכנית
- מיקוד בכלים הנפוצים בתחום, עם התמקדות בשתי שפות התכנות הפופולריות ביותר בתחום: Python ו– R.
- קורס מעשי במהותו, המשלב יישום תרגולים רבים ובניית פרויקט אישי במקביל לידע התיאורטי הנרכש.
- הקורס מועבר בהדרכתם של מרצים מובילים וותיקים המאושרים ע"י מוסד הטכניון.
- סביבות תרגול וירטואליות מתקדמות שהוקמו במיוחד לכל מודל.
- ליווי אישי של התלמיד לאורך המסלול.