Сертифікаційна програма Data Engineering (Інженерія Даних) є 10-місячною та має об’єм у 36 навчальних кредитів ECTS.
Навчальні курси можна розділити за наступними основними темами:
- Основи
Це набір курсів, який забезпечить базові знання для Data engineers, такі як Розподілені Алгоритми та Структури Даних, Машинне Навчання, та Функціональне програмування. Мета цього блоку — підготувати слухачів до глибшого розуміння концепцій та технологій з інших модулів.
- Зберігання даних
Блок курсів, який забезпечує спектр компетенцій, що відповідають за реляційні/нереляційні бази даних, Data Warehousing, рішення в клауді і все, що пов’язано із зберіганням, підтримкою, обробкою і проектуванням баз даних.
- Паралельна обробка даних
Дуже поширене завдання для Data Engineer — спроектувати та побудувати систему обробки даних. В залежності від типу і об’єму даних використовують пакетну та потокову обробку даних. Ми пропонуємо окремо курс зі стеку технологій Hadoop та Spark/PySpark, з автоматизації запуску, моніторингу і створенню потоків робіт та детальному вивченню потоків даних на базі технологій Spark Streaming та Kafka.
- Інфраструктура
Цей модуль забезпечує знання, потрібні для поєднання всіх вивчених технологій на інших блоках в повноцінне кінцеве рішення для замовника. На технічному рівні — це розгортання створених рішень(Docker, Kubernetes) та налаштування CI/CD(Terraform). На бізнес рівні — це курс, на якому розглядаються патерни дизайну системи і атрибути якості, згідно з якими проектувати систему, щоб вона відповідала потребам користувачів.
Всі курси на програмі є обов’язковими. (є опція взяти частину або просто один курс)
Нижче наведені курси академічної програми із зазначеною кількістю кредитів (ECTS) за кожний курс та семестр, в якому курс вивчається.
Основи
- Functional Programming for stream processing, 3 ECTS, І модуль
- ML for Data Engineers, 3 ECTS, IІ модуль
- Distributed Algorithms & Data Structures, 3 ECTS, ІII модуль
Зберігання Даних
- Distributed Databases, 3 ECTS, ІI модуль
- Cloud Platforms, 3 ECTS, ІV модуль
- Data Warehousing, 3 ECTS, І модуль
Паралельна обробка даних
- Big Data with Hadoop & Spark, 3 ECTS, IІ модуль
- Building Automated Data Pipelines, 3 ECTS, ІV модуль
- Data Streaming with Kafka, 3 ECTS, IIІ модуль
Інфраструктура
- Architecture Design, 3 ECTS, ІII модуль
- Distributed Systems, 3 ECTS, І модуль
- Dev/DataOps, 3 ECTS, IV модуль
Важливі моменти щодо навчання на курсах
- Навчальний процес на програмі поділяється на 4 модулі, які мають наступний графік:
- І модуль: 18-30.09.2022 – 13.11.2022
- ІІ модуль: 25.11.2022 – 05.02.2023
- ІІІ модуль: 17.02.2023 – 16.04.2023
- IV модуль: 28.04.2023 – 25.06.2023
- Багато курсів поєднані між собою. Це означає, що один курс є попередньою вимогою для іншого курсу. Тобто неможливо записатися на курс, якщо не отримані попередні навички з інших курсів. Інформація про такі попередні знання наводяться на сторінці кожного окремого курсу.
- Основною мовою програмування на сертифікаційній програмі є Python. Але також для деяких курсів потрібні знання Scala/Java. В такому випадку відповідна інформація наводиться на сторінці окремого курсу.
- Для 100% курсів ведеться відео-запис занять. Студенти в подальшому мають доступ до всіх матеріалів курсу (слайди презентацій, завдання, додаткова література, записані відео-лекції) через систему управління навчанням.
- Для оперативної комунікації між студентами та викладачами різних курсів використовується сервіс Slack.
- Для більшої інформації запрошуємо звертатися до нас через електронну пошту: de.apps@ucu.edu.ua.