Перелік курсів програми «Аналіз даних»

Сертифікаційна програма Data Analytics (Аналіз Даних) складається з трьох окремих частин, вступ на кожну з яких відбувається окремо:

  1. Intro to Data Analytics (10 тижнів)
  2. Advanced Data Analytics (10 тижнів)
  3. Вибіркові курси для вузької спеціалізації (1-2 місяці)

Всі навчальні курси на перших двох рівнях програми можна розділити за наступними основними темами:

  • Математика. Це набір курсів, який забезпечить базові знання статистики, теорії ймовірностей та економетрики.
  • Бази даних. Блок курсів, який забезпечує спектр компетенцій, що відповідають за розуміння баз даних та вміння працювати з ними.
  • Інструменти. Це набір курсів, який забезпечить практичні навички користування інструментами для аналізу даних

 

 

Intro to Data Analytics

Перша частина сертифікаційної програми Data Analytics триває 10 тижнів по 3 двогодинних заняття на щотижня (близько 60 годин загалом). Дана частина не передбачає в учасників значних попередніх знань, окрім базової обізнаності Microsoft Excel, знань шкільної математики та знання англійської мови на рівні розуміння технічних текстів.

Курси Intro to Data Analytics

  • Основи теорії ймовірностей
    • Ймовірність та її властивості
    • Функція розподілу
    • Умовна ймовірність
  • Описова статистика
    • Популяція, вибірка
    • Види змінних
    • Характеристики вибірки
    • Ймовірність на основі вибірки
    • Зв’язок між двома вибірками, кореляції
  • Вивідна статистики
    • Оцінка параметрів
    • Теорема великих чисел та центральна гранична теорема
    • Інтервали довіри
    • Статистичні тести
  • Лінійна та логістична регресії
    • Оцінка якості регресії
    • Обробка даних перед регресією
    • Інтерпретація параметрів регресії
    • Відбір параметрів
    • Проблеми мільтиколінеарності, пропущених даних та викидів

Тривалість курсу: 14 годин

Викладачка: Наталія Новосад, Data Scientist у Приватбанку. Має великий досвід в клієнтській аналітиці та прогнозуванні часових рядів. Також співпрацює із зовнішніми проектами як експерт-консультант. Отримала ступінь магістра Data Science в Українському Католицькому Університеті та ступінь бакалавра прикладної математики в Львівському національному університеті ім. Івана Франка.

  • Робота з електронними таблицями
    • Основні елементи
    • Типи даних та формати клітинок
    • Автозаповнення
    • Формули та функції
    • Принцип «охайних даних», «вузькі» та «широкі» формати
  • Очищення та трансформація даних
    • Отримання зовнішніх даних
    • Сортування, фільтрування
    • Текстові функції
    • Створення нових змінних
    • Поєднання різних масивів даних (VLOOKUP)
    • Зведені таблиці (pivot tables)
  • Аналіз та візуалізація даних
    • Цілі та завдання аналізу даних
    • Умовне форматування (як швидко побачити особливості в даних)
    • Основні типи діаграм
    • Підготовка даних для різних типів діаграм
    • Основні функції для аналізу даних: середнє, медіана, мода
    • Візуалізація як інструмент аналізу
    • Комбіновані діаграми
    • Зведені діаграми

Тривалість курсу: 18 годин

Викладач: Андрій Горбаль, виконавчий директор Українського центру суспільних даних. Магістр соціології та медіа-менеджменту, понад 20 років професійного досвіду управління проектами — дослідницькими, інформаційно-просвітницькими, створення веб-проектів, тренінгів та навчання. В Українському центрі суспільних даних координував ряд навчальних проектів щодо роботи з даними, а також дослідницьких проектів з аналізом відкритих даних, у сферах електоральних даних, судової статистики, медичних та демографічних даних.

  • Знайомство з SQL (короткий нарис історії, потреби, задачі які розв’язує)
  • Основні поняття (таблиця, рядок, атрибу/колонка/поле, ключ, індекс …)
  • TABLE і поняття нормалізації (з прикладами)
  • Основні типи даних
  • Структура запиту SQL. Логічна побудова запиту
  • Конструкції SELECT / TOP (LIMIT) / ORDER BY
  • Конструкція WHERE та предикати (IN, LIKE, BETWEEN, …)
  • Групування даних. Конструкції GROUP BY, агрегатори (SUM, COUNT, AVG …)
  • Очищення даних за допомогою функцій
  • Конструкції UNION, EXCEPT, INTERSECT
  • Конструкція JOIN
  • Табличні вирази, підзапити

Тривалість курсу: 20 годин

Викладач: Тарас Фостяк, Data Team Lead at Epam. В IT з 2017, працював більш ніж на 10-ти проектах в різних галузях (медицини, агробізнесу, кібер безпеки, нафти та газу, ті ін.). Основні технології, які викостовував на проекті – від Microsoft. В більшості робота з SQL Server (2008-2019), Azure, Power BI. На даний момент працює з Azure Databricks (Spark 3.x) and Python, Azure Data Factory та Delta Lake.

  • Моделювання даних
  • Візуалізації та інформаційні панелі
  • Спільний доступ до звітів у хмарах та ліцензування

Тривалість курсу: 10 годин

Викладач: Тарас Озарків, Lead DW/BI Engineer у SoftServe. Понад 6 років працює у сфері ІТ. Основна спеціалізація Тараса – Design/Development, DW, BI та ETL processes. Працював з різноманітними доменами та вередливими клієнтами. Тарас є лідером спільноти Lviv Data Platform User Group (ex-Lviv SQL Server UG), а також є одним з організаторів «SQL Saturday» у Львові. Співзасновник у Power BI On AIR (YouTube-канал). Організовує зустрічі із дата-експертами в Україні, локальні зустрічі для Data-спільноти, а також активно розвиває львівську Data Community.

Викладачі Intro to Data Analytics

Advanced Data Analytics

Друга частина сертифікаційної програми Data Analytics включає наступні курси.

  • Статистика та економетрика
  • Data Analysis за допомогою Python
  • SQL
  • Огляд розподілених баз даних

Початок Advanced Data Analytics запланований на лютий 2022 року.