Вступна лекція. Робота з даними
Розберемося, які існують типи даних і чому вони важливі для проєкту. Дізнаємося, де можна брати дані, як всередині вашого проєкту, так і за його межами (які джерела даних існують) Розглянемо, які види Data Science існують. Порівняємо позиції Data Engineer та Data Analyst і дізнаємося їхні основні відмінності, а також — де закінчується їх зона відповідальності і починається робота менеджера. Проведемо воркшоп із підготовки даних для тренування моделі на прикладі e-commerce.
Написання SQL запитів
Вивчимо основні артефакти даних: бази даних, таблиці, атрибути. Поговоримо про Big Data і яку користь від цього можна мати. Розглянемо, коли використовувати SQL, а коли віддати перевагу NoSQL. Попрактикуємось в написанні базових запитів:
✓ Вчимося створювати вибірки даних (SELECT)
✓ З'єднуємо таблиці (JOIN)
✓ Збираємо дані (AGGREGATIONS)
Вибір правильного підходу в DS
Розглянемо, які типи навчання існують, і оберемо серед них правильний під конкретну задачу. Дізнаємося, які завдання можна вирішити за допомогою DS\ML і що потрібно для початку впровадження технології у своєму проєкті, розібравши:
✓ як визначити проблему для вирішення;
✓ як сформувати гіпотезу зростання;
✓ як оцінити вплив гіпотези на продукт;
✓ які бізнес ресурси потрібні для початку роботи над гіпотезою.
Побудова моделі
Розглянемо типову архітектуру DS\ML проєкту. Побудуємо модель власноруч, щоб зрозуміти, як створити MVP вашого Data Science проєкту. Навчимося оцінювати результат роботи моделі. Розберемося, які критерії якості моделі існують і куди повинен дивитися менеджер, щоб перевірити підсумки роботи Machine Learning команди. Проведемо воркшоп із визначення ML моделі для чотирьох типів завдань:
✓ ціноутворення;
✓ класифікація відгуків;
✓ розпізнавання зображення;
✓ побудова чат-бота
Використаємо ігрові практики і доведемо, що практично будь-яке завдання можна поліпшити, використовуючи ML модель.
Побудова Machine Learning команди всередині компанії
Дізнаємося, як побудувати Machine Learning команду і кого треба наймати для створення MVP вашого проєкту. Розберемося із зонами відповідальності на етапі MVP і за повного циклу розробки. Покроково визначимо, як впроваджувати Data Science в вашому проєкті або продукті. Розглянемо Agile практики з управління DS/ML проєктами і чим вони відрізняються від традиційної розробки.
Data Science для розрахунку LTV
Обговоримо поняття статистичної значущості і зробимо прогноз LTV за допомогою статистичних методів. Розберемо, коли цього недостатньо і варто застосувати Data Science:
✓ зробимо аналогічний прогноз LTV за допомогою DS методів;
✓ проаналізуємо нюанси передбачення відтоку клієнтів (churn);
✓ навчимося приймати рішення на основі прогнозів за допомогою churn моделей;
✓ на прикладах пояснимо, як сегментування клієнтів разом із передбаченням LTV і відтоку клієнтів може допомогти в оптимізації бізнесу.
NLP для оптимізації Support команди
Обговоримо, як за допомогою методів обробки природної мови та active learning оптимізувати роботу відділу підтримки клієнтів. Розберемося, як впровадити їх у себе в проєкті. Застосуємо кілька алгоритмів, які допоможуть з визначенням тем і обробкою коментарів. Розглянемо, коли краще використовувати алгоритми навчання без вчителя.
Візуалізація даних
Поговоримо про те, коли вам може знадобитися візуалізація даних. Розглянемо основні інструменти для візуалізації:
✓ Excel
✓ Tableau
✓ PowerBI
✓ QlikView
✓ Pentaho
✓ Birst
Розберемо кращі практики і патерни аналізу і візуалізації даних. Застосуємо обговорені знання на практичному кейсі.
Workshop "Візуалізація даних за допомогою Power BI" (запис)
Розглянемо застосування інструменту Power BI на практичному кейсі:
✓ З'єднуємо джерела
✓ Створюємо діаграми
✓ Використовуємо фільтри і агрегацію
✓ Налаштовуємо dashboards
✓ Розбираємося з delivery і експортом
Впровадження NLP в компанію
Розглянемо стандартний NLP pipeline, потім поставлене бізнес завдання і процес впровадження конкретного рішення, включно з вибором компонентів, розмітки даних для тренінгу, тренінг DNN, використані метрики, інтеграцію технічного рішення з інфраструктурою бізнесу. Розглянемо кейс на конкретному прикладі.