Kolesa Group
Немного о Data Science
Мы строим data-driven подход с фокусом на аналитику, Data Science и Machine Learning. Кстати, по мнению Harward Business Review, Data Science считается самой привлекательной профессией 21 века.

Она находится на стыке бизнеса, математики и программирования, и требует от своих последователей глубоких знаний и аналитического склада ума. Как стать Data Scientist? Начните с подборки от нашей команды.
Петр Царенко,
директор по данным в Kolesa Group
Немного о Data Science
Мы строим data-driven подход с фокусом на аналитику, Data Science и Machine Learning. Кстати, по мнению Harward Business Review, Data Science считается самой привлекательной профессией 21 века.

Она находится на стыке бизнеса, математики и программирования, и требует от своих последователей глубоких знаний и аналитического склада ума. Как стать Data Scientist? Начните с подборки от нашей команды.
Петр Царенко,
директор по данным в Kolesa Group
Основные специализации в Data Science
Data Science — это зонтичный бренд, объединяющий множество специальностей, каждая из которых имеет свои особенности, требования к специалистам и направлена на определенную область бизнеса
ML-инженеры
Создают модели машинного обучения как продукт или часть продукта. Например, строят рекомендательные системы или сервисы по автоматизированной проверке объявлений
Data Scientist
Также используют модели машинного обучения в своей работе, но с целью анализа или улучшения конкретных бизнес-показателей. Могут заниматься ценообразованием, кластеризацией пользователей, формированием пакетов платных услуг
Product-аналитики
Постоянно наблюдают за показателями продукта, ищут слабые места, находят точки роста, проверяют гипотезы через A/B-тесты. Продуктовый аналитик всегда стремится к улучшению продукта
Python developer
"Python" необязательно работает в плотной связке с аналитиками и ML-инженерами. Его роль заключается в доставке ML-моделей до продакшна и обеспечение работоспособности микросервисов
DWH-инженер
Обеспечивает работоспособность всей инфраструктуры данных в компании: доступность и надежность данных, ETL-процессы, оптимизация запросов, агрегация данных, стандартизация процедур
CDO (Chief Data Officer)
Организует работу отдела, транслирует цели бизнеса и продуктов команде, приоритезирует задачи, отвечает за стратегию работы с данными и за эффективность работы отдела
Карта влияния для каждой из специализаций
Чем занимается в компании?
Чем занимается Data Scientist?
Data Scientist — специалист в области работы с данными, ориентированный на бизнес-задачи, на поиск точек роста продуктов и бизнеса.

Направления деятельности:
  • Исследования и анализ текущих показателей
  • Монетизация продуктов
  • Анализ KPI и поиски путей достижения
  • Построение прогнозов и предиктивная аналитика
  • Оптимизация бизнес-процессов компании
  • Создание автоматизированных дэшбордов
  • Кластеризация пользователей
Чем занимается Product-аналитик?
Product-аналитик — специалист, работающий на стыке данных и продукта.

Направления деятельности:
  • Поиск точек роста и слабых мест продукта
  • Анализ изменения показателей после релизов
  • Анализ поведения пользователей на сайте и в приложениях
  • Тестирование гипотез и проведение AB-тестов
  • Построение сценариев поведения CJM
  • Построение воронок и графов для анализа UX/UI продукта
  • Работа над оптимальным привлечением пользователей и их удержанием
Чем занимается ML-инженеры?
ML-инженер — специалист, который создает продукты на основе ML-алгоритмов.

Направления деятельности:
  • Создание рекомендательных систем
  • Классификация изображений
  • Поиск фрода
  • Автоматизация рутинной работы
  • Распознавание текста с изображений
  • Поиск объектов на фото
  • Преобразование голоса в текст
Требования для Junior-специалистов
Требования к Data Scientist и к Product-аналитику, Junior 1
  • Базовые методы работы с данными (SQL, EXCEL, Google таблицы):
- простые запросы SELECT + WHERE
- работа со сводными таблицами в Excel + диаграммы
- ВПР (VLOOKUP)

  • Понимание базовых метрик анализа (средняя, медиана, квантили, меры разброса, понимание, как анализировать количественные, а как качественные показатели)
  • Навыки построения простых визуализаций из «чистых» данных
  • Базовые знания в области математической статистики и теории вероятности
  • Умение формулировать и задавать вопросы
  • Умение «читать» графики и видеть тенденции и тренды
  • Умение уточнять задачу
  • Способность сравнивать показатели и делать базовые выводы
Требования к ML-инженеру, Junior 1
  • Знание синтаксиса Python
  • Знание библиотек (pandas, numpy, sklearn)
  • Понимание оценивающих метрик (Accuracy, ROC AUC, F1 score)
  • Визуализация и анализ данных
  • Умение исследовать проблему
  • Умение формулировать и задавать вопросы
  • Понимание принципов работы алгоритмов классификации, регрессии, кластеризации
Где учиться?
Математика для DS и PA. Курсы
Основы статистики:
https://stepik.org/course/76/syllabus


Основы статистики часть 2:
https://stepik.org/course/524/syllabus


Основы статистики часть 3:
https://stepik.org/course/2152/syllabus


Комбинаторика для начинающих:
https://www.coursera.org/learn/kombinatorika-dlya-nachinayushchikh


Теория Вероятностей для начинающих:
https://www.coursera.org/learn/probability-theory-basics


Введение в МатАн:
https://stepik.org/course/95/promo


Теория Вероятностей:
https://stepik.org/course/3089/promo


Линейная Алгебра:
https://stepik.org/course/2461/promo
Product-аналитика
Курс Digital аналитика:
http://thisisdata.ru/courses/digital-analytics/ https://junday.page.link/PA_DigitalAnalytics


Курсы от Google Analytics academy:
https://analytics.google.com/analytics/academy/


Специализация Аналитик Данных. Яндекс. Практикум:
https://praktikum.yandex.ru/data-analyst


GO Practice симулятор:
https://simulator.gopractice.ru/


Специализация Data Analyst от Udacity:
https://www.udacity.com/course/data-analyst-nanodegree--nd002


Курс «Введение в веб-аналитику»:
https://www.coursera.org/lecture/digital-marketing-strategy/vviedieniie-v-web-analitiku-asKRx


A/B тестирование сайтов. Краткое практическое руководство с реальными примерами:
http://tilda.education/articles-yourfirstabtest


A/B тестирование:
https://www.youtube.com/playlist?list=PLmXOZC8Wm5k9z-o0ck6PweD2g_LLopQXb


Сравнительный анализ систем мобильной аналитики:
https://apptractor.ru/measure/user-analytics/mobilnaya-analitika-dlya-prilozheniy-sravnitelnyiy-analiz-adjust-appmetrica-flurry-amplitude-i-dr.html


Специализация «Анализ данных»:
https://www.coursera.org/specializations/analiz-dannykh?action=enroll


Основные продуктовые метрики:
https://clck.ru/JqgxF


5 способов больше узнать о пользователях:
https://skillbox.ru/media/management/5_sposobov_bolshe_uznat_o_polzovatelyakh/


Платный курс по product-аналитике:
https://productanalytics.geekbrains.ru
Data Science и Machine Learning
Машинное обучение для людей. Разбираемся простыми словами:
https://vas3k.ru/blog/machine_learning/ https://junday.page.link/ML_ForPeople


Видео-курс К.В. Воронцова «Машинное обучение» от Школы Анализа Данных Яндекса:
https://www.youtube.com/watch?v=qLBkB4sMztk&list=PLww5O9qI8iPP-mZf8mCMff3eMWFBHr0m1


Kaggle Learn:
https://www.kaggle.com/learn/


Open Machine Learning Course:
https://mlcourse.ai/


Нейронные сети:
https://stepik.org/course/401/syllabus


Специализация ML и Data Analysys on Yandex и МФТИ:
https://www.coursera.org/specializations/machine-learning-data-analysis


Специализация Data Science. Яндекс. Практикум:
https://praktikum.yandex.ru/data-scientist


Специализация DataScience от Johns Hopkins University:
https://www.coursera.org/specializations/jhu-data-science


Специализация Data Science от Udacity:
https://www.udacity.com/school-of-data-science


Курс Analytics Edge:
https://www.edx.org/course/the-analytics-edge-2


Открытый курс машинного обучения:
https://habr.com/en/company/ods/blog/322626/


Введение в машинное обучение:
https://www.coursera.org/learn/vvedenie-mashinnoe-obuchenie


Примеры кодовых решений, теории различных мл алгоритмов и ds теория, курсы и кейсы:
https://www.kdnuggets.com
https://www.analyticsvidhya.com/blog


Введение в Deep Learning с pytorch с примерами:
https://pytorch.org/tutorials/beginner/deep_learning_60min_blitz.html


Курс по глубинному обучению:
https://www.coursera.org/specializations/deep-learning


Видео. Как работают нейронные сети:
https://www.youtube.com/watch?v=aircAruvnKk


Видео-курс. NLP Stanford:
https://www.youtube.com/watch?v=8rXD5-xhemo&list=PLoROMvodv4rOhcuXMZkNm7j3fVwBBY42z


Программирование для DS и аналитики
Программирование на Python:
https://stepik.org/course/67/syllabus https://junday.page.link/Dev_Python


Питонтьютор. Курс-тренажер:
https://pythontutor.ru/


Python для Анализа данных:
https://skillfactory.ru/python-analytics


Pandas:
https://tomaugspurger.github.io/modern-1-intro.html


Основы программирования на R:
https://stepik.org/course/497/syllabus


Анализ Данных в R:
https://stepik.org/course/497/syllabus


Анализ Данных в R. Часть 2:
https://stepik.org/course/724/syllabus
Полезные Telegram-каналы