Data Analysis
Освойте анализ данных с нуля за 6 месяцев
Информация о преподавателе
Казбекова Диана
Data Analyst, преподаватель-практик
Более 5 лет опыта в анализе данных, ETL, A/B-тестах и продуктовой аналитике
Навыки
Python
NumPy
pandas
matplotlib
seaborn
SQL
PostgreSQL
psycopg2
Web scraping
BeautifulSoup
EDA
Statistics
A/B tests
Machine Learning
Gemini
Claude
Cursor
Работала как в исследовательской среде, так и в коммерческих и образовательных проектах — от научных публикаций в ВШЭ до внедрения ETL-пайплайнов в продуктовых командах и преподавания в ведущих университетах Казахстана. Имеет сильную математическую и инженерную базу: бакалавр прикладной математики МГУ и магистр компьютерных наук ВШЭ.
Специализируется на полном цикле работы с данными: сбор и парсинг, очистка и трансформация, SQL-оптимизация, статистический анализ, визуализация и интерпретация результатов для бизнеса. Имеет практический опыт построения ETL-пайплайнов, проведения A/B-тестов, работы с продуктовыми метриками и разведочного анализа данных (EDA). Методика преподавания выстроена вокруг реальных кейсов и проектной работы: студенты работают с настоящими датасетами, строят пайплайны, проводят статистические тесты и защищают аналитические выводы. Под её руководством обучено более 50 IT-специалистов с показателем завершаемости курса 87%. Является независимым экспертом WorldSkills Kazakhstan 2025 по направлению «Анализ данных» и сертифицированным Data Analyst от DataCamp. Отличается системным мышлением, вниманием к качеству данных и умением переводить аналитику в понятные бизнесу выводы.
О проекте
Data Analysis — это 6-месячная программа для тех, кто хочет освоить профессию аналитика данных с нуля. Курс охватывает полный цикл работы с данными: программирование на Python, библиотеки NumPy и pandas, визуализацию через matplotlib и seaborn, web scraping и SQL, разведочный анализ (EDA), статистические тесты и введение в Machine Learning. Особенность программы — обучение через реальные кейсы и проектную работу: студенты работают с настоящими датасетами, строят ETL-пайплайны, проводят A/B-тесты и защищают аналитические выводы. AI-инструменты (Gemini, Claude, Cursor) встроены в ежедневную практику. По завершении студент создаёт полноценный итоговый проект — от парсинга данных до построения ML-модели и презентации результатов.
210 академических часов
Язык обучения – Русский
Длительность курса - 26 недель
Стоимость курса – 400.000 KZT
Процесс отбора студентов предполагает 2 этапа
Мотивационное письмо
Мотивационное письмо, не менее 7 из 10
Интервью
Интервью с преподавателем и куратором курса.
Критерии отбора студентов
-
Получение не менее 7 баллов из 10 при оценке мотивационных писем.
-
Положительное решение о допуске к курсу по итогам интервью с преподавателем и куратором курса.
-
Вступительные экзамены и тестовые задания не предусмотрены
-
Особые условия, скидки, рассрочка, депозитная система, предоплата и гарантийный взнос не предусмотрены
Мотивационное письмо
Мотивационное письмо, не менее 7 из 10
Интервью
Интервью с преподавателем и куратором курса.
Получение не менее 7 баллов из 10 при оценке мотивационных писем.
Положительное решение о допуске к курсу по итогам интервью с преподавателем и куратором курса.
Вступительные экзамены и тестовые задания не предусмотрены
Особые условия, скидки, рассрочка, депозитная система, предоплата и гарантийный взнос не предусмотрены
Кому подойдет курс?
Кто уже работает
Кто хочет сменить профессию, и кому требуется удаленная работа в IT-сфере
Студенты
Которые хотят развиваться в новом и современном направлении
Разработчикам
Кто хочет закрепить свои знания практикой
Кто уже работает
Кто хочет сменить профессию, и кому требуется удаленная работа в IT-сфере
Студенты
Которые хотят развиваться в новом и современном направлении
Разработчикам
Кто хочет закрепить свои знания практикой
Программа курса
-
Обзор Python, установка, Jupyter Notebook, VS Code и расширения
-
Markdown, горячие клавиши и базовая навигация в Jupyter
-
Переменные, типы данных, приведение типов
-
Операторы и выражения, функции input и print
-
Работа со строками: методы класса str и форматирование
-
Арифметические операции и операторы сравнения
-
Конструкции if, elif, else и отступы
-
Решение задач на ветвление и приведение типов
-
Методы класса list и итерируемые объекты
-
Циклы for и while, break, continue, pass, range и enumerate
-
Определение функций, параметры и возвращаемые значения
-
Глобальные и локальные переменные, lambda-функции
-
Изменяемые и неизменяемые типы данных
-
Кортежи, множества и словари: создание, методы, операции
-
List, dict и set comprehension; map, zip, filter, reduce
-
Закрепление пройденных тем и контрольный срез
-
NumPy: одномерные и многомерные массивы, алгебра векторов, универсальные функции
-
pandas: объекты Series и DataFrame
-
Выгрузка, индексирование, структурирование и приведение типов
-
Группировка, агрегация, объединение и слияние DataFrame
-
Библиотеки pandas, matplotlib и seaborn
-
Графики, гистограммы, boxplot и диаграммы рассеяния
-
Чтение и интерпретация графиков
-
Выбор типа визуализации под аналитическую задачу
-
Случайные числа и вероятность
-
Меры изменчивости, распределение данных, среднее, медиана, дисперсия
-
Корреляция признаков
-
Интерпретация статистических результатов
-
Библиотеки requests и BeautifulSoup
-
Парсинг веб-страниц и работа с HTML-тегами
-
Выгрузка и сохранение данных в форматах CSV, XLSX, DAT и TXT
-
Введение в реляционные базы данных и библиотеку psycopg2
-
CRUD-операции SQL, агрегации и join-ы
-
Создание DataFrame из базы данных
-
Интеграция SQL с pandas и контрольный срез по блоку
-
Введение в Exploratory Data Analysis и работа с датасетом
-
Отношения в данных, очистка и модификация
-
Выявление зависимостей и подготовка к моделированию
-
Получение выборки, выборочное распределение и bootstrap distribution
-
Основы тестирования гипотез
-
ANOVA, тест пропорций и непараметрические тесты
-
Обзор современных средств: Gemini, Claude, Cursor
-
Промпты для EDA, генерации SQL и Python-кода
-
Проверка и интерпретация AI-результатов аналитиком
-
Обучение с учителем и без, задачи ML и построение модели
-
Датасет, признаки и таргет
-
KNN, линейная регрессия и оценка качества предсказаний
-
Формулировка задачи, импорт данных через web scraping, категоризация признаков
-
Очистка: пропуски, дубликаты, нормализация значений
-
EDA: статистики, корреляции, визуализация boxplot, scatter и barplot
-
Построение модели, интерпретация, презентация и защита выводов