Как я помог подготовить диплом по аналитике данных: от разрознённых файлов до законченного проекта

Ко мне обратился студент, который проходил обучение по направлению «Бизнес-аналитика и визуализация данных» в рамках профессиональной программы повышения квалификации.
Студент уже работал по специальности — аналитиком в коммерческой компании, где регулярно сталкивался с большими наборами данных, Excel-моделями и необходимостью строить отчёты для руководства.

Для диплома он выбрал тему, связанную с анализом данных своей компании (данные были анонимизированы и частично модифицированы для использования в учебных целях).
Но, как это часто бывает, набор исходников был большим, разрозненным и требовал серьёзной доработки, чтобы превратиться в полноценный аналитический проект.

В итоге работа над дипломом превратилась в комплексный проект по подготовке данных, созданию моделей, визуализаций и оформлению итогового документа.

Исходная ситуация

Аудит исходных материалов показал, что студент располагает: разрозненными Excel-расчётами, несколькими неполными PBIX-файлами, отсутствующей моделью данных, незавершённым текстом диплома, рабочей гипотезой без аналитической структуры.

Требовалось провести полную сборку проекта: данные → модель → визуализация → текст.

Цель: собрать всё в единый законченный диплом, который можно успешно защитить.

Какие задачи нужно было решить

  • Подготовить корректный набор данных. Очистка, нормализация и объединение таблиц. Корректировка типов данных. Устранение противоречий между файлами.
  • Построить аналитическую модель. Создание Power BI-отчёта. Построение полноценной схемы связей. Разработка DAX-мер и показателей. Формирование дашбордов для итоговой презентации.
  • Создать текстовую часть диплома. Теоретическая основа. Описание методики анализа данных. Практическая аналитическая глава. Выводы и рекомендации.
  • Подготовить материал к защите Презентация. Экспорт визуализаций. Структурированная итоговая папка проекта.

Хронология проекта

  • Первое обращение — 15 сентября 2025. Студент прислал архив с исходниками и запросил оценку.
  • Аудит файлов — 15—17 сентября (2 дня). Изучение Excel, .pbix, логики расчётов и структуры данных.
  • Подготовка данных — 18—28 сентября (11 дней). Чистка, нормализация, объединение таблиц, создание корректных датасетов.
  • Разработка Power BI-модели — 29 сентября—7 октября (9 дней). Построение схемы данных, настройка связей, создание мер DAX, визуализации, итоговый дашборд.
  • Подготовка текстовой части — 8—16 октября (9 дней). Оформление трёх глав, описание методики, аналитическая часть, вставка графиков, выводы.
  • Подготовка к защите — 17—20 октября (4 дня). Презентация, экспорт графиков, финальная упаковка проекта.

Итоговая длительность: 36 дней.

Исходные данные находятся на Яндекс диске, все таблицы описаны с проблемами которые встречаются
Прописаны вычисляемые столбцы и как производятся преобразования и очистка данных
Отдельно прописано как вычисляются меры и что они означают
Модель данных PowerBi
Дашборды с объяснением

Что было сделано

  • Подготовка Excel-моделей. Объединение разрозненных таблиц. Создание единой структуры данных. Нормализация и валидация. Проверка расчётов и формул.
  • Создание Power BI-отчёта. Разработка схемы данных, настройка связей (one-to-many, many-to-one), создание мер для KPI и метрик, визуализации в нескольких итерациях (до финальной версии 06v14), подготовка интерактивного дашборда.
  • Подготовка текста диплома. Создание структуры глав 1—3, теоретический материал, аналитическая часть по данным компании, вставка визуализаций, итоговые выводы.
  • Подготовка материалов для защиты. Финальный документ, презентация, экспорт диаграмм Power BI и систематизация всех файлов.

Проект включал:

  • Финальный `.pbix` (версия 06v14) — готовый Power BI-отчёт с полностью настроенной моделью данных, мерами DAX, визуализациями и финальным дашбордом, использовавшийся в дипломе и презентации.
  • Excel-файлы с расчётами — очищенные и нормализованные таблицы, включающие исходные данные, промежуточные расчёты, справочники, показатели и подготовленные датасеты, которые легли в основу Power BI-модели.
  • Промежуточные версии моделей — несколько более ранних вариантов `.pbix` и Excel-файлов, наглядно отражающих этапы формирования структуры данных, проверку гипотез, корректировку связей и визуализаций.
  • README с указанием структуры проекта — служебный файл, который фиксировал версии отчётов, расположение данных, описание изменений и структуру итоговой папки, чтобы проект можно было легко воспроизвести или проверить.
Отправить
Поделиться
Твитнуть
Запинить

Считаю метрики, делаю сквозную аналитику и когортный анализ, составляю интерактивные дешборды, моделирую юнит-экономику


Обратиться с задачей