Как я помог подготовить диплом по аналитике данных: от разрознённых файлов до законченного проекта
Ко мне обратился студент, который проходил обучение по направлению «Бизнес-аналитика и визуализация данных» в рамках профессиональной программы повышения квалификации.
Студент уже работал по специальности — аналитиком в коммерческой компании, где регулярно сталкивался с большими наборами данных, Excel-моделями и необходимостью строить отчёты для руководства.
Для диплома он выбрал тему, связанную с анализом данных своей компании (данные были анонимизированы и частично модифицированы для использования в учебных целях).
Но, как это часто бывает, набор исходников был большим, разрозненным и требовал серьёзной доработки, чтобы превратиться в полноценный аналитический проект.
В итоге работа над дипломом превратилась в комплексный проект по подготовке данных, созданию моделей, визуализаций и оформлению итогового документа.
Исходная ситуация
Аудит исходных материалов показал, что студент располагает: разрозненными Excel-расчётами, несколькими неполными PBIX-файлами, отсутствующей моделью данных, незавершённым текстом диплома, рабочей гипотезой без аналитической структуры.
Требовалось провести полную сборку проекта: данные → модель → визуализация → текст.
Цель: собрать всё в единый законченный диплом, который можно успешно защитить.
Какие задачи нужно было решить
- Подготовить корректный набор данных. Очистка, нормализация и объединение таблиц. Корректировка типов данных. Устранение противоречий между файлами.
- Построить аналитическую модель. Создание Power BI-отчёта. Построение полноценной схемы связей. Разработка DAX-мер и показателей. Формирование дашбордов для итоговой презентации.
- Создать текстовую часть диплома. Теоретическая основа. Описание методики анализа данных. Практическая аналитическая глава. Выводы и рекомендации.
- Подготовить материал к защите Презентация. Экспорт визуализаций. Структурированная итоговая папка проекта.
Хронология проекта
- Первое обращение — 15 сентября 2025. Студент прислал архив с исходниками и запросил оценку.
- Аудит файлов — 15—17 сентября (2 дня). Изучение Excel, .pbix, логики расчётов и структуры данных.
- Подготовка данных — 18—28 сентября (11 дней). Чистка, нормализация, объединение таблиц, создание корректных датасетов.
- Разработка Power BI-модели — 29 сентября—7 октября (9 дней). Построение схемы данных, настройка связей, создание мер DAX, визуализации, итоговый дашборд.
- Подготовка текстовой части — 8—16 октября (9 дней). Оформление трёх глав, описание методики, аналитическая часть, вставка графиков, выводы.
- Подготовка к защите — 17—20 октября (4 дня). Презентация, экспорт графиков, финальная упаковка проекта.
Итоговая длительность: 36 дней.
Что было сделано
- Подготовка Excel-моделей. Объединение разрозненных таблиц. Создание единой структуры данных. Нормализация и валидация. Проверка расчётов и формул.
- Создание Power BI-отчёта. Разработка схемы данных, настройка связей (one-to-many, many-to-one), создание мер для KPI и метрик, визуализации в нескольких итерациях (до финальной версии 06v14), подготовка интерактивного дашборда.
- Подготовка текста диплома. Создание структуры глав 1—3, теоретический материал, аналитическая часть по данным компании, вставка визуализаций, итоговые выводы.
- Подготовка материалов для защиты. Финальный документ, презентация, экспорт диаграмм Power BI и систематизация всех файлов.
Проект включал:
- Финальный `.pbix` (версия 06v14) — готовый Power BI-отчёт с полностью настроенной моделью данных, мерами DAX, визуализациями и финальным дашбордом, использовавшийся в дипломе и презентации.
- Excel-файлы с расчётами — очищенные и нормализованные таблицы, включающие исходные данные, промежуточные расчёты, справочники, показатели и подготовленные датасеты, которые легли в основу Power BI-модели.
- Промежуточные версии моделей — несколько более ранних вариантов `.pbix` и Excel-файлов, наглядно отражающих этапы формирования структуры данных, проверку гипотез, корректировку связей и визуализаций.
- README с указанием структуры проекта — служебный файл, который фиксировал версии отчётов, расположение данных, описание изменений и структуру итоговой папки, чтобы проект можно было легко воспроизвести или проверить.