0:00
[МУЗЫКА]
[МУЗЫКА] Сейчас
вернемся к обсуждению
практик работы со сводными таблицами и рассмотрим
еще один подход к работе со сводными отчетами,
который обычно не показывается для слушателей начального уровня,
он обычно показывается только опытным пользователям.
Позвольте проиллюстрировать это все на следующем примере.
Сейчас у меня на экране достаточно часто используемая в различных показах и
в разных курсах таблица с данными по работникам компании разного пола,
с разным образованием, занимающих разные должности,
с разной текущей зарплатой и с разной начальной зарплатой.
Вопрос, который может быть поставлен для аналитика,
достаточно неопределенно звучащий.
Надо выяснить,
справедливо или несправедливо оплачиваются женщины в компании.
Это пример задачи, в которой нет четкого задания,
какого вида отчет аналитик должен построить.
Классическими, сразу приходящими идеями являются построения следующих отчетов.
Давайте мы их сделаем: «ВСТАВКА», «Сводная таблица», «На новый лист».
Поместим, например, отчет «Средняя зарплата текущая»,
меняем сумму на «Среднее», для мужчин и женщин.
Давайте только не забывать настраивать внешний вид отчета.
Здесь, наверное, точность до копеек нам не нужна.
Видно, что средняя у мужчин зарплата и средняя у женщин сильно отличается.
Является это единственным доказательством того,
что женщины оплачиваются несправедливо?
Конечно, нет.
И тут и начинающие, и взрослые слушатели всегда сразу предлагают
сравнить зарплату для работников, которые занимают разную должность.
Совершенно понятно, что глубокий анализ требует сравнения и
образования у мужчин и женщин, занимающих разные должности.
Поэтому давайте добавим «Образование» и поставим его под поле «Пол».
Мы получили результат, который очень трудно анализировать.
Более того, совершенно понятно, я немножко укрупню результат,
совершенно понятно, что такая детализация по годам,
которые люди учились — 8, 12, 15 лет — она совершенно не нужна; наверное,
эти значения, характеризующие количество лет, которые человек учился,
нужно объединить в какие-то группы.
Давайте попробуем это сделать.
Правая кнопка мыши, «Группировать», и посмотрите,
какая еще есть возможность при построении сводных таблиц.
Мы можем сгруппировать, например, показатель «Количество лет»,
которые работник учился, в группы, например, по 5 лет.
Совершенно другого качества результат: мы видим группы работников,
которые учились, например, от 8 до 12 лет, это вот женщины,
от 8 до 12 лет мужчины учились, зарплаты у них сильно отличаются.
Мы не будем делать выводы, наша задача — подготовить набор аналитических отчетов.
Единственное в этой ситуации, может быть,
имеет смысл попробовать поменять дизайн таблицы, чтобы удобнее было анализировать,
и поставить сначала признак группировки «Образование», а потом «Пол».
Согласитесь, что так удобней анализировать полученные значения.
Итак, мы сейчас попробовали новый инструмент — группировка числовых
значений.
Соответственно, этот инструмент позволяет нам получить совершенно новый
сводный отчет.
Смотрите, как он делается.
Итак, возвращаемся на исходную таблицу и заказываем инструмент «Сводная таблица»,
результат попросим разместить, как всегда, на новом листе.
И сейчас сделаем такую, на первый взгляд странную вещь — мы «Зарплату» поставим
в поле «СТРОКИ» как группирующий признак,
и то же самое поле «Зарплата» поставим в поле
итоговые «ЗНАЧЕНИЯ», но только функцию агрегирующую поменяем
с «Суммы» на «Количество».
Обычно в аудитории задается вопрос: «Как можно проинтерпретировать
полученный результат?» Я сейчас сама проинтерпретирую полученный отчет.
Мы видим, сколько человек в компании получают ту или иную зарплату,
например, зарплату 16200 в компании получают 3 человека.
В таком виде отчет абсолютно бессмысленен,
но мы имеем возможность группировки числовых значений.
Правая кнопка мыши, команда «Группировать», предположим,
с шагом 10 — дает нам совершенно замечательный вид сводного отчета.
Мы видим количество людей,
получающих зарплату в определенных зарплатных диапазонах.
Но поскольку у нас стоит задача сравнить еще средние зарплаты мужчин и женщин,
посмотрите, что можно сделать.
Мы добавляем как признак группировки «пол» мужчин и женщин,
и мы получаем совершенно новый ракурс,
новый вид отчета по тем данным, которые нам нужно было проанализировать.
Мы видим, сколько мужчин и женщин находятся в каждом зарплатном диапазоне,
и очень наглядно будет визуализировать эти данные с помощью диаграммы.
Давайте попробуем: «Вставка»,
можно попробовать здесь сделать объемную гистограмму.
Посмотрите, на этой диаграмме видно, что женщины, — они,
правда, у нас сейчас синим цветом изображены, не будем тратить на это время,
цвет мы менять столбиков умеем, — в низкозарплатных диапазонах находятся
в основном женщины, а в высокозарплатных диапазонах женщин совсем нет.
Этот отчет в совокупности с набором других отчетов позволит сделать выводы,
объективно или необъективно оплачиваются женщины в этой компании,
и принять управленческие решения на основании этих данных.
Закономерен вопрос, является ли этот пример частным или этот инструмент
является часто используемым или удобным для большого количества задач?
Я приведу, например, еще одну задачу,
и о многих аналогичных меня спрашивали представители разных компаний.
Вот, например, у меня подготовлен такой файл.
Тут такие данные: в компании зафиксирована в информационной системе,
выгружена из информационной системы информация о номерах накладных и,
например, адресах, по которым был отправлен товар.
Часто один человек занимается тем, что ищет ошибки в номерах накладных.
Все номера накладных должны быть уникальны, и человек целый рабочий
день ищет, есть ли накладные с одинаковыми номерами.
Как можно решить эту задачу автоматически?
«ВСТАВКА», «Сводная таблица», «На новый лист» помещаем результат,
«Номер накладной» — как признак группировки,
«Номер накладной» — в итоговые «ЗНАЧЕНИЯ», «Сумму»,
как и в предыдущем случае, меняем на «Количество», и что у нас получается?
Мы видим, что накладная с номером 15900 была,
извините, накладная с номером 16200 была отправлена в три адреса.
Следующий вопрос: а как узнать по каким адресам пошли дублирующие накладные?
Двойной щелчок — напоминаю, совершенно замечательная возможность — двойным
щелчком мы на новом листе получаем детализацию этого итогового значения.
Конечно, во многих компаниях сейчас существуют информационные системы,
которые автоматически нумеруют новые накладные,
и эта задача может показаться кому-то неактуальной,
но мне ее задавали представители по крайней мере трех компаний масштабом
от маленьких до очень крупных, и в таком виде или в каком-то другом
аналогичном эта задача оказалась актуальной и неожиданно полезной.
И в заключение хочу обратить внимание еще на один момент.
Если вернуться к задаче про работников и построить сводную
таблицу уже без детализации по мужчинам и женщинам,
а именно — построить вот такой сводный отчет,
сколько человек получает зарплату в данном зарплатном диапазоне,
по существу, мы получили данные для такой статистической диаграммы,
которая называется гистограммой.
Вот сейчас гистограмма будет — название диаграммы, гистограмма,
— будет абсолютно соответствовать ее правильному названию.
Мы видим сейчас, что величина каждого столбика соответствует тому
количеству людей, которые получают зарплату в некотором зарплатном диапазоне.
Но это некоторая техническая деталь, а содержательно — обратите внимание на
возможность группировки числовых значений в сводных таблицах.
[БЕЗ_ЗВУКА]