Как построить гистограмму с процентами в excel

Гистограмма распределения в EXCEL

history 15 ноября 2016 г.
    Группы статей

  • Описательная статистика

Гистограмма распределения — это инструмент, позволяющий визуально оценить величину и характер разброса данных. Создадим гистограмму для непрерывной случайной величины с помощью встроенных средств MS EXCEL из надстройки Пакет анализа и в ручную с помощью функции ЧАСТОТА() и диаграммы.

Гистограмма (frequency histogram) – это столбиковая диаграмма MS EXCEL , в каждый столбик представляет собой интервал значений (корзину, карман, class interval, bin, cell), а его высота пропорциональна количеству значений в ней (частоте наблюдений).

Гистограмма поможет визуально оценить распределение набора данных, если:

  • в наборе данных как минимум 50 значений;
  • ширина интервалов одинакова.

Построим гистограмму для набора данных, в котором содержатся значения непрерывной случайной величины . Набор данных (50 значений), а также рассмотренные примеры, можно взять на листе Гистограмма AT в файле примера. Данные содержатся в диапазоне А8:А57 .

Примечание : Для удобства написания формул для диапазона А8:А57 создан Именованный диапазон Исходные_данные.

Построение гистограммы с помощью надстройки Пакет анализа

Вызвав диалоговое окно надстройки Пакет анализа , выберите пункт Гистограмма и нажмите ОК.

В появившемся окне необходимо как минимум указать: входной интервал и левую верхнюю ячейку выходного интервала . После нажатия кнопки ОК будут:

  • автоматически рассчитаны интервалы значений (карманы);
  • подсчитано количество значений из указанного массива данных, попадающих в каждый интервал (построена таблица частот);
  • если поставлена галочка напротив пункта Вывод графика , то вместе с таблицей частот будет выведена гистограмма.

Перед тем как анализировать полученный результат — отсортируйте исходный массив данных .

Как видно из рисунка, первый интервал включает только одно минимальное значение 113 (точнее, включены все значения меньшие или равные минимальному). Если бы в массиве было 2 или более значения 113, то в первый интервал попало бы соответствующее количество чисел (2 или более).

Второй интервал (отмечен на картинке серым) включает значения больше 113 и меньше или равные 216,428571428571. Можно проверить, что таких значений 11. Предпоследний интервал, от 630,142857142857 (не включая) до 733,571428571429 (включая) содержит 0 значений, т.к. в этом диапазоне значений нет. Последний интервал (со странным названием Еще ) содержит значения больше 733,571428571429 (не включая). Таких значений всего одно — максимальное значение в массиве (837).

Размеры карманов одинаковы и равны 103,428571428571. Это значение можно получить так: =(МАКС( Исходные_данные )-МИН( Исходные_данные ))/7 где Исходные_данные – именованный диапазон , содержащий наши данные.

Почему 7? Дело в том, что количество интервалов гистограммы (карманов) зависит от количества данных и для его определения часто используется формула √n, где n – это количество данных в выборке. В нашем случае √n=√50=7,07 (всего 7 полноценных карманов, т.к. первый карман включает только значения равные минимальному).

Примечание : Похоже, что инструмент Гистограмма для подсчета общего количества интервалов (с учетом первого) использует формулу =ЦЕЛОЕ(КОРЕНЬ(СЧЕТ( Исходные_данные )))+1

Попробуйте, например, сравнить количество интервалов для диапазонов длиной 35 и 36 значений – оно будет отличаться на 1, а у 36 и 48 – будет одинаковым, т.к. функция ЦЕЛОЕ() округляет до ближайшего меньшего целого (ЦЕЛОЕ(КОРЕНЬ(35))=5 , а ЦЕЛОЕ(КОРЕНЬ(36))=6) .

Если установить галочку напротив поля Парето (отсортированная гистограмма) , то к таблице с частотами будет добавлена таблица с отсортированными по убыванию частотами.

Если установить галочку напротив поля Интегральный процент , то к таблице с частотами будет добавлен столбец с нарастающим итогом в % от общего количества значений в массиве.

Если выбор количества интервалов или их диапазонов не устраивает, то можно в диалоговом окне указать нужный массив интервалов (если интервал карманов включает текстовый заголовок, то нужно установить галочку напротив поля Метка ).

Для нашего набора данных установим размер кармана равным 100 и первый карман возьмем равным 150.

В результате получим практически такую же по форме гистограмму , что и раньше, но с более красивыми границами интервалов.

Как видно из рисунков выше, надстройка Пакет анализа не осуществляет никакого дополнительного форматирования диаграммы . Соответственно, вид такой гистограммы оставляет желать лучшего (столбцы диаграммы обычно располагают вплотную для непрерывных величин, кроме того подписи интервалов не информативны). О том, как придать диаграмме более презентабельный вид, покажем в следующем разделе при построении гистограммы с помощью функции ЧАСТОТА() без использовании надстройки Пакет анализа .

Построение гистограммы распределения без использования надстройки Пакет анализа

Порядок действий при построении гистограммы в этом случае следующий:

  • определить количество интервалов у гистограммы;
  • определить ширину интервала (с учетом округления);
  • определить границу первого интервала;
  • сформировать таблицу интервалов и рассчитать количество значений, попадающих в каждый интервал (частоту);
  • построить гистограмму.

СОВЕТ : Часто рекомендуют, чтобы границы интервала были на один порядок точнее самих данных и оканчивались на 5. Например, если данные в массиве определены с точностью до десятых: 1,2; 2,3; 5,0; 6,1; 2,1, …, то границы интервалов должны быть округлены до сотых: 1,25-1,35; 1,35-1,45; … Для небольших наборов данных вид гистограммы сильно зависит количества интервалов и их ширины. Это приводит к тому, что сам метод гистограмм, как инструмент описательной статистики , может быть применен только для наборов данных состоящих, как минимум, из 50, а лучше из 100 значений.

В наших расчетах для определения количества интервалов мы будем пользоваться формулой =ЦЕЛОЕ(КОРЕНЬ(n))+1 .

Примечание : Кроме использованного выше правила (число карманов = √n), используется ряд других эмпирических правил, например, правило Стёрджеса (Sturges): число карманов =1+log2(n). Это обусловлено тем, что например, для n=5000, количество интервалов по формуле √n будет равно 70, а правило Стёрджеса рекомендует более приемлемое количество — 13.

Расчет ширины интервала и таблица интервалов приведены в файле примера на листе Гистограмма . Для вычисления количества значений, попадающих в каждый интервал, использована формула массива на основе функции ЧАСТОТА() . О вводе этой функции см. статью Функция ЧАСТОТА() — Подсчет ЧИСЛОвых значений в MS EXCEL .

В MS EXCEL имеется диаграмма типа Гистограмма с группировкой , которая обычно используется для построения Гистограмм распределения .

В итоге можно добиться вот такого результата.

Примечание : О построении и настройке макета диаграмм см. статью Основы построения диаграмм в MS EXCEL .

Одной из разновидностей гистограмм является график накопленной частоты (cumulative frequency plot).

На этом графике каждый столбец представляет собой число значений исходного массива, меньших или равных правой границе соответствующего интервала. Это очень удобно, т.к., например, из графика сразу видно, что 90% значений (45 из 50) меньше чем 495.

СОВЕТ : О построении двумерной гистограммы см. статью Двумерная гистограмма в MS EXCEL .

Примечание : Альтернативой графику накопленной частоты может служить Кривая процентилей , которая рассмотрена в статье про Процентили .

Примечание : Когда количество значений в выборке недостаточно для построения полноценной гистограммы может быть полезна Блочная диаграмма (иногда она называется Диаграмма размаха или Ящик с усами ).

Как сделать гистограмму с процентами в excel?

Предположим, пользователь располагает данными в абсолютных величинах. Ему нужно отобразить информацию на диаграмме. Для лучшей наглядности показать необходимо относительные значения данных. Например, сколько процентов плана выполнено, сколько товара реализовано, какая часть учеников справилась с заданием, какой процент работников имеют высшее образование и т.д.

Выполнить это не так сложно. Но если не хватает навыков работы в программе Excel, могут возникнуть некоторые затруднения. Рассмотрим подробно, как сделать процентную диаграмму в Excel.

Круговая процентная диаграмма

Построим круговую диаграмму процентного распределения. Для примера возьмем официальную налоговую аналитику «Поступления по типам налогов в консолидированный бюджет Российской Федерации за 2015 год» (информация с сайта ФНС):

Выделим всю таблицу, включая наименования столбцов. На вкладке «Вставка» в группе «Диаграммы» выбираем простую круговую.

Сразу после нажатия по ярлычку выбранного типа на листе появляется диаграмма вида:

Отдельный сегмент круга – доля каждого налога в общей сумме поступлений в консолидированный бюджет в 2015 году.

Теперь покажем на диаграмме процентное соотношение видов налогов. Щелкнем по ней правой кнопкой мыши. В открывшемся диалоговом окне выберем задачу «Добавить подписи данных».

На частях круга появятся значения из второго столбца таблицы:

Еще раз жмем правой кнопкой мыши по диаграмме и выбираем пункт «Формат подписей данных»:

В открывшемся меню в подгруппе «Параметры подписи» нужно снять галочку напротив «Включить в подписи значения» и поставить ее напротив «Включить в подписи доли».

В подгруппе «Число» меняем общий формат на процентный. Убираем десятичные знаки, устанавливаем код формата «0%».

Если нужно отобразить проценты с одним знаком после запятой, в поле «Код формата» ставим «0,0%». С двумя знаками после запятой – «0,00%». И так далее.

Стандартные настройки позволяют изменить место подписей на диаграмме. Возможные варианты:

  • «В центре» — подписи отобразятся по центру сегментов;
  • «У вершины, внутри» — подписи отобразятся с внутренней стороны окружности;
  • «У вершины, снаружи» — подписи покажутся с внешней стороны круга, при выборе параметра сама диаграмма будет несколько меньше, но при наличии мелких данных читаемость улучшается;
  • «По ширине» — параметр позволяет Excel установить подписи наиболее оптимально.

Чтобы изменить направление подписей, в подгруппе «Выравнивание» можно воспользоваться инструментом «Направление текста». Здесь же устанавливается угол наклона.

Выберем горизонтальное направление подписей данных и положение «По ширине».

Круговая диаграмма с процентами готова. На диаграмме показано процентное распределение поступлений от налогообложения.

Столбчатая гистограмма

Добавим в таблицу вспомогательные столбцы: 1 – с процентами (процентный вклад каждого вида налога в общее количество); 2 – 100%.

Щелкаем по любой ячейке таблицы. Переходим на вкладку «Вставка». В группе «Диаграммы» выбираем «Нормированную гистограмму с накоплением».

Автоматически созданная диаграмма не решает поставленной задачи. Поэтому на вкладке «Конструктор» в группе «Данные» переходим к пункту «Выбрать данные».

С помощью стрелочки изменяем порядок рядов так, чтобы проценты были внизу. Ряд, показывающий абсолютные значения, удаляем. В «Категориях» убираем ячейку «Вид налога». Заголовок не должен быть подписью горизонтальной оси.

Выделяем любой столбец созданной диаграммы. Переходим на вкладку «Макет». В группе «Текущий фрагмент» нажимаем пункт «Формат выделенного фрагмента».

В открывшемся меню переходим на вкладку «Параметры ряда». Устанавливаем значение для перекрытия рядов – 100%.

В итоге проделанной работы получаем диаграмму такого вида:

Скачать пример процентных графиков

Общее представление о процентном соотношении видов налога в консолидированном бюджете РФ данная диаграмма дает.

Часто в отчетах нужно отобразить в Excel из скольких частей состоит стопроцентная целостность определенного показателя и сколько приходится процентов на каждую его часть. Например, чтобы узнать рентабельность товара нам нужно его цену реализации разбить на части: закупочная цена, покрытие расходов, наценка. Для отображения долей хорошо использовать круговые диаграммы с разноцветными секторами. Рассмотрим все более детально на конкретном примере.

Круговые диаграммы с процентами в Excel

Допустим, у нас есть условный товар, о котором мы все знаем в цифрах. Но нам нужно определить какими партиями его продавать. Если его наценка составляет 15%-20% значит, данный товар будет реализовываться только оптовыми партиями, а если более 20% – розничными. Розничная цена для данного товара не должна превышать 1700, а оптовая – 1400. Низкорентабельные товары будем считать с наценкой менее 15%. Теперь заполните таблицу, так как показано на рисунке:

Сделаем круговую диаграмму с процентами:

Выделите диапазон B2:B4 выберите инструмент: «Вставка»-«Диаграммы»-«Круговая».

Если кликнуть по диаграмме у нас активируется дополнительная панель. На ней выберите тип отображения с процентным соотношением долей: «Работа с диаграммами»-«Конструктор»-«Макеты диаграмм»-«Макет 6».

Теперь нам наглядно видно, что наценку лучше увеличить на 50 и продавать данный товар в розницу. Так как оптовыми партиями реализовывать его будет нерентабельно.

Экспонируем наценку, чтобы повысить презентабельность диаграммы. Для этого первый раз кликните по кругу диаграммы. А второй раз непосредственно по сектору наценки. После чего удерживая левую клавишу мышки, немного сместите сектор наценки.

Кольцевая диаграмма с процентами

Презентуем с помощью диаграммы таблицу с данными о деятельности фирмы за 2 года. И сравним их в процентном соотношении. Постройте следующую таблицу:

Для решения данной задачи можно использовать 2 круговые диаграммы. Но в данном примере мы будем использовать более эффективный инструмент:

  1. Выделите диапазон A2:C4 и выберите инструмент: «Вставка»-«Диаграммы»-«Другие»-«Кольцевая».
  2. Чтобы улучшить внешний вид выберите: «Работа с диаграммами»-«Конструктор»-«Стили диаграмм»-«Стиль10».
  3. Для отображения значений на диаграмме в процентах выбираем: Работа с диаграммами»-«Конструктор»-«Макеты диаграмм»-«Макет 2».

Главная цель этих двух примеров – показать разницу между разными типами диаграмм и их отличие перед гистограммами. Их рассмотрим в следующем примере.

Гистограмма в процентах

Теперь рассмотрим, как сделать в Excel гистограмму на проценты. Для примера возьмем эту же таблицу презентуем с помощью сразу 3-х гистограмм. Снова выделите диапазон ячеек A2:C4 и выберите: «Вставка»-«Диаграмма»-«Гистограмма»:

  • «Объемная гистограмма с группировкой»;
  • «Объемная гистограмма с накоплением»;
  • «Объемная нормированная гистограмма с накоплением».

Теперь на всех созданных гистограммах используйте переключатель: «Работа с диаграммами»-«Конструктор»-«Строка/столбец».

Изначально при создании гистограмм Excel разместил по умолчанию годы в рядах, а наименования показателей в категориях. Так как наименований больше они попали в категории. А нам нужно было сравнить показатели по годам и для этого мы поменяли строки со столбцами местами, используя переключатель «Строка/столбец».

Вкратце опишем, что отображает каждый тип выбранной гистограммы в данном примере:

  1. Объемная гистограмма с группировкой – позволяет оценить изменения всех типов расходов. Известно, что они изменились, но неизвестно есть ли существенные изменения в процентном соотношении?
  2. Объемная гистограмма с накоплением – легко можно оценить суммарное снижение расходов в 2013-ом году. Но все еще неизвестно как изменилась ситуация в процентах?
  3. Объемная нормированная гистограмма с накоплением – видно, что сумма транспортных расходов в процентах не существенно изменилась. Существенно возросли расходы на реализацию. А накладные расходы наоборот уменьшились. Но с другой стороны не знаем абсолютных значений и суммарных изменений.

Каждый тип диаграммы отличается своими преимуществами и недостатками. Важно уметь правильно подбирать способ графического отображения для разного рода данных. Этому учит наука «Инфографика».

Диаграммы – прекрасный инструмент, при помощи которого можно визуализировать данные различных источников. Не многие знают, как построить гистограмму в Excel по данным таблицы. На самом деле ничего сложного тут нет. Давайте рассмотрим различные варианты.

Раздел «Диаграммы»

Итак, приступаем к делу.

  1. Для начала нужно создать таблицу. Значения могут быть произвольными.
  1. Далее данные необходимо выделить.
  1. Откройте в меню-вкладку «Вставка» и кликните на иконку работы с гистограммой.

Вам будет предложено построение различными самыми популярными способами:

  • обычная гистограмма;
  • объемная;
  • линейчатая;
  • объемная линейчатая.

Можете навести на каждый из них и посмотреть примеры. Для просмотра других вариантов, нужно нажать на соответствующий пункт.

Обратите внимание на то, что в каждой категории есть несколько видов построения.

  1. При наведении на каждый пункт, помимо предварительного просмотра, также будет отображаться и краткая информация о назначении, чтобы пользователь смог сделать правильный выбор.
  1. Если выбрать «объемную гистограмму с группировкой», то можно получить следующий результат.

Гистограммы с накоплением

На этот раз придется добавить еще один столбец. Так как две колонки будут выглядеть точно так же, как в случае с группировкой.

Третья графа должна быть в виде цифр, а не текста, чтобы программа могла нормально сложить данные.

  1. Выделяем таблицу, нажимаем на кнопку «Гистограммы» и выбираем что-нибудь с накоплением.
  1. В результате этого вы увидите следующее.

Как видите, на этой гистограмме шкала по оси «y» отображается в процентах. Данный способ построения хорош тем, что можно увидеть сравнительную информацию.

  1. Статистика по каждому дню покажет, как между собой соотносятся продажи и затраты (в случае примера). Если вам неудобно работать с процентами, и хотите, чтобы данные были представлены в абсолютных величинах, то в этом случае нужно выбрать другой тип гистограммы.

Пакет «анализ данных»

Данная возможность в быстром доступе по умолчанию отсутствует. Для того чтобы вставить её на панель, необходимо сделать следующие действия.

  1. Нажмите на пункт меню «Файл».
  1. Кликаем на «Параметры».
  1. Далее переходим в «Надстройки».
  1. Убедитесь, что в «Управлении» выбран пункт «Надстройки Excel». После этого нажмите на кнопку «Перейти…».
  1. Поставьте галочку около «Пакет анализа» и нажмите на кнопку «OK».
  1. Переходим на главной панели на вкладку «Данные». В правой части ленты появится новая кнопка «Анализ данных».

Теперь рассмотрим процесс создания диаграммы по этой таблице. Для этого необходимо выполнить следующие действия.

  1. Нажмите на только что добавленную кнопку. Выберите пункт «Гистограмма» и кликните на «OK».
  1. После этого вы увидите следующее окно.
  1. Для того чтобы указать «Входной интервал», достаточно просто выделить таблицу. Данные подставятся автоматически.
  1. Теперь поставьте галочку около пункта «Вывод графика» и нажмите на кнопку «OK».
  1. В результате этого вы получите вот такую «Гистограмму» с анализом значений.

В этом случае оси x и y подбираются автоматически.

Условное форматирование

Красивый анализ введенных данных можно сделать прямо внутри в таблице.

  1. Для этого необходимо выделить ее, перейти на вкладку «Главная» и кликнуть на «Условное форматирование».
  1. В появившемся меню выберите пункт «Гистограммы». После этого появится большой список различных вариантов. Вы можете попробовать наложить любые цвета на свой вкус. Для этого достаточно навести указатель на один из предложенных шаблонов.
  1. В итоге получите красивую таблицу, в которой данные представлены градиентной заливкой.

В относительных единицах (заливке) намного проще анализировать информацию и тем самым определить, в какой ячейке максимальное или минимальное значение.

Дополнительные ряды распределения

Существуют и другие виды обработки статистических данных. К ним можно отнести:

  • Парето;
  • Полигон частот;
  • Кумуляты и т.д.

Большинство из них можно создавать готовыми шаблонами. Например, для создания «Диаграммы Парето» необходимо сделать следующее.

  1. Выделить таблицу.
  2. Перейти на вкладку «Вставить».
  3. Кликнуть на иконку «Вставка статистической диаграммы».
  4. Выбрать нужную заготовку.

Как оформить гистограмму

Как правило, большинству пользователей не нравится стандартный внешний вид создаваемых объектов. Изменить его очень просто.

  1. При выделении диаграммы в меню появляется новая вкладка «Конструктор».

Благодаря ей вы сможете сделать что угодно. Кроме этого, редактирование возможно через контекстное меню.

Сделав правый клик мыши по пустой области диаграммы, вы сможете:

  • скопировать или вырезать;
  • изменить тип;
  • выбрать другие данные;
  • переместить её;
  • повернуть объемную фигуру.

Рассмотрим некоторые варианты.

Копирование

Нажав на соответствующий пункт меню, всё содержимое гистограммы окажется в буфере обмена. После этого вы сможете вставить её в Ворде. Стоит отметить, что сделать то же самое можно при помощи сочетания клавиш Ctrl+C. Для вставки используем комбинацию Ctrl+V.

Смотрится очень красиво.

Перемещение

Для начала кликаем в контекстном меню на «Переместить диаграмму».

После этого появится окно, в котором можно указать назначение выбранного объекта.

Если выберете первый вариант, то он будет перемещен на новый лист.

Вращение

Для этих манипуляций нужно выбрать следующий пункт.

Вследствие этого в правой части экрана появится дополнительная панель, в которой можно «поиграться» с двумя осями.

Таким способом можно придать еще больше объемного эффекта.

Подписываем объект

Если вы кликните на название, то справа отобразится панель для работы с текстом. Более того, появится возможность редактирования.

При желании вы можете добавить такие эффекты, как:

  • тень;
  • свечение;
  • сглаживание;
  • объемность.

Вы можете совместить все эти отдельные атрибуты. Но не перестарайтесь, иначе получится кошмар.

Как объединить гистограмму и график в Экселе

Чтобы совместить разные виды объектов, необходимо использовать нестандартные наборы диаграмм.

  1. Для этого примера создадим другую таблицу, в которой данных будет больше.
  1. Теперь выделите все строки, перейдите на вкладку «Вставка», нажмите на иконку «Гистограммы» и выберите последний вариант.
  1. В появившемся окне перейдите на «Комбинированная».
  1. После этого вы сможете указать тип диаграммы для каждого ряда.
  1. Необходимо везде указать «Гистограмма с группировкой», а для ряда «Всего» – тип «Линия». При этом нужно поставить галочку в графе «Вспомогательная ось».
  1. После нажатия на кнопку «OK», мы получим новую диаграмму, которая сочетает в себе гистограмму и график.

Обратите внимание на то, что справа по оси Y появилась дополнительная шкала, предназначенная только для линии, то есть для ряда «Всего». Левая шкала – для всего остального.

Диаграмма онлайн

Для тех, кто не может правильно построить гистограмму, на помощь приходят онлайн-сервисы. Например, сайт OnlineCharts.

Нажав на кнопку «Создайте Вашу диаграмму», вы увидите огромное количество различных настроек, благодаря которым сможете нарисовать что хотите.

Полученный результат легко скачать себе на компьютер.

Заключение

В данной статье мы пошагово рассмотрели, как создавать различные виды диаграмм при помощи всевозможных инструментов. Не бойтесь экспериментировать. Удалить свой результат вы всегда успеете.

Следует отметить, что существуют разные версии программы Эксель. Например, Excel 2010, 2013 и 2016 в этом плане очень похожи. Продукты 2003 и 2007 годов в наше время не так актуальны и отличие между ними колоссальное.

Видеоинструкция

Тем, у кого остались какие-то вопросы, рекомендуется посмотреть видео, в котором всё подробно рассказывается с дополнительными комментариями.

Ссылка на основную публикацию