Куб в excel как сделать
Перейти к содержимому

Куб в excel как сделать

Анализ данных кубов OLAP в Service Manager с помощью Excel

Эта версия Service Manager достигла конца поддержки, рекомендуется выполнить обновление до Service Manager 2019.

Service Manager включает стандартные Кубы OLAP для аналитической обработки данных Microsoft Online ( ) , которые подключаются к хранилищу данных для получения данных, что позволяет манипулировать ими с помощью Microsoft Excel в табличном виде. При открытии куб данных представлен в виде листа, содержащего пустой отчет сводной таблицы. Сведения, указывающие источник данных OLAP, встроены в лист. При открытии отчета или обновлении подключения к данным Excel использует Microsoft SQL server Analysis Services ( SSAS ) для подключения к хранилищу данных, чтобы получить ключевые показатели эффективности ( ) и другие данные. После открытия текущий лист содержит моментальный снимок или подмножество данных из хранилища данных. При сохранении листа сведения о подключении к источнику данных, показатели KPI, а также любые сделанные вами изменения сохраняются вместе с ним. Если лист сохраняется в библиотеке анализа, его можно открыть позже без использования консоли Service Manager.

Ключевые показатели эффективности, включенные в Service Manager Кубы данных, являются предопределенными, специальными вычисляемыми мерами, определенными на сервере, которые позволяют следить за ключевыми показателями эффективности, например состоянием, что ( Текущее значение соответствует определенному числу? ) и тенденция, ( что такое значение с течением времени? ) . Когда эти ключевые показатели эффективности отображаются в сводной таблице, сервер может отправить связанные значки, аналогичные новому значку Excel, чтобы указать уровни состояния, которые выше или ниже определенного порогового значения ( , например, с помощью значка остановки или при ) приближении значения вверх или вниз ( , например с помощью значка стрелки направления ) .

Сводные таблицы могут помочь быстро и легко создавать полезные отчеты. Сводные таблицы, отображаемые в Service Manager Data Cubes, включают множество стандартных категорий ключевых показателей эффективности, называемых группами мер или измерениями. Эти группы предоставляют обзор данных с высочайшего уровня классификации и позволяют облегчить фокусировку анализа. Большинство групп мер имеют множество дополнительных уровней подкатегорий и индивидуальных полей. Все категории, подкатегории и поля содержатся в списке полей сводной таблицы. Чтобы создать простой отчет, выполните следующие действия:

  1. В списке полей сводной таблицы выберите категорию и добавьте ее в виде строки.
  2. Выберите вторую категорию и добавьте ее в виде столбца.
  3. Выберите категорию или подкатегорию для добавления значений.

После создания отчета можно добавить любой дополнительный уровень сложности, в том числе сортировку, фильтрацию, форматирование, вычисления и диаграммы. Продолжая анализ, вы также можете входить в категории и покидать их.

Демонстрация создания отчета и манипулирования данными в Excel с помощью данных из куба данных OLAP в сводной таблице см. в разделе детализация данных сводной таблицы.

Просмотр и анализ куба данных Service Manager OLAP с помощью Excel

Следующую процедуру можно использовать для просмотра и анализа куба данных Microsoft Online аналитической обработки ( OLAP ) из System Center — Service Manager с Microsoft Excel. Можно также сохранить книги в библиотеке аналитики. С помощью списка полей PivotTable можно перетаскивать поля из куба в книгу. Для использования следующей процедуры на компьютере с консолью Service Manager необходимо установить Microsoft Excel 2007 или более поздней версии.

Если анализ куба с помощью Excel выполняется впервые, загрузка может занять несколько минут.

Просмотр и анализ куба OLAP в приложении Excel

  1. В консоли Service Manager щелкните хранилище данных, разверните узел хранилище данных , а затем щелкните Кубы.
  2. В области Кубы выберите имя куба, а затем в области Задачивыберите пункт Анализировать куб в Excel. Например, выберите значение SystemCenterWorkItemsCube , чтобы анализировать данный куб.
  3. Когда в Excel откроется лист, в него можно перетащить поля из списка полей сводной таблицы и создать срезы и диаграммы.
    • Например, чтобы увидеть общее количество в данный момент открытых инцидентов, разверните группу IncidentDimGroupи выберите пункт Открытые инциденты.
    • Можно добавить дополнительные поля, чтобы выполнить более сложный анализ. К примеру, можно добавить компьютеры из измерения ComputerDim , выбрав поле DisplayName , чтобы увидеть количество инцидентов, затрагивающих отдельные компьютеры.
    • При желании вы можете сохранить рабочую книгу в общую папку или на другой общий ресурс (например, в библиотеку анализа). Дополнительные сведения о библиотеке анализа см. в разделе Использование библиотеки анализа.

    Использование срезов Excel для просмотра данных Service Manager куба OLAP

    Наиболее полезные данные отчетов, доступные в Service Manager, представлены в виде кубов данных. Одним из способов просматривать данные кубов и манипулировать ими являются сводные таблицы Microsoft Excel. Срезы в Excel можно использовать для фильтрации данных сводной таблицы.

    Срезы просты — в — использовании для фильтрации компонентов, содержащих набор кнопок, позволяющих быстро фильтровать данные в отчете сводной таблицы без необходимости открывать раскрывающиеся — списки для поиска элементов, которые требуется отфильтровать.

    При использовании обычного фильтра отчета сводной таблицы для фильтрации по нескольким элементам фильтр указывает только, что фильтруются несколько элементов, и необходимо открыть раскрывающийся — список, чтобы найти сведения о фильтрации. Однако срез сразу показывает примененный фильтр и предоставляет сведения, позволяющие с легкостью понять данные, отображенные в отфильтрованном отчете сводной таблицы.

    Дополнительные сведения о срезах Excel см. в разделе Использование срезов для фильтрации данных сводной таблицы на веб-сайте Microsoft Office.

    Создаем OLAP куб. Часть 1

    OLAP

    Продолжая тематику Многомерные кубы, OLAP и MDX и olap для маленькой компании, традиционно, предлагаю начать с простенького «Hello World» куба, который будет анализировать процессы и тенденции голосований на Хабре.

    Итак, давайте попробуем создать свою первую OLAP систему.
    Но, прежде чем, потирая руки, запускать Business Intelligence Studio, предлагаю вначале создать хранилище данных хабра-голосов, так называемый Data Warehouse.
    Зачем? Причин в этом несколько:

    • сама суть Data Warehouse-а хранить «очищенные» данные, готовые для анализа, поэтому даже его изначальная структура может сильно отличаться от структуры нашей хабра-OLTP базы данных
    • в HabraDW (так мы его назовем) мы вынесем только ту информацию, которая нам нужна будет для анализа, ничего лишнего
    • к Data Warehouse не накладываются требования нормализации. Даже наоборот, денормализировав некоторые данные можно добиться более понятной схемы для построения куба, а также скорости загрузки данных в куб

    Немного теории.

    По сути, Data Warehouse может быть:

    • чисто виртуальный (например, определенным как множество SELECT-ов или даже вызовов сложных хранимых процедур, которые каким-то образом определят входные данные для куба)
    • вполне реальным, то есть существовать физически на каком-то сервере (или серверах)

    В последнем случае, вы, скорее всего, захотите имплементировать ETL процессы (используя Integration Services или что-то еще), но это уже повод для другой, не менее интересной, статьи.

    Каким же должен быть Data Warehouse?

    Все очень просто – ваш Data Warehouse должен иметь структуру формы звездочки (star model) или снежинки (snowflake model) и состоять из фактов (facts) и измерений (dimensions).

    Факты – это фактические записи (records) о каком-то процессе, который мы хотим анализировать, например, процесс голосования на Хабра, или процесс изменения цены товара на бирже. Очень часто факты содержат какие-нибудь числовые данные, например, фактическое значение голоса или цены.

    Измерения – это определяющие атрибуты фактов, и обычно отвечают на всякие вопросы: когда произошел факт, над чем или с чем именно, кто был объектом или субъектом и т.п. В основном, измерения имеют более описательный (то есть текстовый) характер, например, имя пользователя или название месяца, так как конечному пользователю будет намного легче воспринимать результаты описанные текстом (например, название месяца), нежели цифрами (номер месяца в году).

    Определив где у нас факты, а где измерения — очень просто построить модель звезды.

    Звезда.

    Звезда

    В центре указываем нашу таблицу фактов, а лучами выводим измерения.

    А теперь снежинка.

    Снежинка — это та же звезда, только измерения могут зависеть от измерений следующего уровня, а те в свою очередь могут включать еще уровни.

    Снежинка
    Каждая из этих моделей имеет свои достоинства и недостатки и собственно выбор модели должен базироваться на требованиях к дизайну куба, скорости загрузки данных, дискового пространства и т.д.
    Естественно, конечные Data Warehouse обычно намного сложнее и состоят из нескольких звезд или снежинок, которые могут совместно использовать общие измерения.

    HabraDW.

    Перейдем к собственно разработке нашего Data Warehouse-а.

    Наша цель – анализ тенденций голосования на Хабре, нахождение закономерностей и трендов.
    Основные тенденции, которые мы хотим определить:

    • в какое время года/месяца/недели голосуют лучше/хуже/чаще
    • как голосуют по пятницам и понедельникам (например)
    • как влияет на результат голосования наличие в посте слов Microsoft, или Карма
    • средняя активность пользователей, «пики» голосования
    • и т.п.

    Для наглядности, наша первая модель будет абсолютно простой – включим только то, что относится к голосованию и исключим все лишнее, включая время регистрации пользователей и факт того, кто именно запостил статью, а также время голосования (только дата) и остальные атрибуты (все эти данные можно будет включить в следующих статьях и попробовать анализировать более сложные вещи).

    В итоге, имеем следующие таблицы:

    • Таблица фактов FactHabravote – определяет кто, когда, за что и как именно проголосовал. Значение Vote в нашем случае будет +- 1, но тип поля позволяет расширить дельту голосами, например, +- 10
    • Измерение времени DimTime – определяет нужные для анализа атрибуты времени (значения и названия)
    • Измерение пользователей DimUser – определяет пользователей Хабра, пока только никнейм
    • Измерение постов DimPost – определяет посты, в нашем случае содержит заголовок и булевые поля, определяющие содержит ли пост слова Microsoft и Карма.

    Итоговая схема нашей звезды будет такой.

    HabraDW

    А здесь исходный SQL скрипт, который создает и наполняет (пока что только случайными данными) наше хранилище.

    Ну вот, теперь все готово, чтобы загрузить данные в куб.
    До встречи в следующей статье.

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *