Что относится к управлению основанному на данных
Управление компанией на основе данных
В статье «Почему внедрение ERP-систем не приносит пользы бизнесу» мы определили, что ценность ERP-систем состоит в том, что они позволяют менеджерам получать информацию, основываясь на которой они могут принимать решения. Такой процесс называется управлением на основе данных
Ключевым понятием управления на основе данных является аналитическая цепочка ценности. Это сквозной процесс, в результате которого и появляется ценность для бизнеса.
Рассмотрим каждый пункт.
Обработка и хранение полученных данных осуществляются средствами бизнес-приложений и различных СУБД. Это могут быть как конфигурации, построенные на платформе 1С, использующие СУБД, так и обычный Excel.
Формирование отчётов – это и есть создание информационного продукта первой переработки. Например, получение информации об объёмах продаж по периодам или производстве товаров. Важно понимать, что отчёт — это ретроспективный инструмент и отвечает на вопрос «что произошло?».
После отчёта должен быть проведён анализ, который ответит на вопрос, почему произошло именно это и даст рекомендации о дальнейших действиях. Управленец, получив отчёты и результаты анализа примет на их основании решение, которое и принесёт компании ценность. Но разве нельзя принимать решения без отчётов и результатов анализа? Можно, но это сродни движению вслепую: возможно, повезёт и интуиция не подведёт…
В современной западной практике бизнеса не принято основываясь на интуиции принимать решения, стоимость ошибки которых исчисляется миллионами долларов. Поэтому внедряется управление на основе данных. Что оно из себя представляет? Как правило, повседневная деятельность компании (бизнес-процессы, происходящие в ней) имеет повторяющийся характер. Получив накопленные измеримые показатели этих процессов (среднее время, стоимость, количество задействованных сотрудников и т.д.), можно отследить, как то или иное воздействие (управленческое решение) влияет на результат. Воздействие должно так же быть измеримым (увеличение финансирования на 20%, переналадка 2 линий на выпуск продукции-лидера продаж). Понимание степени влияния управленческого воздействия на выходной результат процесса и есть необходимое условие для управления на основе данных. Важно обращать внимание и на связи между показателями различных бизнес-процессов, так как они не всегда бывают изолированными. Например, компания запускает рекламу, в результате чего растут продажи, но растёт и маркетинговый бюджет. Поэтому, принимая решение о запуске рекламной кампании, нужно чётко понимать по каким показателям будет оцениваться её эффективность. Она может поднять продажи на 1 млн руб. при этом стоя в два раза больше. И если компания не будет всё это измерять, то при принятии решения о продолжении рекламной кампании, директор по маркетингу будет руководствоваться исключительно своей интуицией и совершенно не факт, что он получит от неё верную подсказку.
Таким образом цепочка аналитической ценности реализуется через управленческое решение и результат анализа его реализации. Надо сказать, что это всё-таки не высший пилотаж. К высшему пилотажу управления на основе данных можно отнести прогнозирование событий, в том числе с помощью нейросетей и машинного обучения. Однако на практике такая деятельность встречается в очень немногих компаниях, в основном позволить себе такое могут IT-гиганты. В обычных компаниях максимум строятся модели в Excel. Забавно выглядят эти модели в компаниях, не имеющих минимальной рабочей системы отчётов.
Откуда берутся отчёты, и кто отвечает за их формирование? Здесь сервис предоставляет IT служба. Она должна обеспечить работоспособность и доступность информационных систем, находящихся в зоне её ответственности, для получения отчётов о состоянии бизнеса и событиях, происходящих в нём, будь то складской остаток, приходы товаров или финансовый результат. А вот анализ на основе отчётов должен осуществлять функциональный аналитик, например, маркетолог-аналитик.
Как же внедрить управление на основе данных в компании?
Первый этап – описать бизнес-процессы компании, формализовав входы, выходы и алгоритмы трансформации.
Второй этап – определить критерии измерения совместно с менеджерами.
Третий этап – определить, как эти данные будут получены компанией в форме отчётов. На этом план минимум выполнен.
Четвёртый этап – предоставить информацию аналитикам и получить выводы.
Пятый – обеспечить принятие решений только при наличии аналитических выводов.
Шестой – принятые решения также должны оцениваться на основе данных.
Платформы управления данными: от периферии до облака
Сегодня для большинства компаний и организаций данные – это один из стратегических активов. И с расширением возможностей аналитики, ценность собираемых и накапливаемых компаниями данных постоянно увеличивается. При этом часто говорят о взрывном, экспоненциальном росте объемов генерируемых корпоративных данных. Отмечается, что 90% всех данных были созданы за последние два года.
Рост объемов данных сопровождается увеличением их ценности
Данные создают и используют системы аналитики больших данных, интернета вещей (IoT), искусственного интеллекта и др. Собираемые данные – основа для повышения качества обслуживания клиентов, принятия решений, поддержки операционной деятельности компаний, для различных исследований и разработок.
90% всех данных были созданы за последние два года.
По прогнозу IDC, объем хранимых данных в мире с 2018 по 2023 годы удвоится, а общая емкость хранилищ данных достигнет 11,7 зеттабайт, причем на долю баз данных предприятий будет приходиться более трех четвертей от общего объема. Характерно, что если еще в 2018 году общая емкость поставленных дисковых накопителей (HDD), которые пока что остаются основным носителем информации, составила 869 экзабайт, то уже к 2023 году данный показатель может превысить 2,6 зеттабайта.
Платформы управления данными: для чего они нужны, и какую играют роль?
Не удивительно, что вопросы управления данными становятся для предприятий приоритетными, оказывая непосредственное влияние на их работу. Для их решения приходится подчас преодолевать такие сложности как разнородность систем, форматов данных, методов их хранения и использования, подходов к управлению в условиях «зоопарка» решений, которые внедрялись в разное время.
Результат такого неунифицированного подхода – фрагментация массивов данных, хранимых и обрабатываемых в разных системах, разные процедуры обеспечения качества данных. Эти типовые проблемы увеличивают трудовые и финансовые затраты при работе с данными, например, при получении статистики и отчетов или при принятии управленческих решений.
Бизнес-модель управления данными должна быть кастомизированной, адаптированной к потребностям, задачам и целям предприятия. Не существует единой автоматизированной системы, платформы управления данными, которая закрывала бы все задачи. Тем не менее, современные всеобъемлющие, гибкие и масштабируемые системы управления данными нередко представляют собой универсальное программное обеспечение для управления данными и их хранения. Они включают в себя необходимые инструменты и сервисы для эффективного управления данными.
Новейшие разработки позволяют предприятиям переосмыслить управление данными в масштабе всей организации, получить четкое представление о том, какие данные имеются, какие с ними связаны политики, где и сколько времени данные хранятся, наконец, они дают возможность своевременно предоставлять нужную информацию нужным людям. Это решения, расширяющие возможности предприятий и позволяющие:
Такая платформа позволяет реализовать мультиоблачную стратегию, расширить центр обработки данных до облачной среды, осуществить быструю миграцию в облако, использовать возможности замены оборудования и внедрения наиболее экономичных вариантов хранения данных.
Некоторые решения способны автоматически архивировать данные. А с помощью искусственного интеллекта они могут обнаруживать, что «что-то пошло не так», и автоматически предпринимать корректирующие меры или уведомлять администратора, а также выявлять и пресекать атаки различных типов. Автоматизация сервисов способствует оптимизации ИТ-операций, позволяет высвободить ИТ-персонал, свести к минимуму ошибки из-за человеческого фактора, минимизировать простои.
Какими же качествами должна обладать современная платформа управления данными, и где такие решения применяются на практике?
Подход «одно решение для всех» не срабатывает в случае с платформами управления данными. У каждой компании свои требования к данным, они зависят от типа бизнеса, опыта работы и пр. Универсальная платформа должна, с одной стороны, обеспечивать настройку для работы с данными на конкретным предприятии, а с другой, быть независимой от специфики прикладной отрасли, сферы применения построенного на ее основе продукта и его информационного окружения.
Практические области управления данными (источник; CMMI Institute).
Вот некоторые практические области применения платформ управления данными:
Компонент | Область применения |
---|---|
Стратегия управления данными | Цели и задачи управления, корпоративная культура управления данными, определение требований к жизненному циклу данных. |
Управление данными | Управление данными и метаданными |
Операции с данными | Стандарты и процедуры работы с источниками данных |
Качество данных | Обеспечение качества, фреймворк качества данных |
Платформа и архитектура | Архитектурный фреймворк, платформы и интеграция |
Поддерживающие процессы | Оценка и анализ, управление процессами, обеспечение качества, управление рисками, управление конфигурацией |
Кроме того, такие платформы играют важную роль в процессе трансформации организации в предприятие, «управляемое данными», который можно разделить на несколько этапов:
Преимущества платформ управления данными
Компании, которые эффективно работают с данными, как правило, добиваются большего успеха по сравнению с конкурентами, быстрее выводят на рынок продукты и услуги, лучше понимают потребности целевой аудитории, могут оперативно реагировать на изменения спроса. Платформы управления данными предоставляют возможность «очистки» данных, получения качественной и релевантной информации, трансформации данных и стратегической оценки данных предприятия.
Пример универсальной платформы для построения систем управления корпоративными данными – российская «Юнидата», созданная на основе ПО с открытым исходным кодом. Она предлагает инструменты создания модели данных и средства расширения функциональности при интеграции в различные ИТ-среды и сторонние информационные системы: от ведения материально-технических ресурсов до безопасной обработки больших объемов персональных данных.
Архитектура платформы «Юнидата» одноименной компании.
Эта многофункциональная платформа обеспечивает централизованный сбор данных (инвентаризация и учет ресурсов), стандартизацию сведений (нормализация и обогащение), учет текущей и исторической информации (контроль версий записи, периоды актуальности данных), качество данных и ведение статистики. Предусмотрена автоматизация таких задач как сбор, накопление, очистка, сопоставление, консолидация, проверка качества, распространение данных, а также инструменты для автоматизации системы принятия решений.
Платформы управления данными (DPM) в рекламе и маркетинге
В рекламе и маркетинге понятие платформы управления данными DMP (Data Management Platform) имеет более узкий смысл. Это программная платформа, которая на основе собираемых данных позволяет компаниям определять сегменты аудитории для таргетинга рекламы на конкретных пользователей и контекст рекламных кампаний в интернете. Такое программное обеспечение способно собирать, обрабатывать и хранить любые типы аудиторных данных, а также обладает возможностью их использования через привычные медиа-каналы.
По прогнозу Market Research Future (MRFR), мировой рынок платформ управления данными (DMP) может достичь к концу 2023 года 3 млрд. долларов при среднегодовом росте 15%, а в 2025 году его объем превысит 3,5 млрд. долларов.
Мировой рынок платформ управления данными представлен рядом ведущих игроков, а также несколькими новыми компаниями, в том числе Lotame Solutions, KBM Group, Rocket Fuel, Krux Digital), Oracle, Neustar, SAS Institute, SAP, Adobe Systems, Cloudera, Turn, Informatica и др.
Пример российского решения — выпущенный Mail.ru Group инфраструктурный продукт, который представляет собой единую платформу управления и обработки данных (Data Management Platform, DMP). Решение позволяет строить расширенное описание профиля аудиторных сегментов внутри платформы, интегрированной с маркетинговыми инструментами. DMP объединяет решения и сервисы Mail.ru Group в области омниканального маркетинга и работы с аудиторией. Клиенты смогут хранить, обрабатывать и структурировать собственные обезличенные данные, а также активировать их в рекламных коммуникациях, повышая эффективность бизнеса и маркетинга.
Управление данными в облачной среде
Еще одна категория решений для управление данными – облачные платформы. В частности, использование современного решения для защиты данных в рамках управления данными в облаке позволяет избежать возможных проблем – от угроз безопасности до проблем с миграцией данных и снижения производительности, а также решить стоящие перед компанией задачи цифровой трансформации. Конечно, функции подобных систем не ограничиваются защитой данных.
Функции облачной платформы управления данными в представлении Gartner: распределение ресурсов, автоматизация и оркестрация; управление запросами на обслуживание; управление высокого уровня и контроль соблюдения политик; мониторинг и измерение параметров; поддержка мультиоблачных сред; оптимизация и прозрачность затрат; оптимизация мощностей и ресурсов; миграция в облако и обеспечение катастрофоустойчивости (DR); управление уровнем обслуживания; безопасность и идентификация; автоматизация обновления конфигураций.
Управление данными в облачной среде должно обеспечивать высокий уровень доступности данных, контроля, автоматизации управления данными в дата-центрах, по периметру сети и в облаке.
Управление облачными данными (Cloud Data Management, CDM) – это платформа, которая используется для управления корпоративными данными в различных облачных средах с учетом частных, публичных, гибридных и мультиоблачных подходов.
Пример такого решения — Veeam Cloud Data Management Platform. Как утверждают разработчики системы, оно помогает организациям изменить подход к управлению данными, обеспечивает интеллектуальное автоматизированное управление данными и их доступность в любых приложениях или облачной инфраструктуре.
Управление облачными данными в Veeam считают неотъемлемой частью интеллектуального управления данными, обеспечивающего их доступность для бизнеса из любой точки.
Облачная платформа Veeam Cloud Data Management Platform позволяет модернизировать резервное копирование и отказаться от устаревших систем, обеспечивает ускоренное внедрение гибридного облака и перенос данных, автоматизацию безопасности данных и соответствия нормативным требованиям.
Veeam Cloud Data Management Platform — «современная платформа для управления данными, поддерживающая любое облако».
Как видно, современные платформы управления данными представляют достаточно обширный и разнообразный класс решений. Объединяет их, пожалуй, одно: нацеленность на эффективную работу с корпоративными данными и превращение компании или организации в современное предприятие, управляемое данными (data-driven enterprise).
Платформы управления данными — необходимая эволюция традиционного управления данными. Все больше организаций переносят данные в облако, в растущем числе различных локальных и облачных конфигураций возникают новые проблемы, которые необходимо решать именно с точки зрения управления данными. Управление данными в облаке — обновленный подход, новая парадигма, расширяющая функции управления данными для поддержки новых платформ, приложений и сценариев использования.
Кроме того, по данным исследования Veeam Cloud Data Management Report за 2019 год, компании планируют глубже интегрировать облачные технологии, технологии гибридного облака, аналитики больших данных, искусственного интеллекта и интернета вещей. Как ожидается, внедрение этих цифровых инициатив принесет компаниям значительные выгоды.
Предприятия ускоренными темпами внедряют технологии платформ данных и готовы задействовать облако для выполнения аналитических рабочих нагрузок, однако многие сталкиваются с проблемами, пытаясь использовать все свои данные для достижения лучших бизнес-результатов, считают аналитики компании 451 Research. Новейшие платформы управления данными помогут предприятиям ориентироваться в сложных процессах работы с данными в нескольких облаках, использовать средства управления данными и выполнять их анализа независимо от того, где эти данные находятся.
Так как мы стараемся идти в ногу со временем и ориентируемся на пожелания наших клиентов (как нынешних, так и потенциальных), то хотим спросить у хабрасообщества, хотелось бы вам видеть Veeam в нашем маркетплейсе? Ответить можно в опросе ниже.
Актуальность темы управления данными (Data Governance) растет с каждым годом. Действительно, необходимость организации процессов, направленных на повышение эффективности сбора, обработки, хранения и использования данных как ценного актива, уже очевидна практически всем компаниям. Много сказано о том, какие преимущества приносят компании правильно выстроенные процессы управления данными, и многие организации уже начали внедрение этой инициативы. При этом организации часто допускают похожие ошибки, которые негативно влияют на темпы внедрения и эффективность создаваемых процессов управления данными. О том, какие это ошибки, как их избежать и на какие вопросы организация должна найти ответы в процессе внедрения Data Governance, в материале, подготовленном для TAdviser, рассказывает Светлана Бова, Chief Data Officer банка ВТБ.
Содержание
Зачем компании управление данными?
Иногда организация начинает внедрение процессов управления данными, не понимая конечных целей и измеримых показателей их достижения. Также отсутствует оценка текущего уровня зрелости организации в части управления данными и стратегия развития функции.
Инициатива может быть продиктована внешними факторами, такими как общий тренд на цифровую трансформацию, внедрение процессов управления данными в компаниях конкурентах («у них есть, нам тоже нужно»), при этом внутренние предпосылки отсутствуют или непрозрачны для руководства компании. Таким образом, происходит попытка внедрения того, к чему компания не готова. Более того, возможно компании это и не нужно именно в настоящий момент. Естественно, перспективы становятся довольно туманными.
Как этого избежать?
С чего начать?
Стоит отметить, что ни в коем случае нельзя пытаться сразу улучшить качество всех данных в организации или описать в бизнес-глоссарии все термины, используемые в компании. Относительно управления данными, можно сформулировать принцип Парето следующим образом: «20% всех данных критически влияют на 80% бизнес-процессов компании».
Правильным подходом в данном случае будет следующая последовательность шагов:
Необходимо выявить самые критичные с точки зрения бизнеса процессы, определить данные, существенно влияющие на эффективность этих процессов, зафиксировать начальную оценку эффективности процессов. Далее последовательно шаг за шагом повышать уровень качества, доступности данных и описания их метаданных. По завершении работ оценить, насколько удалось достичь заявленных бизнес–целей и переходить на активности по следующему бизнес-процессу, масштабируя таким образом деятельность по системной работе с данными.
Что главное в управлении данными?
Поэтому я выделяю следующие в порядке значимости приоритетные направления работ по управлению данными:
Конечно, технологии необходимы, но все же они вторичны по отношению к людям и организации процессов.
Кто такой владелец данных?
Бывает, что менеджмент организации считает управление данными технологической инициативой. Данные хранятся в ИТ-системах, это означает, что и отвечать за них (владеть ими) должны ИТ-специалисты. Это в корне неверное утверждение. Также часто применяется концепция, когда владельцами данных назначаются подразделения, использующие данные в своих процессах, например, для подготовки финансовой отчетности. То есть данными владеет тот, кто больше всех заинтересован в их качестве. Такой подход возможен, но все же он не является достаточно эффективным.
Если, например, потребитель покупает в магазине некачественный товар, кому он предъявит претензии? Конечно производителю товара. Так и с данными: ими может владеть только тот, кто их создает, тот, в чьем процессе данные рождаются на свет, тот, кто может непосредственно влиять на эффективность процесса производства данных. В том числе регламентировать процессы ввода данных в ИТ-системы, процессы контроля качества данных, как автоматизированные, так и ручные, инициировать необходимые доработки ИТ-систем.
Каким должен быть CDO?
CDO считается тяжелым профилем кандидатов для поиска и найма, и этому есть несколько причин: во-первых, в России практика выделения деятельности по управлению данными в отдельную функциональную единицу организации существует не так давно, во-вторых, пока не выстроен учебный институт по данной профессии в отличии от мирового сообщества, в-третьих, не накоплена статистика успешных людей на данной позиции, именно поэтому так неоднозначно и затруднительно бывает составить требования к кандидату на позицию лидера по управлению данными в каждой конкретной организации.
Иной раз, компания определяет для себя, что технические компетенции являются основными для директора по данным. Да, технические компетенции нужны, в том числе и знания в области хранилищ данных, инструментов преобразования данных, навыки проектирования и так далее. Но, мировые практики доказывают, что гораздо важнее другое. CDO – это прежде всего стратег, который определяет стратегию компании по работе с данными. CDO – это бизнесмен, который креативно предлагает бизнесу пути повышения эффективности процессов за счет управления данными. И в конце концов, CDO – это миссионер, задача которого обратить каждого в организации в свою веру: веру важности данных как ценного актива.
Поэтому основные необходимые CDO компетенции можно представить следующим образом в порядке значимости:
Когда заканчивается инициатива по управлению данными?
Существует мнение, что управление данными это конечный проект, разовое упражнение по очистке и инвентаризации данных. Однако это не так. Мир вокруг стремительно меняется, данные исчезают и появляются, мигрируют информационные системы, меняются требования к данным. Поэтому после внедрения Data Governance фреймворка работы по управлению данными должны быть продолжены в регулярном ежедневном режиме в рамках операционной деятельности компании. Непрерывная работа по совершенствованию сбора, обработки, хранения данных, повышению их качества и проникновению идеи ответственного к ним отношения становится неотъемлемой частью жизни и культуры компании. Только тогда можно смело говорить об успехе внедрения инициативы по управлению данными.
Тим Филлипс. Управление на основе данных
Управление на основе данных Тима Филлипса – доступное и наглядное руководство по управлению на основе данных. В последние годы популярность обрела тема «больших данных». Нам обещали, что эта концепция произведет революцию в нашей жизни и работе. Но многие люди не способны справиться даже с малым объемом данных. Мы продолжаем принимать решения на уровне интуиции, даже когда она нас подводит. Если вы хотите добиться роста, и при этом ваши конкуренты в ведении бизнеса опираются на данные, а вы продолжаете «играть в угадайку», ваши шансы на успех ничтожно малы. В будущем навыки работы с данными станут ключевыми, аналогично умению читать и писать. Умелое обращение с данными будет означать, что вы останетесь востребованным специалистом или менеджером.
Тим Филлипс. Управление на основе данных. Как интерпретировать цифры и принимать качественные решения в бизнесе. – М.: Манн, Иванов и Фербер, 2017. – 192 с.
Скачать конспект (краткое содержание) в формате Word или pdf
Купить цифровую книгу в ЛитРес, бумажную книгу в Ozon или Лабиринте
Часть 1. Начинаем работать с данными
Учимся считать. Многие никогда не задавались вопросом, какие страницы на вашем сайте наиболее посещаемые, хотя Google Analytics можно использовать бесплатно (см. Брайан Клифтон. Google Analytics для профессионалов). При помощи этого инструмента можно узнать, какие разделы вашего сайта никогда не просматривают, какие продукты ищут посетители странички или с каких других ресурсов к вам переходят пользователи (я широко использую GA в работе над сайтом; см., например, Наиболее популярные конспекты книг. – Прим. Багузина).
Время – деньги. Компания Atlassian подготовила инфографику на тему того, как мы проводим время на работе. Основной вывод авторов: в течение дня на продуктивную работу тратится 60% времени. Провести мониторинг рабочего времени можно при помощи приложения Toggl – оно напоминает чуть более сложный секундомер. Этот метод действует еще более эффективно, если сначала поставить цель. Например, решить не работать по выходным или определить, в какой день лучше всего работать из дома.
Социальные медиа – это цифровые технологии, впервые в истории отношение людей датафицируется в тот момент, когда его выражают. В социальных сетях сосредоточен настолько огромный объем информации, что такие компании, как Facebook и Twitter, фактически обезличивают персональные данные и предлагают эту информацию специалистам по работе с данными, а те, проанализировав ее, продают результаты анализа дальше. Такой огромный поток социальных данных называется firehose («пожарный шланг»).
Но вам нет необходимости хвататься за этот «пожарный шланг». Вы и сами можете вести счет своим «лайкам», «ретвитам» и «+1». Twitter предоставляет статистическую информацию по вашему аккаунту, а помочь работать с этой аналитикой могут такие приложения, как Tweetdeck, Sprout Social или SocialOomph.
Однако, не стоит расценивать действия в социальных сетях как намерение потратить деньги или взять на себя серьезное обязательство в реальной жизни. Очень легко начать слишком доверять социальным сетям, но все же не стоит этим увлекаться.
Большие данные – это высшая цель и завершающий этап датафикации: идея о том, что все данные, которые создаются в цифровой реальности, могут быть полезны для улучшения мира, который произвел эти данные (см. Кукьер К., Майер-Шенбергер В. Большие данные. М.: Манн, Иванов и Фербер, 2014). В 2000 году только около четверти всех данных хранились в цифровом виде. Сегодня это 99%.
Перспектива больших данных в том, что мы сможем узнать еще больше. Хотя не все так просто. Датафикация не гарантирует финального результата, который вы сможете использовать. Подавляющий объем новых данных плохого качества или с трудом поддается анализу. Большие данные позволяют поставщикам услуг создавать экспертные системы на основе машинного обучения и искусственного интеллекта. Самым простым примером может служить рекомендательный сервис интернет-магазина Amazon «Люди, купившие это…» (подробнее см. Педро Домингос. Верховный алгоритм). Эти экспертные системы датафицируют функции, которые раньше относились к области человеческих навыков, например, набор текста и перевод.
Часть 2. Пять основных принципов работы с данными
Для хранения больших массивов информации используются базы данных. Для небольших по масштабу данных чаще используют Microsoft Excel. В форматах PDF или Word данные словно перестают существовать: чтобы воспользоваться этой информацией, ее нужно заново набрать или, если повезет, скопировать и вставить. При обновлении источника данных свежая информация никогда не попадет в документ в текстовом редакторе. Такие документы устаревают ровно в минуту их создания. При использовании баз данных и таблиц, если немного постараться, можно добиться того, чтобы актуальность данных поддерживалась.
Составляйте таблицы. Эдвард Тафти, специалист по информационному дизайну, – человек, который больше всех думает о том, как эффективно доносить информацию до других. Тафти считает, что «графический мусор» (то есть то самое замысловатое форматирование, которое пользователи применяют для оформления таблиц) представляет собой «очевидный признак статистической глупости» (к сожалению, Эдвард Тафти не дает разрешение на перевод и публикацию своих книг за пределами США, поэтому в рунете можно найти лишь разрозненную информацию о его методах; см., например, Принцип Эдварда Тафти минимизации количества элементов диаграммы, Как с помощью диаграммы приукрасить действительность? или о факторе лжи Эдварда Тафти).
Принцип создания таблиц по Тафти заключается в том, что каждая единица информации и каждый элемент дизайна должны помогать пользователю лучше понять тему. Самый эффективный способ этого добиться – удалить все отвлекающие факторы и структурировать информацию так, чтобы она соответствовала образу мышления человека. В качестве примера возьмем таблицу, отражающую долю выживших онкологических больных, из научной работы Германа Бреннера (рис. 1).
Рис. 1. Относительная доля выживших онкопациентов
А вот таблица Тафти (она содержит все те же самые данные):
Рис. 2. Доля выживших пациентов (отредактировано Тафти)
Сортируйте данные. Не используйте профессиональный жаргон в названиях столбцов и строк. Обратите внимание на то, как в легенде таблицы, находящейся вверху, где пользователи прочитают ее раньше, чем перейдут к цифрам, объясняется, что означают цифры. Показатели стандартной ошибки больше не заключены в скобки, и потому читать их стало проще.
Не стоит автоматически применять форматы, предлагаемые Excel. В большинстве случаев они слишком вычурные. Взгляните на таблицу, созданную Тафти: форматирования практически нет, так как линии и цвета отвлекают от цифр.
Диаграммы способны не только структурировать информацию, но и сделать ее непонятной (см. Джин Желязны. Говори на языке диаграмм). Для начала вы должны спросить: «Всем ли понятно, что я хочу показать диаграммой?». Ниже представлена диаграмма, демонстрирующая рост числа сотрудников.
Рис. 3. Рост числа сотрудников
Название диаграммы говорит о том, что число сотрудников увеличилось, но, чтобы убедиться в этом придется напрячь зрение. Должна ли ось значений начинаться с нуля? (Вопрос об усеченной вертикальной оси впервые был поднят в 1954 году в книге Даррелла Хаффа. Как лгать при помощи статистики, которая до сих пор остается самой популярной книгой об этой науке). Если возможное число сотрудников никогда не было меньше 9, пусть все внимание будет направлено на историю, которую вы хотите рассказать, а не на девять десятых, которые не так важны. Ниже приведена та же самая диаграмма, но теперь по форме подачи информации она соответствует названию.
Рис. 4. Рост числа сотрудников; изменена точка начала отсчета и масштаб по оси ординат
Остерегайтесь 3D. Прелесть плоских столбиковых диаграмм в том, что они отражают одну зависимость: высота столбца соответствует данным.
Устанавливайте закономерности. Графики часто рассказывают историю взаимосвязи данных. Разобравшись с этой историей, вы сможете принять правильное решение. Ниже приводится таблица, демонстрирующая, как часто британское правительство называло состоятельных людей «производителями материальных благ» (рис. 5).
Рис. 5. Количество упоминаний в СМИ выражения «производителями материальных благ»
На точечной диаграмме стало очевидно, что цифры увеличиваются (рис. 6).
Рис. 6. Число статей в британской прессе с упоминанием «производителей материальных благ»
В чем заключается моя история? Чтобы выявить закономерности, я разделил данные на две части. В период с 2000 по 2006 год линия наилучшего соответствия была горизонтальной. В период с 2006 по 2012 год она пошла вверх. Из этого можно сделать вывод, что термин «производители материальных благ» начал активно вводиться в употребление после 2006 года (рис. 7). Насколько это соответствует действительности? Статистика – точная наука, но анализ закономерностей всегда субъективен.
Рис. 7. Выявление закономерностей в публикациях
Ищите среднее. Есть три средних значения, которые обычно применяются: среднее арифметическое, медиана, мода (подробнее см. Определение среднего значения, вариации и формы распределения. Описательные статистики). К сожалению, среднее значение часто отвлекает от более полезной информации. Тиранию средних значений можно победить с помощью вопроса: что на самом деле означает это среднее, насколько оно помогает вам принять решение? Помните, что данные, на основе которых вы можете действовать, обычно включают в себя анализ того, из чего складывается это среднее.
Качественный дэшборд (Dashboard) может оказать помощь в принятии решений на основе данных. Это эффективный инструмент, позволяющий руководителю выработать полезные привычки работы с данными. Признаки качественного дэшборда: вся информация, необходимая для работы, собрана на одном экране; информация постоянно обновляется, так что вы уверены, что пользуетесь актуальными данными; на ней выделены важные моменты.
Каждый элемент статистики должен нести значимую информацию: этот показатель лучше запланированного или хуже? Задачи, требующие активных действий, сразу должны бросаться в глаза. В плане работ или таблице используйте условное форматирование и выделяйте «проблемные» ячейки, например, красным, чтобы вам не приходилось их искать. Это подразумевает, что вам нужно установить цели до того, как вы создадите дэшборд.
Возможно, вы решите нанять программиста. В этом случае ищите специалиста, имеющего опыт разработки интерфейсов; чем больше логики и меньше флеш-технологий, тем лучше.
Ошибки суммируются. Многие цифры бывают очень точными, но это не означает, что они правильные. Даже сказать, сколько товаров и услуг производит наше государство, мы можем лишь приблизительно, с точностью до плюс-минус нескольких миллиардов. При этом мы все равно указываем подозрительно точные цифры в политических целях и для создания газетных статей на тему эффективности и роста экономики. Мы склонны переоценивать надежность измеряемых данных, а также находить закономерности и тренды в том, что может оказаться лишь погрешностью в вычислениях.
Часть 4. Куда вы направляетесь?
Даниэль Канеман, которому в 2002 году была присуждена Нобелевская премия за работу о том, как люди принимают (ошибочные) решения, предупреждает о том, что «эксперты не знают точно, где граница их профессионального опыта (см. Канеман, Словик, Тверски. Принятие решений в неопределенности: Правила и предубеждения). Лидерство в нашем понимании ассоциируется с решительностью. По словам Канемана, «некоторые завоевывают репутацию успешных людей, хотя фактически все, что они сделали, – это рискнули в ситуации, в которой ни один здравомыслящий человек не пошел бы на риск». Или, как сформулировал это бизнес-гуру Томас Питерс: «У хороших руководителей всегда перекос в сторону действий».
Проблема ли это? Да, поскольку у перекоса в сторону действий есть обратная сторона: недостаточное внимание к анализу информации. Прогнозирование становится важной частью бизнес-процесса (подробнее см. Прогнозирование на основе экспоненциального сглаживания). Анализ трендов, то есть прогнозирование на основе прошлой деятельности, – весьма практичный метод. Его недостаток заключается в предположении, что исходные условия остаются такими же.
Прогнозный рынок – штука увлекательная, но редкая. Если бы все сотрудники вашей компании могли сделать ставку на какое-то событие, на что именно они бы поставили и сколько (см. Дункан Уоттс. Здравый смысл врет. Почему не надо слушать свой внутренний голос).
Что может пойти не так? Психолог Гэри Клейн придумал технику для повышения качества анализа: «В случае провала проекта, как правило, обсуждают, почему все пошло не так и какие уроки из этого можно извлечь, – как посмертное вскрытие. Почему бы не делать то же самое, только в начале? Еще до запуска проекта можно заявить: «Мы смотрим в хрустальный шар и видим, что наш проект потерпел провал. А теперь все быстренько взяли ручки, и у вас есть две минуты, чтобы набросать причины, которые, по вашему мнению, к этому привели»».
Оценка риска при принятии решений – процесс чрезвычайно сложный (см. Герд Гигеренцер. Понимать риски). На основании своего приемлемого уровня риска можно попробовать провести быстрый расчет ожидаемой доходности. Показатель ожидаемой доходности – это сумма ожидаемого дохода по всем статьям, умноженная на коэффициент вероятности его достижения. Так, ожидаемый показатель при броске игрального кубика:
(1/6 * 1) + (1/6 * 2) + … + (1/6 * 6) = 3,5
Проделайте то же самое для ваших сценариев. Если итоговое число получилось отрицательным, это свидетельствует о высокой вероятности потерпеть убыток и может стать серьезным аргументом в пользу того, что, возможно, вам не стоит даже рассматривать этот вариант в качестве решения.
Внимания также заслуживает концепция «черных лебедей» Нассима Николаса Талеба (см. Нассим Талеб. Черный лебедь. Под знаком непредсказуемости). Существует небольшая вероятность настоящей катастрофы. Моделированием подобной вероятности редко занимаются всерьез, но почему нет? Проблема риска заключается в том, что он нелинейный.
Избегайте соблазна экстраполировать прогнозы на несколько лет вперед. Если вы когда-нибудь спорили на очевидные темы или писали планы, что вы будете делать через пять лет, значит, вы знаете, что такое иллюзия уверенности.
Самый важный финансовый коэффициент – это окупаемость инвестиций, или ROI (от англ. return on investment). Если вам нужно сделать выбор из нескольких вариантов, например, открыть офис в регионе Х или регионе Y, – один из наиболее часто применяющихся методов оценки качества инвестиций – чистая приведенная стоимость (NPV; подробнее см. Оценка эффективности инвестиций).
Часть 5. Аргументы на основе фактов
Данные: исходные или подтасованные. Данные рассказывают нам историю, но это не означает, что она правдива. Звучное словосочетание «голые факты» вводит в заблуждение. Очень часто данные фальсифицируют. Самый очевидный способ слегка «подкорректировать» статистику заключается в том, что кто-то выбирает выгодные ему показатели для измерения, зная, что вы не можете посчитать все.
В 2013 году исследователь Стэнфордского университета Джон Иоаннидис наугад выбрал 50 продуктов из кулинарной книги и обнаружил, что для 80% из них есть хотя бы одна научная работа, доказывающая, что они вызывают рак, и одна – доказывающая, что они служат средством профилактики рака. Однако продавец будет ссылаться на информацию, отражающую только одну сторону.
Неверные причинно-следственные отношения. Результаты одного из нашумевших исследований свидетельствовали о том, что курение повышает вероятность самоубийства. Ужасно! Через несколько лет результаты этого исследования были оспорены, когда исследователи доказали, что курильщики также в два раза чаще погибают насильственной смертью. Подсказка: причину и следствие поменяли местами. У людей, испытывающих депрессию, стресс, постоянно подвергающихся опасности, гораздо выше вероятность того, что они начнут курить.
Неправильный выбор временных рамок. Начало и завершение периода, за который делается отчет, имеет значение. Происходит ли глобальное потепление в последние годы? Кривая графика будет зависеть от того, что вы подразумеваете под словами «в последние годы».
Корреляция не гарантирует причинно-следственную связь. Обычно данные не отвечают на вопрос «почему?», а только на вопрос «что?». Корреляция между двумя явлениями означает, что, если мы стали чаще видеть одно из них, мы также отмечаем изменение частоты, с которой встречаем второе. При этом, если мы отмечаем одновременное изменение двух количественных показателей и предполагаем, что один из них стал причиной второго, это предположение вполне может оказаться ошибочным. Ложные корреляции – это то, что получается, когда вы просто собираете большой массив данных и начинаете копаться в них в поисках взаимосвязей.
Часть 6. Управление на основе данных
Копирование – это не управление. Если слушать слишком много советов, то наступает момент, когда вам рекомендуют делать прямо противоположные вещи. Например, СЕО компании Amazon Джефф Безос уверен, что запустить процесс инноваций можно, только если интересоваться у людей их потребностями. Стив Джобс придерживался противоположного мнения: «Люди не знают, чего хотят, пока вы это им не покажете».
Успех бывает двух видов. В первом случае это неизбежный результат тщательного планирования и анализа, которому ничто не могло помешать. Это так называемый «идеальный успех», в природе его не существует. Второй вид успеха — это результат эффективного планирования, правильно выбранного времени и еще некоторых факторов, которые в совокупности можно назвать удачей, то есть благоприятным стечением обстоятельств, которое невозможно прогнозировать. Вы не можете запланировать стать удачливым.
Когда мы видим, что кто-то добился успеха, то часто рационализируем произошедшее; в нашем сознании это становится «идеальным успехом», и, возможно, мы даже начинаем пытаться в точности его скопировать (на этом ложном подходе основано исследование Джима Коллинза От хорошего к великому. Почему одни компании совершают прорыв, а другие нет… что, правда не помешало ему стать бестселлером).
В своей книге Думай медленно… решай быстро Даниэль Канеман говорит: «Если сгруппировать все успешные компании и проанализировать, что их объединяет, единственным адекватным ответом будет – удача».
Интуиция или данные? И то и другое. Невозможно вести бизнес на одной интуиции, но, скорее всего, совсем игнорировать внутренний голос тоже нельзя. Секрет в том, чтобы знать, когда к нему стоит прислушаться. Как однажды сказал один из величайших экономистов ХХ века Артур Пигу: «Разве кто-нибудь когда-нибудь наймет экономиста для управления пивоварней?»
В повседневной жизни мы все используем эвристические правила, основанные на прежнем опыте: мы не можем обдумывать каждое мельчайшее решение, иначе у нас просто не останется времени действовать. Так что интуиция – это способ избежать чрезмерного обдумывания чего-либо, когда это лишено смысла. С другой стороны, по мнению Канемана, вероятность ошибки при принятии интуитивного решения гораздо выше, чем кажется.
Что если? Вы проверяете сотрудников. Вы тестируете свою продукцию. Почему бы в таком случае не проверять и ваши решения? Эксперименты – это один из важнейших способов принятия решений в компании Google. Один из лучших способов исследования – это рандомизированное контролируемое исследование. Для его проведения вы случайным образом формируете две группы: А и В. Вы изменяете только один фактор в группе В и оцениваете результат. Если он оказался другим, то, скорее всего, это вызвано изменением того самого фактора (подробнее см. Фишер. Статистический вывод).
Границы уверенности. Мы часто меняем наши представления без должного обоснования, лишь на основе полученных результатов. Эту проблему изучает так называемая байесовская статистика, которая в значительной степени легла в основу искусственного интеллекта. Неопределенность исходных условий, даже при возможности точно ее оценить, часто может ввести в заблуждение, если мы принимаем решения, основываясь исключительно на результатах.
Рассмотрим пример, который назовем «поиск виноватого». Предположим, вы знаете, если у вас будет хорошая команда, только 10% ваших проектов потерпят неудачу. Если команда будет плохая, провалятся все проекты. Вы подбираете команду на новый проект, но проект проваливается. Предположим, мы провели этот эксперимент 100 раз. Вот что мы можем ожидать в качестве результата:
Рис. 8. В чем причина провала проекта
Анализируя провал, что вы назовете его причиной: ваш плохой выбор (10-ка в первой строке) или случайную неудачу (9-ка)? Скорее всего, вы будете склонны винить во всем случай, но гораздо более вероятно, что вы выбрали неподходящих сотрудников (подробнее о том, как строятся подобные таблицы см. Идеи Байеса для менеджеров и Естественная частота против байесовского подхода).
Бюджет компании часто строится на основании объема расходов за предыдущий год. Однако прошлое часто не лучший советчик для будущего. В 1970 году Питер Пирр опубликовал статью «Бюджетирование с нуля». Для составления бюджета следует одно за другим проанализировать каждое направление деятельности компании, оценить, каких они потребуют вложений и какой будет возврат на инвестиции, а затем на основании этого расставить приоритеты в статьях расходов. Полученный в результате бюджет часто значительно отличается от того, который составляется исходя из прошлогодних показателей.
Для людей, привыкших к традиционным методам бюджетирования, концепция бюджетирования с нуля может показаться безумной идеей. Часто компании идут по проторенному пути из-за когнитивного искажения под названием якорение, в результате которого люди убеждены, что лучший вариант тот, который они уже реализуют, несмотря на все доказательства обратного.
Дорога без конца. Данные можно считать полезными, только если их использование привело к изменению ваших решений. Внедрите механизм анализа данных в творческий процесс для быстрого и регулярного повышения качества вашей деятельности в целом. Это основа так называемых гибких методов развития, которые были созданы для разработки программного обеспечения в 1986 году и сегодня активно применяются в других процессах.
Применение гибкой методологии развития на основе постоянной обратной связи служит наглядным примером внедрения процесса принятия решений, основанного на данных, в область управления, которая традиционно опирается либо на жесткие правила, либо на интуицию. Вам будет сложно перейти на эту концепцию, если вы привыкли к интуитивному, авторитарному планированию.
Часть 7. Почему следует опираться на данные
Шесть причин не доверять интуиции: