Darbe.ru

Быт техника Дарби
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Средство Excel «Поиск решения»

Средство Excel «Поиск решения»

Решение задач прикладной информатики в менеджменте.

Практическое занятие 5.

Средство Excel «Поиск решения»

Цель работы:
изучение постановки задачи оптимизации и средства «Поиск решение»

Задачи оптимизации параметров объекта исследования

Оптимизационные модели служат для поиска наилучших, в определенном смысле, вариантов. В этом случае среди параметров модели выделяют один или несколько, доступных нашему влиянию – независимые переменные или управляемые параметры X . Среди выходных характеристик Y выделяют такую, которая позволяет оценить качество объекта – критерий оптимальности Q k .

С учетом введенных обозначений задача оптимизации формализуется следующим образом:

Q * k = extr Q k
X
Y j ( х ) j max

В зависимости от особенностей реального объекта, характера зависимости критерия оптимальности от независимых переменных и целей исследования различают задачи:

условной (при наличии дополнительных ограничений) и безусловной (без дополнительных условий) оптимизации;

одномерной (при одном управляемом параметре) и многомерной (несколько управляемых параметров) оптимизации;

линейной (при линейной зависимости критерия качества от параметров) и нелинейной оптимизации;

локальной (существует единственный экстремум) и глобальной (существуют несколько экстремумов) оптимизации.

Когда экономическую или техническую задачу удается привести к виду стандартной задачи оптимизации (1), ее решение можно получить одним из известных математических методов.

Существуют многочисленные программы, предназначенные для решения оптимизационных задач. Одной из таких программ является средство Excel «Поиск решения».

Средство Excel «поиск решения»

Средство Excel Поиск решения позволяет получить искомое значение в определенной ячейке, которую называют целевой , путем изменения значений нескольких влияющих ячеек. Кроме того, при поиске решения можно указать дополнительные условия – ввести ограничения на изменение параметров влияющих ячеек. Допускается установка до 200 изменяемых ячеек.

При поиске решения так же, как при рассмотренном ранее подборе параметра , целевая ячейка должна содержать формулу и прямо или косвенно зависеть от значений во влияющих ячейках.

Для выполнения операции Поиск решения использует команду меню Сервис – Поиск решения. Команда может отсутствовать в меню сервис. В этом случае нужно в меню Сервис выбрать команду Надстройки и установить в списке включенных надстроек нужный флажок:

Рисунок 1 Список подключенных настроек

Надстройки — это специальные средства, расширяющие вычислительные возможности Excel. Подключение надстроек увеличивает нагрузку на вычислительную систему, поэтому рекомендуется подключать только те из них, которые нужны для текущего сеанса работы.

Для выполнения операции Поиск решения нужно выполнить команду Сервис – Поиск решения и в диалоговом окне Поиск решения задать параметры решения:

адрес целевой ячейки, в которой будет подбираться значение;

критерий оптимальности (максимальное или минимальное значение) или значение, которое следует найти;

адреса изменяемых ячеек; при этом адреса отдельных ячеек или диапазонов разделяются запятыми; кнопка «Предположить» служит для автоматического выделения ячеек, влияющих на целевую;

ограничения, которые должны учитываться при поиске решения; для ввода нескольких ограничений используется кнопка «Добавить».

Рисунок 2 Диалог «Поиск решения»

Кнопка «Параметры» позволяет изменить параметры поиска: способ поиска решения, время вычислений, точность определения результатов.

Рисунок 3 Диалог установки параметров поиска решения

В большинстве случаев достаточно использовать настройки по умолчанию. Это окно позволяет так же сохранить модель поиска или загрузить ранее сохраненную модель.

Если поиск решения успешно завершен, то результаты вычислений заносятся в исходную таблицу, а в диалоговом окне Результаты решения пользователь имеет возможность

сохранить найденной решение в исходной таблице;

восстановить исходные значения;

сохранить результаты в виде сценария;

сформировать отчет по результатам выполнения операции.

Рисунок 4 Диалог «Результаты поиска решения»

Отчет по результатам поиска создается на отдельном рабочем листе и содержит информацию об исходных и конечных значениях целевой и влияющей ячеек и наложенных ограничениях.

В программе Excel-2007 средство «Поиск решения» вызывается пиктограммой из группы Анализ , расположенной на вкладке Данные.

Определение критического объема реализации с помощью поиска решений

Рассмотрим использование Поиска решений для решения уравнения.

Откройте рабочую книгу с калькуляцией тура, созданную на предыдущих занятиях.

Скопируйте заголовок и первую строку таблицы анализа затрат – доходов:

Объем
реализации
Q к

В столбце «Баланс» введите формулу: Прибыль от реализации — Затраты

С помощью средства «Поиск решения» определите величину Объема реализации, обеспечивающую нулевой баланс.

Указания.
1) Целевая ячейка в нашем случае – ячейка, в которой вычислен баланс; требуется установить в ней нулевое значение путем изменения ячейки с объемом реализации.

2) Математическая модель рассматриваемой задачи линейна.

3) Задача без ограничений.

Замечание. Иногда требуется проверить, какие ячейки влияют на вычисление значение в другой ячейке. Чтобы наглядно увидеть взаимное влияние ячеек, можно использовать команду меню Сервис – Зависимости формул – Влияющие ячейки (Зависимые ячейки).

Сравните результат с результатами, найденными графическим методом и с помощью средства «Подбор параметра».

Подбор параметра в Excel: решаем задачки-нерешучки

Здравствуйте, уважаемые читатели! В прошлой статье мы научились моделировать результат при разных входных параметрах, выполняя анализ «что если». Сегодня же мы разберем обратную задачу, не менее частую, сложную и насущную. Пусть нам известен результат, и нужно знать, какими должны быть входные величины для его получения. То есть, нужно подобрать решение задачи. Возможно ли это в Excel? Конечно возможно, давайте разбираться!

Читайте так же:
Можно ли вывозить янтарь из россии

Программа предоставляет нам два способа решения такой проблемы:

  1. Инструмент «Подбор параметра»
  2. Инструмент «Поиск решения»

Подбор параметра в Эксель

Это простой инструмент, который во многих случаях действительно выручает. Он варьирует значением в одной ячейке для получения определенного результата в другой. Как это работает?

Разберем на простом примере. Мы с Вами планируем открыть депозит с ежемесячным пополнением. Сейчас у нас на руках есть 10 тыс. у.е., но после окончания срока депозита, через 12 месяцев, хотим иметь капитал в 20 тысяч. Требуется посчитать, какую сумму нужно ежемесячно класть на депозит, чтобы через 12 месяцев накопить сумму в 20 тысяч у.е.

Вот наша таблица с расчетами:

В желтой таблице исходные данные: первый взнос, ежемесячный взнос, процентная ставка и срок вклада. В синем поле – конечный капитал, который мы посчитали с помощью функции БС.

Фактически нам нужно подобрать такое значение в ячейке В3, чтобы в В7 стало 20 000. Используем инструмент «Подбор параметра»:

  1. Жмем на ленте Данные – Работа с данными – Анализ «что если» — подбор параметра ;
  2. В открывшемся окне задаем данные для настройки:
    • Установить в ячейке: в этом параметре указываем ссылку на наше целевое значение, т.е. «Конечный капитал»;
    • Значение: здесь нужно указать то значение, которое должно быть в целевой ячейке, т.е. нужный результат вычислений. В нашем случае это 20 000;
    • Изменяя значение ячейки: Укажем ссылку на ячейку, значение которой нужно изменять, чтобы подбирать результат. В нашем примере это «Ежемесячный взнос»;

  1. Жмем Ок, программа будет искать решение. Когда оно будет найдено, Excel сообщит о завершении подбора. Нажимаем Ок в окне, чтобы принять найденное значение и записать его в ячейку, или Отмена, чтобы оставить все как было.

В нашем примере все сработало отлично, и мы узнали, что для получения капитала в 20 тыс, нужно ежемесячно добавлять на депозит по 736,55 у.е.

Иногда случается, что поиск решения не дал результата, тогда нужно проверить всё ли правильно:

  1. Первым делом удостоверьтесь, что целевая ячейка зависит от того значения, которое мы изменяем. Если итоговая формула не ссылается на изменяемое значение – восстановите эту зависимость и повторите поиск;
  2. Пробуем поставить в изменяемой ячейке значение ближе к искомому, очень часто это помогает;
  3. В Экселе ограничено количество итераций для подобного поиска. Возможно, этого количества не хватило, чтобы найти решение. Пробуем увеличить количество итераций. Для этого жмем Файл – Параметры – Формулы , а там в группе команд «Параметры вычислений» увеличьте предельное число итераций.

  1. Осмыслите вычисления, которые предлагаете произвести программе. Точно ли заданные Вами параметры имеют решение? Если не имеют – сделайте их корректными.

Обычно этих шагов хватает, чтобы найти значение, удовлетворяющее наш запрос.

Инструмент «Поиск решения»

Как Вы убедились, подбор параметра отлично и безотказно работает практически во всех случаях. Но у него есть недостаток – он манипулирует лишь одним значением для изменения результата. А что, если нужно построить более сложную систему вычислений? Тогда используем «Поиск решения».

И снова рассмотрим на примере. Спланируем производственный процесс на месяц для получения максимальной прибыли. Вот наша таблица заготовка:

В таблице имеем такие поля:

  1. Минимальная партия – минимальное количество товара, которое нужно произвести для обслуживания уже существующих заказов;
  2. Максимальная партия – наибольшее количество товара, которое можно произвести, исходя из запасов сырья
  3. Норма рабочего времени – количество человекочасов, необходимых для производства одного изделия;
  4. Затраты рабочего времени – количество времени, которое будет затрачено на производство всего запланированного. Пусть у нас работает 20 работников по 8 часов 22 дня в месяце. Тогда сумма по этому полю должна составить 3520 ч.
  5. Себестоимость – стоимость производства одной единицы продукции
  6. Цена реализации – рыночная стоимость одной единицы продукции
  7. Валовая прибыль – прибыль, которая будет получена от реализации изготовленного товара.

Для упрощения, будем считать, что спрос на товар выше производственных возможностей, и всё произведенное будет продано. Так сколько чего нам нужно произвести, чтобы получить наибольшую выгоду, а персонал трудился ровно 3520 ч? Запускаем «Поиск решения»:

  1. Ищем на ленте Данные – Анализ – Поиск решения . Кликаем, откроется окно настройки;
  2. В поле «Оптимизировать целевую функцию» задаем ссылку на сумму по столбцу «Валовая прибыль»;
  3. В поле «До» выбираем «Максимум». В других случаях можно выбрать «минимум», или задать какое-то конкретное значение;
  4. В списке «Изменяя ячейки переменных» указываем все строки столбца «Производим»
  5. Далее нужно внести все оговоренные выше ограничения. Для этого жмем «Добавить» и в открывшемся окне выбираем ссылки на ячейки и параметры их ограничения:

Вносим все оговоренные ограничения, они отобразятся в списке окна настройки:

  1. Суммарные затраты времени должны равняться 3520 часов;
  2. Производимое количество больше или равно минимальной партии
  3. Производимое количество меньше или равно максимальной партии
  4. Производимое количество должно быть целым числом

  1. Выбираем метод решения в соответствии с рекомендациями разработчиков внизу окна настроек. Мы выберем линейный метод. Жмем «Найти решение», по завершению поиска программа сообщает о результате.
Читайте так же:
Минус проценты в excel

В этом окне можно подтвердить внесение изменений в ячейки, либо вернуться к изначальному набору данных. Так же, отличным решением будет сохранить результаты поиска как сценарий . Позднее их можно будет восстановить и построить соответствующие отчеты.

Видим, что программа оптимизировала наши производственные процессы и направила в русло получения максимальной прибыли. При этом, у нас не будет переработок и недоработок. Таки образом, можно решать многие задачи планирования и проектирования бизнес-процессов.

Экспериментируя с многочисленными настройками инструмента, можно детально управлять процессом поиска. На самом деле, «Поиск решения» — очень функциональная и многогранная надстройка, познать все азы которой можно на сайте разработчика: www.solver.com.

Кстати, если Вы не нашли на ленте этот инструмент – не отчаивайтесь, его просто нужно подключить. Для этого нажмите Файл – Параметры – Надстройки . Внизу в раскрывающемся списке «Управление» выберите «Надстройки Excel» и нажмите «Перейти». В открывшемся окне поставьте галку напротив «Поиск решения» и нажмите Ок. Вот и всё, он сразу же появится ленте!

Вот такие существуют способы подгонки результатов, о которых мало кто знает и мало кто пользуется. Тем не менее, навыки работы с ними делают нашу жизнь проще, теперь не нужно вручную перебирать десятки или сотни значений, чтобы получить нужный результат!

Если у Вас что-то не получилось – задавайте свои вопросы в комментариях, будем разбираться вместе. Если все вышло — сбросьте другу ссылку на эту статью. Пусть и он использует Эксель в полной мере!

Экспериментируйте, а я отправляюсь писать следующий пост. До новых встреч на страницах блога officelegko.com!

Добавить комментарий Отменить ответ

4 комментариев

Добрый день, Александр!

Есть задача которую я не могу понять с помощью какой формулы описать решение, причем прописать эти формулы в гугл таблице, но думаю суть та же будет если сделать это и в эксели
если в кратце: то например я знаю что мне надо накопить 20000, то если откладывать каждый месяц по 10 000 то через 2 месяца я добъюсь цели, как это описать формульно чтобы эксель показал что в зависимости от того сколько накапливается в месяц я смогу накопить 20000? чтобы программа показала мне время через которое я накоплю средства есть столбец месяцев с суммами того что накопил в этих столбцах при этом там есть и пустыми суммы за декабрь например. Просто бьюсь уже 5 дней не могу понять возможно ли решение для такой задачи или нет. ссылка на файл о чем речь :
https://docs.google.com/spreadsheets/d/1kyP2HwB8WFeAqJkkANC9TxQCsIv3K-44Wfe3xabfQeA/edit?usp=sharing

Даниил, здравствуйте. Уточните пожалуйста вопрос.Вы хотите, чтобы программа считала срок исходя из какого-то обязательного ежемесячного платежа, или из средних ежемесячных накоплений за какой-то период?

Исходя из средних ежемесячных накоплений( суммы которых могут быть разными за месяцы) за какой либо период времени

Даниил, в Excel есть функция, которая считает средние значения — СРЗНАЧ. Тогда формула расчета количества месяцев будет такая: =<Остаток суммы>/СРЗНАЧ<Диапазон с данными по ежемесячному внесению средств>). Естественно, в фигурных скобках я указал описания, а вы укажите соответствующие ссылки на ячейки и диапазоны ячеек

II. Решение задачи в процедуре EXCEL «Поиск решения»

Сеть (граф) состоит из множества вершин (узлов) и множества дуг (ребер), соединяющих вершины. Длины дуг могут определять различные характеристики: расстояние, стоимость, время, пропускную способность и т.д. С помощью сетевых моделей можно поставить и решить большое число практически важных задач ИО. Такие задачи можно сформулировать решить как задачи линейного программирования. Но, учитывая их специфику, разработаны более эффективные методы решения.

Пример. Определить наикратчайший путь между вершиной 1 и вершиной 7 на графе с циклами, представленном на рис.1.

Для решения задачи в процедуре EXCEL «Поиск решения», представим ее как транспортную задачу с промежуточными пунктами. Будем считать, что транспортные расходы при перевозке одной единицы груза равны (в условных единицах) расстояниям между вершинами. Одна единица груза отправляется из вершины 1 (исходный пункт) и должна прибыть в вершину 7 (пункт назначения). Вершины 2, 3, 4, 5, 6 рассматриваются как промежуточные пункты, которые являются одновременно и исходными пунктами и пунктами назначения.

Требуется определить такую последовательность вершин, по которым должна перемещаться единица груза, отправленная из вершины 1, при которой стоимость транспортных расходов будет минимальна и груз попадет в вершину 7.

Так как транспортные расходы при перемещении груза из одной вершины в другую равны расстоянию между вершинами, то последовательность вершин, при которой транспортные расходы будут минимальными, определяет наикратчайший путь из вершину 1 в вершину 7. Матрица транспортных расходов, соответствующая данному графу, представлена на рис.2.

Исходные пунктыПункты назначенияКоличество груза
отправ. из пункта
ММ
МММ
МММ
М
М
М
Колич. груза прибыв.в пункт

Буквой М обозначается случай, когда между соответствующими вершинами нет пути. В качестве М берут число, значительно большее самого большего пути. В данной задаче наибольший путь между 5-й и 7-ой вершинами, поэтому можно взять, например, М=50. Для промежуточных пунктов 2, 3, 4, 5, 6 должны быть предусмотрены буферные емкости В. Буферная емкость должна быть не меньшей, чем количество груза, которое перемещается в сети, описываемой графом. В данной задаче В=1. После введения буферных емкостей в первый столбец и нижнюю строку таблицы и замены М=50, получим транспортную задачу, представляющую задачу о назначениях (Рис.3).

Читайте так же:
Можно ли изменить почтовый ящик
ИсходныеПункты назначенияКоличество груза
пунктыотправ. из пункта
Колич. груза прибыв.в пункт

Последовательные преобразования матрицы транспортных расходов показаны на рис.4а, 4б, 4в.

234567234567
1
2
3
4
5
6
Рис. 4аРис. 4б
234567234567
1
2
350595046
45451446
55043421
6650136
Рис. 4вРис.5

На рис.4б показаны результаты вычитания минимального элемента первой строки (он равен 2) из первой строки, на рис.4с приведены результаты вычитания минимального элемента из шестого столбца (он равен 4) и результат вычеркивания строк и столбцов с нулями. На рис.5 показаны результаты вычитания минимального элемента (он равен 1) из невычеркнутых элементов, и результат вычеркивания строк и столбцов второй раз.

На рис.6 приведены окончательные результаты преобразования и результаты допустимого выбора из множества нулей.

Перенеся эти результаты на исходную таблицу (рис.2), получим новую таблицу (рис.7).

Исход.Пункты назначенияКоличество груза
пунктыотправ. из пункта
ММ
МММ
МММ
М
М
М
Колич. груза прибыв.в пункт

Наикратчайший путь из вершины 1 в вершину 7 определяется следующей траекторией:

Длина наикратчайшего пути равна: 2+2+4=8.

II. Решение задачи в процедуре EXCEL «Поиск решения»

1) Ввод данных. Переносим данные задачи в EXCEL. Результаты заполнения таблицы EXCEL можно увидеть на рис.8:

В ячейках B4:G9 введены длины путей из исходных пунктов в пункты назначения.

Ячейки B12:G17 являются изменяемыми ячейками для нашей процедуры.

В ячейках B18:G18 находятся суммы значений соответствующих столбцов изменяемых ячеек.

в ячейке B18 находится сумма ячеек B12:B17;

в С18 находится сумма ячеек С12:С17;

в D18 находится сумма ячеек D12:D17;

в E18 находится сумма ячеек E12:E17;

в F18 находится сумма ячеек F12:F17;

в G18 находится сумма ячеек G12:G17.

В ячейках H12:H17 находятся суммы значений соответствующих строк изменяемых ячеек.

в ячейке H12 находится сумма ячеек B12 : G12;

в H13 находится сумма ячеек B13:G13;

в H14 находится сумма ячеек B14:G14;

в H15 находится сумма ячеек B15:G15;

в H16 находится сумма ячеек B16:G16;

в H17 находится сумма ячеек B17:G17.

Целевая функция заносится в ячейку I3 и вычисляется по формуле «СУММПРОИЗВ (B4:G9 ; B12:G17)».

2) Заполнение окна процедуры «Поиск решения».

целевая функция : I3;

значение целевой функции : min;

изменяемые ячейки: B12:G17;

B18:G18 = 1 и H12:H17 = 1;

B12 : G17 0 (ячейки должны иметь положительные значения).

В окне «Параметры» установить «Линейная модель», что соответствует решению задачи симплекс-методом. Результаты заполнения окна показаны на рис.9:

3) Выполнив процедуру «Поиск решения» в первоначальной таблице (рис. 8) получим следующие результаты (рис.10):

Путь минимальной длины:1 ® 2 ® 6 ®7, длина = 8. Эти результаты совпадают с решением данной задачи преобразованием матрицы транспортных расходов, приведенным выше.

Поиск решения

Поиск решений является частью блока задач, который иногда называют анализ «что-если».
Процедура поиска решения позволяет найти оптимальное значение формулы, содержащейся в ячейке, которая называется целевой.
Эта процедура работает с группой ячеек, прямо или косвенно связанных с формулой в целевой ячейке. Чтобы получить по формуле, содержащейся в целевой ячейке, заданный результат, процедура изменяет значения во влияющих ячейках. Чтобы сузить множество значений, используемых в модели, применяются ограничения. Эти ограничения могут ссылаться на другие влияющие ячейки.
Процедуру поиска решения можно использовать для определения значения влияющей ячейки, которое соответствует экстремуму зависимой ячейки — например можно изменить объем планируемого бюджета рекламы и увидеть, как это повлияет на проектируемую сумму расходов.
Встроенный инструмент Excel имеет ограничения. По числу переменных: Nv и по числу ограничений: Nc .

Как подключить Поиск решения

Интерфейс надстройки Поиск решения

Поиск решения находится в блоке Данные основного меню MS Excel

Поиск решения в меню данные

При нажатии Поиск решения появится панель интерфеса надстройки

Оптимизировать целевую функцию.
В этом поле нужно указать целевую ячейку, значение которой необходимо максимизировать, минимизировать или установить равным заданному числу. Эта ячейка должна содержать формулу.

Изменяя ячейки переменных.
В этом поле указывают ячейки, значения которых меняются в процессе поиска решения. Значения изменяются до тех пор, пока не будут выполнены наложенные ограничения и условие оптимизации целевой ячейки, указанной в поле Оптимизировать целевую функцию.

В соответствии с ограничениями.
В этом поле отображается список граничных условий, которые вводятся с помощью клавиши Добавить.

Выберите метод решения.
Здесь можно выбрать линейную или нелинейную задачу следует решать.

Your browser does not support the HTML5 canvas tag.

Найти решение. Эта клавиша запускает надстройку Поиск решения.

До. Здесь нужно выбрать вариант оптимизации значения целевой ячейки: должно значение быть максимальным, минимимальным или равным заданному числу. Заданное число вводится в это поле.

Вызывает диалоговое окно Добавление ограничения.

Читайте так же:
Можно ли ездить на машине умершего родственника

Вызывает диалоговое окно Изменение ограничения.

Удаляет выделеное ограничение.

Сбрасывает все настройки.

Сохраняет и загружает модель задачи.

При нажатии клавиши Добавить появляется диалоговое окно

Добавление ограничения

В поле Ссылка на ячейки указывают ячейки, которые должны меняться.

В поле Ограничения указывают ячейки, в которые записаны ограничения.

При нажатии клавиши Изменить появляется диалоговое окно

Изменение ограничения

В этом окне можно изменить введеные ранее ограничения.

Пример применения надстройки Поиск решения

формулировка задачи

Небольшая компания «Фасад» производит 3 типа дверей: стандартные, полированные и резные.
Компания работает «под заказ», поэтому продает всю производимую продукцию. На производстве работают 10 рабочих в одну смену (8 рабочих часов) 5 дней в неделю, что дает 400 часов в неделю. Рабочее время поделено между двумя существенно различными технологическими процессами: собственно производством и конечной обработкой дверей. Из 400 рабочих часов в неделю 250 отведены под собственно производство и 150 под конечную обработку. В таблице приведены временные затраты и прибыль от продажи одной двери каждого типа.
Сколько дверей различных типов нужно производить, чтобы максимизировать прибыль?

Как найти выбросы в Excel (и как с ними справиться)

При работе с данными в Excel у вас часто возникают проблемы с обработкой выбросов в вашем наборе данных. Выбросы довольно часто встречаются для всех видов данных, и важно идентифицировать и обрабатывать эти выбросы, чтобы убедиться, что ваш анализ правильный и более значимый.

В этом руководстве я покажу вам, как находить выбросы в Excel , а также некоторые методы, которые я использовал в своей работе для обработки этих выбросов.

Что такое выбросы и почему их важно найти?

Выброс — это точка данных, которая выходит за рамки других точек данных в наборе данных. Если у вас есть выброс в данных, это может исказить ваши данные, что может привести к неверным выводам.

Приведу простой пример.

Допустим, 30 человек едут на автобусе из пункта назначения А в пункт назначения Б. Все люди относятся к одной весовой группе и группе доходов. Для целей этого руководства давайте рассмотрим, что средний вес составляет 220 фунтов, а средний годовой доход — 70 000 долларов.

Сейчас где-то посередине нашего маршрута автобус останавливается, и в него садится Билл Гейтс.

Как вы думаете, как это повлияет на средний вес и средний доход людей в автобусе?

Хотя средний вес вряд ли сильно изменится, средний доход пассажиров автобуса резко вырастет.

Это связано с тем, что доход Билла Гейтса является исключением в нашей группе, и это дает нам неправильную интерпретацию данных. Средний доход каждого человека в автобусе составит несколько миллиардов долларов, что намного превышает реальную стоимость.

При работе с фактическими наборами данных в Excel вы можете иметь выбросы в любом направлении (например, положительный выброс или отрицательный выброс).

И чтобы убедиться, что ваш анализ верен, вам нужно каким-то образом идентифицировать эти выбросы, а затем решить, как лучше всего их лечить.

Теперь давайте посмотрим несколько способов найти выбросы в Excel.

Найдите выбросы путем сортировки данных

С небольшими наборами данных быстрый способ выявить выбросы — просто отсортировать данные и вручную просмотреть некоторые значения в верхней части отсортированных данных.

А поскольку выбросы могут быть в обоих направлениях, убедитесь, что вы сначала сортируете данные в порядке возрастания, а затем в порядке убывания, а затем просматриваете верхние значения.

Позвольте мне показать вам пример.

Ниже у меня есть набор данных, в котором у меня есть продолжительность звонков (в секундах) для 15 звонков в службу поддержки.

Ниже приведены шаги по сортировке этих данных, чтобы мы могли идентифицировать выбросы в наборе данных:

  • Выберите заголовок столбца, который вы хотите отсортировать (в этом примере ячейка B1).
  • Перейдите на вкладку «Главная»
  • В группе «Редактирование» щелкните значок «Сортировка и фильтр».
  • Щелкните Custom Sort (Пользовательская сортировка).
  • В диалоговом окне «Сортировка» выберите «Продолжительность» в раскрывающемся списке «Сортировка по» и «От наибольшего к наименьшему» в раскрывающемся списке «Порядок».
  • Нажмите ОК

Вышеупомянутые шаги сортируют столбец продолжительности звонка с наивысшими значениями вверху. Теперь вы можете вручную просмотреть данные и посмотреть, есть ли выбросы.

В нашем примере я вижу, что первые два значения намного выше остальных значений (а два нижних намного ниже).

Примечание. Этот метод работает с небольшими наборами данных, где вы можете вручную сканировать данные. Это не научный метод, но он хорошо работает

Поиск выбросов с помощью функций

Теперь давайте поговорим о более научном решении, которое поможет вам определить, есть ли какие-то выбросы.

В статистике квартиль составляет четверть набора данных. Например, если у вас есть 12 точек данных, то первый квартиль будет тремя нижними точками данных, второй квартиль будет следующими тремя точками данных и так далее.

Ниже приведен набор данных, по которому я хочу найти выбросы. Для этого мне нужно будет вычислить 1-й и 3-й квартили, а затем с его помощью вычислить верхний и нижний предел.

Читайте так же:
Макет ценника в excel

Ниже приведена формула для вычисления первого квартиля в ячейке E2:

и вот тот, который вычисляет третий квартиль в ячейке E3:

Теперь я могу использовать два вышеупомянутых вычисления, чтобы получить межквартильный размах (который составляет 50% наших данных в пределах 1-го и 3-го квартилей).

Теперь мы будем использовать межквартильный диапазон, чтобы найти нижний и верхний предел, который будет содержать большую часть наших данных.

Все, что выходит за эти нижние и верхние пределы, будет считаться выбросом.

Ниже приведена формула для расчета нижнего предела:

который в нашем примере становится:

И формула для расчета верхнего предела:

который в нашем примере становится:

Теперь, когда у нас есть верхний и нижний предел в нашем наборе данных, мы можем вернуться к исходным данным и быстро определить те значения, которые не лежат в этом диапазоне.

Быстрый способ сделать это — проверить каждое значение и вернуть ИСТИНА или ЛОЖЬ в новом столбце.

Я использовал приведенную ниже формулу ИЛИ, чтобы получить ИСТИНА для тех значений, которые являются выбросами.

Теперь вы можете фильтровать столбец Outlier и отображать только те записи, для которых значение TRUE.

В качестве альтернативы вы также можете использовать условное форматирование, чтобы выделить все ячейки, в которых значение TRUE.

Примечание. Хотя это более распространенный метод поиска выбросов в статистике. Я считаю этот метод немного непригодным для использования в реальных сценариях. В приведенном выше примере нижний предел, рассчитанный по формуле, равен -103, в то время как набор данных, который у нас есть, может быть только положительным. Таким образом, этот метод может помочь нам найти выбросы в одном направлении (высокие значения), он бесполезен при выявлении выбросов в другом направлении.

Поиск выбросов с помощью функций НАИБОЛЬШИЙ / МАЛЕНЬКИЙ

Если вы работаете с большим количеством данных (значения в нескольких столбцах), вы можете извлечь 5 или 7 наибольших и наименьших значений и посмотреть, есть ли в них выбросы.

Если есть какие-либо выбросы, вы сможете их идентифицировать, не просматривая все данные в обоих направлениях.

Предположим, у нас есть приведенный ниже набор данных, и мы хотим знать, есть ли какие-либо выбросы.

Ниже приведена формула, которая даст вам наибольшее значение в наборе данных:

Точно так же второе по величине значение будет равно

Если вы не используете Microsoft 365, в котором есть динамические массивы, вы можете использовать приведенную ниже формулу, и она даст вам пять наибольших значений из набора данных с помощью одной единственной формулы:

Точно так же, если вам нужны 5 наименьших значений, используйте следующую формулу:

или следующее, если у вас нет динамических массивов:

Когда у вас есть эти значения, очень легко обнаружить любые выбросы в наборе данных. Хотя я решил извлечь 5 наибольших и наименьших значений, вы можете выбрать 7 или 10 в зависимости от размера вашего набора данных.

Я не уверен, является ли это приемлемым методом для поиска выбросов в Excel или нет, но это метод, который я использовал, когда мне приходилось работать с большим количеством финансовых данных на моей работе несколько лет назад. По сравнению со всеми другими методами, описанными в этом руководстве, я считаю этот наиболее эффективным.

Как правильно обращаться с выбросами

До сих пор мы видели методы, которые помогут нам найти выбросы в нашем наборе данных. Но что делать, если вы знаете, что есть выбросы.

Вот несколько методов, которые вы можете использовать для обработки выбросов, чтобы ваш анализ данных был правильным.

Удалить выбросы

Самый простой способ удалить выбросы из набора данных — просто удалить их. Таким образом, это не исказит ваш анализ.

Это более жизнеспособное решение, когда у вас большие наборы данных и удаление пары выбросов не повлияет на общий анализ. И, конечно же, перед удалением данных обязательно создайте копию и выясните, что вызывает эти выбросы.

Нормализовать выбросы (отрегулировать значение)

Нормализация выбросов — это то, что я делал, когда работал полный рабочий день. Для всех значений выбросов я бы просто изменил их на значение, немного превышающее максимальное значение в наборе данных.

Это гарантирует, что я не удаляю данные, но в то же время я не позволяю этому искажать мои данные.

Чтобы дать вам реальный пример, если вы анализируете маржу чистой прибыли компаний, где большинство компаний находится в пределах от -10% до 30%, а есть несколько значений, превышающих 100%, я просто изменит эти выбросы на 30% или 35%.

Итак, вот некоторые из методов, которые вы можете использовать в Excel для поиска выбросов .

После того, как вы определили выбросы, вы можете углубиться в данные и посмотреть, что их вызывает, и в то же время выбрать один из методов обработки этих выбросов (который может удалить их или нормализовать, изменив значение)

голоса
Рейтинг статьи
Ссылка на основную публикацию
Adblock
detector