Теория нормального распределения

Прежде чем двигаться дальше в изучении Статистического управления процессами, мы должны разобраться с Теорией нормального распределения вероятностей, на основе которой строится прогнозирование в процессах. Нормальное распределение — это основополагающий инструмент статиста. Такое распределение является основой для многих типов статистики вывода, которыми мы пользуемся сегодня. Мы будем часто обращаться к этому распределению в наших статьях.

Ввод

Давайте начнем наше знакомство с распределением со следующей задачи. Допустим, вы хотите узнать, средний вес продукта, который получается у производственной линии. Каждое измерение мы будем отмечать на графике. Первые три значения – 94, 98 и 102 грамма отмечены на графике. Мы видим здесь некий разброс. Если мы продолжим дальше отмечать вес, мы получим картину справа, где повторяющиеся значения мы отмечаем точками один над другой. угим.

Нормальное распределения

Из графика видно, что чаще всего производится продукт весом 99,5 гр – данный столбец самый высокий (15 точек). Результаты с наименьшей повторяемостью отмечены меньшими столбцами.

Случайный, но предсказуемый

Когда мы только начинаем собирать данные, наши значения имеют большой разброс. Но по мере набора данных, наш график начинает приобретать некоторые формы, который позволяет нам спрогнозировать вероятность возникновения того или иного значения на графике.

Нормальное распределение

Допустим, вы измерили какой-то показатель 50 раз. Подсчитав и просуммировав количество точек в столбцах (или измерив высоту столбцов гистограммы), вы обраружили, что между значениями, скажем, 5 и 6, было 17 измерений. Значит, 17 из 50 измерений (а это 34%) попадают в рассмотренный интервал. Теперь можно спрогнозировать будущее: если поведение данного показателя останется таким же, как и во время измерений, то 34% будущих наблюдений попадут в интервал между 5 и 6.

Вот некоторые примеры из жизни, где применяется статистический подход в прогнозировании будущего:

Страхование жизни: Страховая компания не может предсказать, когда конкретное лицо умрет. Но они могут с высокой долей вероятности предсказать смерть для определенных групп риска и соответсвующим образом застраховать их жизнь.

Страхование от ДТП: Страховая компания не знает, случится у вас авария или нет. Но они знают количество ДТП случающееся с людьми вашего возраста, в вашем городе, и пробегом. И также прописать соответсвующие коэфициенты

Казино: Владельцы казино не знают, какой результат выдаст определнный бросок костей. Но они знают процент бросков, и соответственно задают коэфициенты.

Нормальное распределение вероятностей

Итак, все выше перечисленные примеры подчиняются нормальному распределению вероятностей. Что же это такое? Вероятность распределения, при котором большинство наблюдаемых значений распологаются вблизи центральной линии, и по мере удаления в обе стороны от нее значений остается все меньше

Эту форму иногда еще называют колоколообразной кривой.

Нормальное распределение

У нормального распределения есть свои особенности:

Растяжение до бесконечности: кривая теоретически никогда не достигает нуля, хотя шансы экстремальных значений становятся бесконечно малыми.

Симметрия: Форма кривой одинакова по обе стороны от среднего значения.

Совокупность процессов: общая площадь под кривой составляет практически 100% от того, что мы измеряем.

Показатели нормального распределения

Любое нормальное распределение описывается двумя показателями: Среднее значение и стандартное отклонение.

Если вернуться к графикам измерения веса и предположить, что они подчиняются нормальному распределению со средним значением 100 гр и стандартным отклонением 1 гр., то распределение вероятностей для такой переменной представлено на рисунке снизу слева

Стандартное отклонение имеет немаловажную роль для формы изгиба. Если посмотреть на рисунок, то можно заметить, что практически все измерения веса находятся в интерале от 97 до 103 см. А теперь посмотрите на график справа, на котором представлено нормальное распределение с той же средней, но со стандартным отклонениемвсего 4 гр. Здесь вы видите, что изгиб значительно приплюснут и почти все измерения попадают в интервал от 88 до 112 гр.

Нормальное распределение

Площадь под кривой

Площадь под кривой норамльного распределения поделена на несколько частей, каждая представляет одно стандартное отклонение от среднего значения. Примерно 68% всех значений данных находятся в пределах 1 стандартного отклонения от средней величины. 95% в пределах двух стандартных отклонений и 99% в пределах трех стандартных отклонений.

Нормальное распределение

Таким образом, зная среднее и стандартное отклонение мы можем спрогнозировать вероятность возникновения в определенной зоне. На этом принципе выстроена система прогнозирования при нормальном распределении данных.


Добавить комментарий