Привет всем 👋,

Это вторая часть (как следует из названия) в Статистическом блоге, если вы не читали ее, проверьте здесь. В этом блоге обсуждается странный график, который мы все видели в школьные годы 👻. Многие из нас не знали бы, что это на самом деле представляет собой. Что ж, с этим разберемся. Этот график или колоколообразная кривая на самом деле называется распределением Гаусса . По сути, это другое название нормального распределения. Но прежде чем перейти к распределению Гаусса, мы рассмотрим, что такое распределения?

Что такое дистрибутив?

Распределения используются в статистике для описания и анализа изменчивости и закономерностей в данных. Распределение представляет способ, которым значения распределены или сгруппированы вместе в наборе данных. Понимая распределение данных, статистики могут делать выводы, делать выводы и делать прогнозы относительно основной совокупности или изучаемых явлений.

Распределение предоставляет математическую функцию, называемую функцией распределения, которая возвращает вероятность или правдоподобие отдельного наблюдения из выборочного пространства. Кроме того, его также можно использовать для описания группировки или плотности наблюдений. Вероятность отдельного наблюдения может быть определена значением, обеспечиваемым функцией распределения (равным или меньшим, чем заданное значение функцией, обеспечиваемой распределением).

Многие данные подтверждают хорошо известные и понятные математические функции, такие как распределение Гаусса. Функция может соответствовать данным с изменением параметров функции, таких как среднее значение и стандартное отклонение в случае гауссова.

Когда функция распределения известна, ее можно использовать в качестве сокращения для описания и расчета связанных величин, таких как вероятности наблюдений, и построения графика взаимосвязи между наблюдениями в области.

Дистрибутивы бывают двух типов, это:

  1. Функции плотности вероятности (PDF): вычисляет вероятность наблюдения заданного значения.
  2. Функции кумулятивного распределения (CDF): вычисляет вероятность наблюдения, равного или меньшего значения

Функции плотности вероятности

Чтобы определить вероятность или вероятность отдельных наблюдений, присутствующих в распределении, мы используем Функции плотности вероятности (PDF).

В статистике функция плотности вероятности (PDF) — это специальная функция, которая сообщает нам шансы появления различных значений для интересующей нас случайной вещи. Это похоже на волшебную формулу, которая помогает нам вычислить вероятности, связанные с различными результатами.

P(a) <= X <= P(b).

PDF похож на мост между значениями случайной вещи и их вероятностями. Подставив значение в функцию, мы можем узнать, насколько вероятно, что это значение произойдет. Это дает нам способ понять вероятность различных возможностей.

Итак, думайте о PDF как об удобном инструменте, который помогает нам рассчитать и понять вероятности различных результатов для случайной величины, которую мы изучаем. Это как иметь секретный код, чтобы разблокировать шансы того, что произойдет!

Кумулятивная функция распределения (CDF)

Функция кумулятивного распределения (CDF) похожа на классный инструмент, который помогает нам понять вероятность различных значений в распределении. Это немного отличается от функции плотности вероятности (PDF). Вместо того, чтобы сообщать нам вероятность одного конкретного значения, CDF дает нам совокупную вероятность до этого значения. Это похоже на сложение вероятностей по ходу дела.

Представьте себе построение CDF в виде кривой, которая начинается с 0 и заканчивается на 1. Она показывает нам, какая часть распределения «покрывается» или учитывается каждым значением. Итак, двигаясь по кривой, мы можем видеть, какая часть распределения лежит до и после определенного значения.

Это помогает нам быстро понять, насколько вероятны определенные значения по отношению ко всему распределению. Это удобно для сравнения значений, понимания их значимости и комментирования их положения в распределении.

Итак, в следующий раз, когда вы увидите график CDF, помните, что это похоже на карту распределения, показывающую нам совокупную вероятность и помогающую нам понять, где находятся разные значения.

В этом блоге мы увидели, что такое дистрибутив и как работают функции дистрибутива. В следующих блогах мы увидим различные типы дистрибутивов. Надеюсь, это было полезно. Спасибо 😄