Статистика, часть 2 — Распределения: что скрывается за кривыми?

Привет всем 👋,

Это вторая часть (как следует из названия) в Статистическом блоге, если вы не читали ее, проверьте здесь. В этом блоге обсуждается странный график, который мы все видели в школьные годы 👻. Многие из нас не знали бы, что это на самом деле представляет собой. Что ж, с этим разберемся. Этот график или колоколообразная кривая на самом деле называется распределением Гаусса . По сути, это другое название нормального распределения. Но прежде чем перейти к распределению Гаусса, мы рассмотрим, что такое распределения?

Что такое дистрибутив?

Распределения используются в статистике для описания и анализа изменчивости и закономерностей в данных. Распределение представляет способ, которым значения распределены или сгруппированы вместе в наборе данных. Понимая распределение данных, статистики могут делать выводы, делать выводы и делать прогнозы относительно основной совокупности или изучаемых явлений.

Распределение предоставляет математическую функцию, называемую функцией распределения, которая возвращает вероятность или правдоподобие отдельного наблюдения из выборочного пространства. Кроме того, его также можно использовать для описания группировки или плотности наблюдений. Вероятность отдельного наблюдения может быть определена значением, обеспечиваемым функцией распределения (равным или меньшим, чем заданное значение функцией, обеспечиваемой распределением).

Многие данные подтверждают хорошо известные и понятные математические функции, такие как распределение Гаусса. Функция может соответствовать данным с изменением параметров функции, таких как среднее значение и стандартное отклонение в случае гауссова.

Когда функция распределения известна, ее можно использовать в качестве сокращения для описания и расчета связанных величин, таких как вероятности наблюдений, и построения графика взаимосвязи между наблюдениями в области.

Дистрибутивы бывают двух типов, это:

Функции плотности вероятности (PDF): вычисляет вероятность наблюдения заданного значения.
Функции кумулятивного распределения (CDF): вычисляет вероятность наблюдения, равного или меньшего значения

Функции плотности вероятности

Чтобы определить вероятность или вероятность отдельных наблюдений, присутствующих в распределении, мы используем Функции плотности вероятности (PDF).

В статистике функция плотности вероятности (PDF) — это специальная функция, которая сообщает нам шансы появления различных значений для интересующей нас случайной вещи. Это похоже на волшебную формулу, которая помогает нам вычислить вероятности, связанные с различными результатами.

P(a) <= X <= P(b).

PDF похож на мост между значениями случайной вещи и их вероятностями. Подставив значение в функцию, мы можем узнать, насколько вероятно, что это значение произойдет. Это дает нам способ понять вероятность различных возможностей.

Итак, думайте о PDF как об удобном инструменте, который помогает нам рассчитать и понять вероятности различных результатов для случайной величины, которую мы изучаем. Это как иметь секретный код, чтобы разблокировать шансы того, что произойдет!

Кумулятивная функция распределения (CDF)

Функция кумулятивного распределения (CDF) похожа на классный инструмент, который помогает нам понять вероятность различных значений в распределении. Это немного отличается от функции плотности вероятности (PDF). Вместо того, чтобы сообщать нам вероятность одного конкретного значения, CDF дает нам совокупную вероятность до этого значения. Это похоже на сложение вероятностей по ходу дела.

Представьте себе построение CDF в виде кривой, которая начинается с 0 и заканчивается на 1. Она показывает нам, какая часть распределения «покрывается» или учитывается каждым значением. Итак, двигаясь по кривой, мы можем видеть, какая часть распределения лежит до и после определенного значения.

Это помогает нам быстро понять, насколько вероятны определенные значения по отношению ко всему распределению. Это удобно для сравнения значений, понимания их значимости и комментирования их положения в распределении.

Итак, в следующий раз, когда вы увидите график CDF, помните, что это похоже на карту распределения, показывающую нам совокупную вероятность и помогающую нам понять, где находятся разные значения.

В этом блоге мы увидели, что такое дистрибутив и как работают функции дистрибутива. В следующих блогах мы увидим различные типы дистрибутивов. Надеюсь, это было полезно. Спасибо 😄

материалы по теме:

Новые материалы

[Архив поста] Предварительная обработка данных МРТ для PROSTATex Challenge

Обратите внимание, что этот пост предназначен для моих собственных образовательных целей. https://github.com/saifengliu/PROSTATex/blob/master/prostatex-data-preprocessing-20180425.pdf Как..

Я обязательно пройду курс.

Я обязательно пройду курс. Я взял версию Python несколько лет назад на EDX (Введение в вычислительное мышление в Python), который преподавал великий профессор Эрик Гримсон из Массачусетского..

Регрессивный анализ

Регрессивный анализ RASeries#3 — Регрессия Регресс? Как только мы определим, что между X и Y существует значительная линейная зависимость, для представления этой линейной зависимости..

Что делать, когда травят?

Расскажите об этом своим родителям. Если это произойдет даже в школе, немедленно сообщите об этом администрации школы. Чтобы сообщить о: Facebook, нажмите здесь:..

Шаблон проектирования посредника — 3-минутная серия

Это супер коммуникатор и центральный контроллер. _00 / Концепция Инкапсулируйте всю бизнес-логику внутри посредника. Участник будет общаться только с Медиатором. Он не будет знать, есть..

Первые принципы программирования: секрет раскрытия вашего потенциала и создания прорыва…

Раскройте свой творческий потенциал и выделитесь среди остальных: руководство для начинающих по основам программирования Когда дело доходит до решения проблем и создания инновационных..

Наш взгляд на IJCAI 2022

Международная объединенная конференция по искусственному интеллекту (IJCAI) — главное событие для исследователей, работающих во всех областях ИИ. Среди специализированных треков по глубокому..

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Deep Learning Coding React AI Software Engineering Tech Front End Development Nodejs Development Algorithms HTML Angular Computer Science Typescript Data Java Data Analysis Javascript Tips Javascript Development CSS Education DevOps Learning Interview Productivity Startup ES6 Neural Networks iOS Naturallanguageprocessing API