Линейная и логистическая регрессия

В машинном обучении: знать, когда что использовать

В математике регрессия — это статистический инструмент, который помогает определить изменение неизвестного значения в результате изменения известных значений. Неизвестная переменная обычно помечается как зависимая переменная и обозначается как Y, а известная переменная (может быть одна или несколько) известна как независимая переменная и обозначается как X.

Наиболее распространенным типом регрессии, о котором все знают, является линейная регрессия. Если вы знаете эту формулу:

y= mx+b

Тогда вы знакомы с линейной регрессией. Существует еще одна форма линейной регрессии, известная как полилинейная регрессия, в которой имеется более одной независимой переменной, которая может повлиять на вашу зависимую переменную. Тем не менее, базовая основа та же, и она по-прежнему использует ту же математику, что и линейная регрессия.

В реальной жизни и в алгоритме машинного обучения мы используем линейную регрессию, чтобы предсказать вероятность того, что что-то произойдет. Линейная регрессия особенно полезна при работе с финансовыми данными, поскольку вы можете использовать более сложные формы линейной регрессии для прогнозирования волатильности акций (используя комбинацию анализа/прогнозирования временных рядов с моделированием SVD).

В линейной регрессии результат всегда представляет собой непрерывный прогноз. Например, учитывая то, что вы едите ежедневно, ваши привычки к физическим упражнениям и прошлые изменения веса, мы можем использовать линейную регрессию, чтобы предсказать возможные изменения вашего веса в будущем. Если число конечного результата отрицательное, оно имеет отрицательную корреляцию, что означает, что вы, вероятно, похудеете в будущем. Если число положительное, то оно положительно коррелировано, и верно обратное.

Второй тип регрессии — логистическая регрессия. В машинном обучении мы используем логистическую регрессию, чтобы классифицировать объекты/элементы. Если мы хотим предсказать, что апельсин относится к фруктам или овощам (я знаю, глупый пример), мы будем использовать логистическую регрессию. Он сравнивает, насколько объект похож на имеющиеся данные, и решает, в какую категорию его поместить.

Формула логистической регрессии выглядит так:

Y = e^X + e^-X

Буква e означает натуральный логарифм, та же самая кнопка, которую можно найти в научном калькуляторе. Мы находим линию регрессии — линию классификации — взяв натуральный логарифм нашей независимой переменной (именно так мы получаем график, как показано выше). Эта кривая линия определяет границу разделения. Логистическая регрессия чрезвычайно полезна, когда мы имеем дело с неразмеченными данными. Мы можем использовать неконтролируемое обучение, такое как кластеризация (сложная версия логистической регрессии) или SVM (в основном кластеризация, но со сложными гиперпараметрами), чтобы определить группировку данных. После того, как данные были сгруппированы и помечены, мы можем использовать эти данные для прогнозирования будущих объектов с аналогичными свойствами или, при необходимости, запускать линейную регрессию на уже структурированных данных, если нам нужно предсказать некоторый непрерывный результат.

Хороший способ вспомнить, какую модель использовать, — это посмотреть, что вы пытаетесь предсказать. Если ваш результат представляет собой простой ответ, например принадлежит ли он этой группе или что это за объект, скорее всего, это логистическая регрессия. Но если ваш результат отвечает что-то вроде сколько из этого я должен купить или когда лучше уйти, чтобы избежать пробок, вы, скорее всего, используйте линейную регрессию.

материалы по теме:

Новые материалы

[Архив поста] Предварительная обработка данных МРТ для PROSTATex Challenge

Обратите внимание, что этот пост предназначен для моих собственных образовательных целей. https://github.com/saifengliu/PROSTATex/blob/master/prostatex-data-preprocessing-20180425.pdf Как..

Я обязательно пройду курс.

Я обязательно пройду курс. Я взял версию Python несколько лет назад на EDX (Введение в вычислительное мышление в Python), который преподавал великий профессор Эрик Гримсон из Массачусетского..

Регрессивный анализ

Регрессивный анализ RASeries#3 — Регрессия Регресс? Как только мы определим, что между X и Y существует значительная линейная зависимость, для представления этой линейной зависимости..

Что делать, когда травят?

Расскажите об этом своим родителям. Если это произойдет даже в школе, немедленно сообщите об этом администрации школы. Чтобы сообщить о: Facebook, нажмите здесь:..

Шаблон проектирования посредника — 3-минутная серия

Это супер коммуникатор и центральный контроллер. _00 / Концепция Инкапсулируйте всю бизнес-логику внутри посредника. Участник будет общаться только с Медиатором. Он не будет знать, есть..

Первые принципы программирования: секрет раскрытия вашего потенциала и создания прорыва…

Раскройте свой творческий потенциал и выделитесь среди остальных: руководство для начинающих по основам программирования Когда дело доходит до решения проблем и создания инновационных..

Наш взгляд на IJCAI 2022

Международная объединенная конференция по искусственному интеллекту (IJCAI) — главное событие для исследователей, работающих во всех областях ИИ. Среди специализированных треков по глубокому..

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Deep Learning Coding React AI Software Engineering Tech Front End Development Nodejs Development Algorithms HTML Angular Computer Science Typescript Data Data Analysis Javascript Tips Javascript Development CSS Education DevOps Java Learning Interview Productivity ES6 Neural Networks Startup API Mobile App Development Mathematics