Что означает уравнение регрессии

Уравнение регрессии

Определение и уравнение регрессии

Чаще всего регрессия задается уравнением, которое показывает зависимость между двумя группами числовых переменных. Уравнения бывают двух видов: линейные и нелинейные.

Регрессия бывает двух видов: парная (или двухфакторная) и множественная (или многофакторная). Такие регрессии отличаются друг от друга видом уравнения и количестве независимых переменных. Уравнения парной регрессии относятся к уравнениям регрессии первого порядка, а уравнения множественной регрессии — к нелинейным уравнениям регрессии.

Параметры уравнения линейной регрессии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиинаходятся методом наименьших квадратов из системы нормальных уравнений

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Примеры решения задач

ЗаданиеПусть задана зависимость между выработкой продукции на одного работника и удельного веса рабочих высокой квалификации:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Определите теоретическое уравнение парной регрессии.

РешениеВыборка состоит из 10 предприятий отрасли, то есть Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии. Уравнение парной регрессии будем искать в виде:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Для определения параметров модели, будем использовать метод наименьших квадратов. Система нормальных уравнений для определения неизвестных величин Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессииимеет вид:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Вычислим необходимые значения, для этого построим следующую таблицу:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Составляем систему нормальных уравнений:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Решая полученную систему линейных уравнений любым из известных методов, будем иметь:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Тогда искомое уравнение

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

ОтветЧто означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии
ЗаданиеИмеются следующие данные разных стран об индексе розничных цен на продукты питания (Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии) и индексе промышленного производства (Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии):

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Необходимо для характеристики зависимости Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессииот Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиирассчитать параметры следующих функций: а) линейной; б) степенной; в) равносторонней гиперболы.

Решениеа) для построения линейной регрессии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиизаполним таблицу:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Для нахождения параметров регрессии, решаем систему нормальных уравнений (1):

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

То есть уравнение линейной регрессии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии.

б) Степенная регрессия имеет вид Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии.

Прологарифмируем это равенство десятичным логарифмом:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

По способу наименьших квадратов строим систему нормальных уравнений для определения параметров регрессии:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Построим расчетную таблицу:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Подставляем в систему:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Решая полученную систему, будем иметь:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Тогда искомое уравнение

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

в) Уравнение равносторонней гиперболы Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии.

Для определения параметров этого уравнения используется система нормальных уравнений:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Составим таблицу расчетных данных:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Получаем следующую систему нормальных уравнений:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Решая записанную систему, получаем следующие значения параметров регрессии:

Источник

R — значит регрессия

Статистика в последнее время получила мощную PR поддержку со стороны более новых и шумных дисциплин — Машинного Обучения и Больших Данных. Тем, кто стремится оседлать эту волну необходимо подружится с уравнениями регрессии. Желательно при этом не только усвоить 2-3 приемчика и сдать экзамен, а уметь решать проблемы из повседневной жизни: найти зависимость между переменными, а в идеале — уметь отличить сигнал от шума.

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Для этой цели мы будем использовать язык программирования и среду разработки R, который как нельзя лучше приспособлен к таким задачам. Заодно, проверим от чего зависят рейтинг Хабрапоста на статистике собственных статей.

Введение в регрессионный анализ

Основу регрессионного анализа составляет метод наименьших квадратов (МНК), в соответствии с которым в качестве уравнения регресии берется функция Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиитакая, что сумма квадратов разностей Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессииминимальна.

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Карл Гаусс открыл, или точнее воссоздал, МНК в возрасте 18 лет, однако впервые результаты были опубликованы Лежандром в 1805 г. По непроверенным данным метод был известен еще в древнем Китае, откуда он перекочевал в Японию и только затем попал в Европу. Европейцы не стали делать из этого секрета и успешно запустили в производство, обнаружив с его помощью траекторию карликовой планеты Церес в 1801 г.

Вид функции Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии, как правило, определен заранее, а с помощью МНК подбираются оптимальные значения неизвестных параметров. Метрикой рассеяния значений Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиивокруг регрессии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессииявляется дисперсия.

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Линейная регрессия

Уравнения линейной регрессии можно записать в виде

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

В матричном виде это выгладит

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Случайная величина Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессииможет быть интерпретирована как сумма из двух слагаемых:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Ограничения линейной регрессии

Для того, чтобы использовать модель линейной регрессии необходимы некоторые допущения относительно распределения и свойств переменных.

Как обнаружить, что перечисленные выше условия не соблюдены? Ну, во первых довольно часто это видно невооруженным глазом на графике.

Неоднородность дисперсии
Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

При возрастании дисперсии с ростом независимой переменной имеем график в форме воронки.

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Нелинейную регрессии в некоторых случая также модно увидеть на графике довольно наглядно.

Тем не менее есть и вполне строгие формальные способы определить соблюдены ли условия линейной регрессии, или нарушены.

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

В этой формуле Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии— коэффициент взаимной детерминации между Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии остальными факторами. Если хотя бы один из VIF-ов > 10, вполне резонно предположить наличие мультиколлинеарности.

Почему нам так важно соблюдение всех выше перечисленных условий? Все дело в Теореме Гаусса-Маркова, согласно которой оценка МНК является точной и эффективной лишь при соблюдении этих ограничений.

Как преодолеть эти ограничения

Нарушения одной или нескольких ограничений еще не приговор.

К сожалению, не все нарушения условий и дефекты линейной регрессии можно устранить с помощью натурального логарифма. Если имеет место автокорреляция возмущений к примеру, то лучше отступить на шаг назад и построить новую и лучшую модель.

Линейная регрессия плюсов на Хабре

Итак, довольно теоретического багажа и можно строить саму модель.
Мне давно было любопытно от чего зависит та самая зелененькая цифра, что указывает на рейтинг поста на Хабре. Собрав всю доступную статистику собственных постов, я решил прогнать ее через модель линейно регрессии.

Загружает данные из tsv файла.

Вопреки моим ожиданиям наибольшая отдача не от количества просмотров статьи, а от комментариев и публикаций в социальных сетях. Я также полагал, что число просмотров и комментариев будет иметь более сильную корреляцию, однако зависимость вполне умеренная — нет надобности исключать ни одну из независимых переменных.

В первой строке мы задаем параметры линейной регрессии. Строка points

. определяет зависимую переменную points и все остальные переменные в качестве регрессоров. Можно определить одну единственную независимую переменную через points

Перейдем теперь к расшифровке полученных результатов.

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Можно попытаться несколько улучшить модель, сглаживая нелинейные факторы: комментарии и посты в социальных сетях. Заменим значения переменных fb и comm их степенями.

Проверим значения параметров линейной регрессии.

Проверим, соблюдены ли условия применимости модели линейной регрессии? Тест Дарбина-Уотсона проверяет наличие автокорреляции возмущений.

И напоследок проверка неоднородности дисперсии с помощью теста Бройша-Пагана.

В заключение

Конечно наша модель линейной регрессии рейтинга Хабра-топиков получилось не самой удачной. Нам удалось объяснить не более, чем половину вариативности данных. Факторы надо чинить, чтобы избавляться от неоднородной дисперсии, с автокорреляцией тоже непонятно. Вообще данных маловато для сколь-нибудь серьезной оценки.

Но с другой стороны, это и хорошо. Иначе любой наспех написанный тролль-пост на Хабре автоматически набирал бы высокий рейтинг, а это к счастью не так.

Источник

Уравнение регрессии: Что это такое и как его использовать

Уравнение регрессии: Обзор

Уравнение регрессии используется в статистике для того, чтобы выяснить, какая связь, если таковая существует, существует между наборами данных. Например, если каждый год измерять рост ребенка, то можно обнаружить, что он растет примерно на 3 дюйма в год. Эта тенденция (которая растет на 3 дюйма в год) может быть смоделирована с помощью уравнения регрессии. Фактически, большинство вещей в реальном мире (от цен на газ до ураганов) можно смоделировать с помощью некоего уравнения, что позволяет нам предсказывать будущие события.

Линия регрессии – это “самая подходящая” линия для ваших данных. По сути, вы рисуете линию, которая наилучшим образом представляет точки данных. Она представляет собой среднее арифметическое того, где выравниваются все точки. В линейной регрессии линия регрессии является абсолютно прямой линией:

Не очень распространено, чтобы все точки данных действительно попадали на линию регрессии. На рисунке выше точки немного рассеяны вокруг линии. На следующем изображении точки падают на линию. Изогнутая форма этой линии является результатом полиномиальной регрессии, которая укладывает точки в уравнение полинома.

Уравнение регрессии: Что это такое и как его использовать

Статистические определения > Что такое уравнение регрессии?

Уравнение регрессии: Обзор

Уравнение регрессии используется в статистике для того, чтобы выяснить, какая связь, если таковая существует, существует между наборами данных. Например, если каждый год измерять рост ребенка, то можно обнаружить, что он растет примерно на 3 дюйма в год. Эта тенденция (которая растет на 3 дюйма в год) может быть смоделирована с помощью уравнения регрессии. Фактически, большинство вещей в реальном мире (от цен на газ до ураганов) можно смоделировать с помощью некоего уравнения, что позволяет нам предсказывать будущие события.

Линия регрессии – это “самая подходящая” линия для ваших данных. По сути, вы рисуете линию, которая наилучшим образом представляет точки данных. Она представляет собой среднее арифметическое того, где выравниваются все точки. В линейной регрессии линия регрессии является абсолютно прямой линией:

Линия линейной регрессии.

Не очень распространено, чтобы все точки данных действительно попадали на линию регрессии. На рисунке выше точки немного рассеяны вокруг линии. На следующем изображении точки падают на линию. Изогнутая форма этой линии является результатом полиномиальной регрессии, которая укладывает точки в уравнение полинома.

В результате полиномиальной регрессии получается кривая линия.

Результатом полиномиальной регрессии является кривая линия.

Регрессия и линии прогнозирования

Регрессия полезна, так как позволяет делать прогнозы о данных. Первый график выше – с 1995 по 2015 год. Если вы хотите предсказать, что произойдет в 2020 году, вы можете поместить его в уравнение:

Отрицательное выпадение осадков не имеет особого смысла, но можно сказать, что до 2020 года осадки выпадут на 0 дюймов. Согласно этой конкретной линии регрессии, рано или поздно это произойдет в 2018 году:

Для чего нужно уравнение регрессии?

Уравнения регрессии могут помочь вам понять, подходят ли ваши данные для уравнения. Это чрезвычайно полезно, если вы хотите сделать прогноз на основе своих данных – как будущих прогнозов, так и указаний на прошлое поведение. Например, вы можете захотеть узнать, сколько ваших сбережений будет стоить в будущем. Или, возможно, вы захотите предсказать, сколько времени понадобится на выздоровление от болезни.

Существуют различные типы уравнений регрессии. К наиболее распространенным относятся экспоненциальная линейная регрессия и простая линейная регрессия (для адаптации данных к экспоненциальному уравнению или линейному уравнению). В элементарной статистике уравнение регрессии, с которым вы, скорее всего, столкнетесь, является линейной формой.

Расчет линейной регрессии

Есть несколько способов найти линию регрессии, даже вручную и с помощью технологий, таких как Excel (см. ниже). Поиск линии регрессии очень скучен вручную. Следующее видео иллюстрирует шаги:

Линию регрессии также можно найти в калькуляторах TI:

Как выполнять регрессию TI-89.

Уравнение линейной регрессии показано ниже.

Для того, чтобы данные вписались в уравнение, необходимо сначала понять, какая общая схема подходит для данных. Общие шаги для выполнения регрессии включают в себя составление дисперсионной диаграммы, а затем гипотезу о том, какой тип уравнения может быть наиболее подходящим. Затем можно выбрать наилучшее уравнение регрессии для задания.

Однако, как видно на следующем рисунке, не всегда легко выбрать подходящее уравнение регрессии, особенно при работе с реальными данными. Иногда получаются “шумные” данные, которые, кажется, не подходят ни под одно уравнение. Если большинство данных, кажется, следуют шаблону, вы можете пропустить пропуски. На самом деле, если игнорировать промахи, данные, кажется, моделируются экспоненциальным уравнением.

Источник

Решаем уравнение простой линейной регрессии

В статье рассматривается несколько способов определения математического уравнения линии простой (парной) регрессии.

Все рассматриваемые здесь способы решения уравнения основаны на методе наименьших квадратов. Обозначим способы следующим образом:

Весь код, приведенный в статье, написан на языке python 2.7 с использованием Jupyter Notebook. Исходный код и файл с данными выборки выложен на гитхабе

Статья в большей степени ориентирована как на начинающих, так и на тех, кто уже понемногу начал осваивать изучение весьма обширного раздела в искусственном интеллекте — машинного обучения.

Для иллюстрации материала используем очень простой пример.

Условия примера

У нас есть пять значений, которые характеризуют зависимость Y от X (Таблица №1):

Таблица №1 «Условия примера»

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Будем считать, что значения Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии— это месяц года, а Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии— выручка в этом месяце. Другими словами, выручка зависит от месяца года, а Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии— единственный признак, от которого зависит выручка.

Пример так себе, как с точки зрения условной зависимости выручки от месяца года, так и с точки зрения количества значений — их очень мало. Однако такое упрощение позволит, что называется на пальцах, объяснить, не всегда с легкостью, усваиваемый новичками материал. А также простота чисел позволит без весомых трудозатрат, желающим, порешать пример на «бумаге».

Предположим, что приведенная в примере зависимость, может быть достаточно хорошо аппроксимирована математическим уравнением линии простой (парной) регрессии вида:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

где Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии— это месяц, в котором была получена выручка, Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии— выручка, соответствующая месяцу, Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии— коэффициенты регрессии оцененной линии.

Отметим, что коэффициент Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиичасто называют угловым коэффициентом или градиентом оцененной линии; представляет собой величину, на которую изменится Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиипри изменении Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии.

Очевидно, что наша задача в примере — подобрать в уравнении такие коэффициенты Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии, при которых отклонения наших расчетных значений выручки по месяцам от истинных ответов, т.е. значений, представленных в выборке, будут минимальны.

Метод наименьших квадратов

В соответствии с методом наименьших квадратов, отклонение стоит рассчитывать, возводя его в квадрат. Подобный прием позволяет избежать взаимного погашения отклонений, в том случае, если они имеют противоположные знаки. Например, если в одном случае, отклонение составляет +5 (плюс пять), а в другом -5 (минус пять), то сумма отклонений взаимно погасится и составит 0 (ноль). Можно и не возводить отклонение в квадрат, а воспользоваться свойством модуля и тогда у нас все отклонения будут положительными и будут накапливаться. Мы не будем останавливаться на этом моменте подробно, а просто обозначим, что для удобства расчетов, принято возводить отклонение в квадрат.

Вот так выглядит формула, с помощью которой мы определим наименьшую сумму квадратов отклонений (ошибки):

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

где Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии— это функция аппроксимации истинных ответов (то есть посчитанная нами выручка),

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии— это истинные ответы (предоставленная в выборке выручка),

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии— это индекс выборки (номер месяца, в котором происходит определение отклонения)

Продифференцируем функцию, определим уравнения частных производных и будем готовы перейти к аналитическому решению. Но для начала проведем небольшой экскурс о том, что такое дифференцирование и вспомним геометрический смысл производной.

Дифференцирование

Дифференцированием называется операция по нахождению производной функции.

Для чего нужна производная? Производная функции характеризует скорость изменения функции и указывает нам ее направление. Если производная в заданной точке положительна, то функция возрастает, в обратном случае — функция убывает. И чем больше значение производной по модулю, тем выше скорость изменения значений функции, а также круче угол наклона графика функции.

Например, в условиях декартовой системы координат, значение производной в точке M(0,0) равное +25 означает, что в заданной точке, при смещении значения Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиивправо на условную единицу, значение Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиивозрастает на 25 условных единиц. На графике это выглядит, как достаточно крутой угол подъема значений Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиис заданной точки.

Другой пример. Значение производной равное -0,1 означает, что при смещении Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиина одну условную единицу, значение Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессииубывает всего лишь на 0,1 условную единицу. При этом, на графике функции, мы можем наблюдать едва заметный наклон вниз. Проводя аналогию с горой, то мы как будто очень медленно спускаемся по пологому склону с горы, в отличие от предыдущего примера, где нам приходилось брать очень крутые вершины:)

Таким образом, проведя дифференцирование функции Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиипо коэффициентам Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии, определим уравнения частных производных 1-го порядка. После определения уравнений, мы получим систему из двух уравнений, решив которую мы сможем подобрать такие значения коэффициентов Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии, при которых значения соответствующих производных в заданных точках изменяются на очень и очень малую величину, а в случае с аналитическим решением не изменяются вовсе. Другими словами, функция ошибки при найденных коэффициентах достигнет минимума, так как значения частных производных в этих точках будут равны нулю.

Итак, по правилам дифференцирования уравнение частной производной 1-го порядка по коэффициенту Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиипримет вид:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

уравнение частной производной 1-го порядка по Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиипримет вид:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

В итоге мы получили систему уравнений, которая имеет достаточно простое аналитическое решение:

\begin
\begin
na + b\sum\limits_^nx_i — \sum\limits_^ny_i = 0
\\
\sum\limits_^nx_i(a +b\sum\limits_^nx_i — \sum\limits_^ny_i) = 0
\end
\end

Прежде чем решать уравнение, предварительно загрузим, проверим правильность загрузки и отформатируем данные.

Загрузка и форматирование данных

Необходимо отметить, что в связи с тем, что для аналитического решения, а в дальнейшем для градиентного и стохастического градиентного спуска, мы будем применять код в двух вариациях: с использованием библиотеки NumPy и без её использования, то нам потребуется соответствующее форматирование данных (см. код).

Визуализация

Теперь, после того, как мы, во-первых, загрузили данные, во-вторых, проверили правильность загрузки и наконец отформатировали данные, проведем первую визуализацию. Часто для этого используют метод pairplot библиотеки Seaborn. В нашем примере, ввиду ограниченности цифр нет смысла применять библиотеку Seaborn. Мы воспользуемся обычной библиотекой Matplotlib и посмотрим только на диаграмму рассеяния.

График №1 «Зависимость выручки от месяца года»

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Аналитическое решение

Воспользуемся самыми обычными инструментами в python и решим систему уравнений:

\begin
\begin
na + b\sum\limits_^nx_i — \sum\limits_^ny_i = 0
\\
\sum\limits_^nx_i(a +b\sum\limits_^nx_i — \sum\limits_^ny_i) = 0
\end
\end

По правилу Крамера найдем общий определитель, а также определители по Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии по Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии, после чего, разделив определитель по Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиина общий определитель — найдем коэффициент Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии, аналогично найдем коэффициент Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии.

Вот, что у нас получилось:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Итак, значения коэффициентов найдены, сумма квадратов отклонений установлена. Нарисуем на гистограмме рассеяния прямую линию в соответствии с найденными коэффициентами.

График №2 «Правильные и расчетные ответы»

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Можно посмотреть на график отклонений за каждый месяц. В нашем случае, какой-либо значимой практической ценности мы из него не вынесем, но удовлетворим любопытство в том, насколько хорошо, уравнение простой линейной регрессии характеризует зависимость выручки от месяца года.

График №3 «Отклонения, %»

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Не идеально, но нашу задачу мы выполнили.

Напишем функцию, которая для определения коэффициентов Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиииспользует библиотеку NumPy, точнее — напишем две функции: одну с использованием псевдообратной матрицы (не рекомендуется на практике, так как процесс вычислительно сложный и нестабильный), другую с использованием матричного уравнения.

Сравним время, которое было затрачено на определение коэффициентов Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии, в соответствии с 3-мя представленными способами.

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

На небольшом количестве данных, вперед выходит «самописная» функция, которая находит коэффициенты методом Крамера.

Теперь можно перейти к другим способам нахождения коэффициентов Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии.

Градиентный спуск

Для начала определим, что такое градиент. По-простому, градиент — это отрезок, который указывает направление максимального роста функции. По аналогии с подъемом в гору, то куда смотрит градиент, там и есть самый крутой подъем к вершине горы. Развивая пример с горой, вспоминаем, что на самом деле нам нужен самый крутой спуск, чтобы как можно быстрее достичь низины, то есть минимума — места где функция не возрастает и не убывает. В этом месте производная будет равна нулю. Следовательно, нам нужен не градиент, а антиградиент. Для нахождения антиградиента нужно всего лишь умножить градиент на -1 (минус один).

Обратим внимание на то, что функция может иметь несколько минимумов, и опустившись в один из них по предложенному далее алгоритму, мы не сможем найти другой минимум, который возможно находится ниже найденного. Расслабимся, нам это не грозит! В нашем случае мы имеем дело с единственным минимумом, так как наша функция Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиина графике представляет собой обычную параболу. А как мы все должны прекрасно знать из школьного курса математики — у параболы существует только один минимум.

После того, как мы выяснили для чего нам потребовался градиент, а также то, что градиент — это отрезок, то есть вектор с заданными координатами, которые как раз являются теми самыми коэффициентами Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиимы можем реализовать градиентный спуск.

Перед запуском, предлагаю прочитать буквально несколько предложений об алгоритме спуска:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Мы погрузились на самое дно Марианской впадины и там обнаружили все те же значения коэффициентов Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии, что собственно и следовало ожидать.

Совершим еще одно погружение, только на этот раз, начинкой нашего глубоководного аппарата будут иные технологии, а именно библиотека NumPy.

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии
Значения коэффициентов Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиинеизменны.

Посмотрим на то, как изменялась ошибка при градиентном спуске, то есть как изменялась сумма квадратов отклонений с каждым шагом.

График №4 «Сумма квадратов отклонений при градиентном спуске»

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

На графике мы видим, что с каждым шагом ошибка уменьшается, а спустя какое-то количество итераций наблюдаем практически горизонтальную линию.

Напоследок оценим разницу во времени исполнения кода:

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Возможно мы делаем что-то не то, но опять простая «самописная» функция, которая не использует библиотеку NumPy опережает по времени выполнения расчетов функцию, использующую библиотеку NumPy.

Но мы не стоим на месте, а двигаемся в сторону изучения еще одного увлекательного способа решения уравнения простой линейной регрессии. Встречайте!

Стохастический градиентный спуск

Для того, чтобы быстрее понять принцип работы стохастического градиентного спуска, лучше определить его отличия от обычного градиентного спуска. Мы, в случае с градиентным спуском, в уравнениях производных от Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиииспользовали суммы значений всех признаков и истинных ответов, имеющихся в выборке (то есть суммы всех Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии). В стохастическом градиентном спуске мы не будем использовать все значения, имеющиеся в выборке, а вместо этого, псевдослучайным образом выберем так называемый индекс выборки и используем его значения.

Например, если индекс определился за номером 3 (три), то мы берем значения Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии, далее подставляем значения в уравнения производных и определяем новые координаты. Затем, определив координаты, мы опять псевдослучайным образом определяем индекс выборки, подставляем значения, соответствующие индексу в уравнения частных производных, по новому определяем координаты Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии т.д. до позеленения сходимости. На первый взгляд, может показаться, как это вообще может работать, однако работает. Правда стоит отметить, что не с каждым шагом уменьшается ошибка, но тенденция безусловно имеется.

Каковы преимущества стохастического градиентного спуска перед обычным? В случае, если у нас размер выборки очень велик и измеряется десятками тысяч значений, то значительно проще обработать, допустим случайную тысячу из них, нежели всю выборку. Вот в этом случае и запускается стохастический градиентный спуск. В нашем случае мы конечно же большой разницы не заметим.

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Смотрим внимательно на коэффициенты и ловим себя на вопросе «Как же так?». У нас получились другие значения коэффициентов Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии. Может быть стохастический градиентный спуск нашел более оптимальные параметры уравнения? Увы, нет. Достаточно посмотреть на сумму квадратов отклонений и увидеть, что при новых значениях коэффициентов, ошибка больше. Не спешим отчаиваться. Построим график изменения ошибки.

График №5 «Сумма квадратов отклонений при стохастическом градиентном спуске»

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Посмотрев на график, все становится на свои места и сейчас мы все исправим.

Итак, что же произошло? Произошло следующее. Когда мы выбираем случайным образом месяц, то именно для выбранного месяца наш алгоритм стремится уменьшить ошибку в расчете выручки. Затем выбираем другой месяц и повторяем расчет, но ошибку уменьшаем уже для второго выбранного месяца. А теперь вспомним, что у нас первые два месяца существенно отклоняются от линии уравнения простой линейной регрессии. Это значит, что когда выбирается любой из этих двух месяцев, то уменьшая ошибку каждого из них, наш алгоритм серьезно увеличивает ошибку по всей выборке. Так что же делать? Ответ простой: надо уменьшить шаг спуска. Ведь уменьшив шаг спуска, ошибка так же перестанет «скакать» то вверх, то вниз. Вернее, ошибка «скакать» не перестанет, но будет это делать не так прытко:) Проверим.

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

График №6 «Сумма квадратов отклонений при стохастическом градиентном спуске (80 тыс. шагов)»

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Значения коэффициентов улучшились, но все равно не идеальны. Гипотетически это можно поправить таким образом. Выбираем, например, на последних 1000 итерациях значения коэффициентов, с которыми была допущена минимальная ошибка. Правда нам для этого придется записывать еще и сами значения коэффициентов. Мы не будем этого делать, а лучше обратим внимание на график. Он выглядит гладким, и ошибка как будто уменьшается равномерно. На самом деле это не так. Посмотрим на первые 1000 итераций и сравним их с последними.

График №7 «Сумма квадратов отклонений SGD (первые 1000 шагов)»

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

График №8 «Сумма квадратов отклонений SGD (последние 1000 шагов)»

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

В самом начале спуска мы наблюдаем достаточно равномерное и крутое уменьшение ошибки. На последних итерациях мы видим, что ошибка ходит вокруг да около значения в 1,475 и в некоторые моменты даже равняется этому оптимальному значению, но потом все равно уходит ввысь… Повторюсь, можно записывать значения коэффициентов Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиии Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии, а потом выбрать те, при которых ошибка минимальна. Однако у нас возникла проблема посерьезнее: нам пришлось сделать 80 тыс. шагов (см. код), чтобы получить значения, близкие к оптимальным. А это, уже противоречит идее об экономии времени вычислений при стохастическом градиентном спуске относительно градиентного. Что можно поправить и улучшить? Не трудно заметить, что на первых итерациях мы уверенно идем вниз и, следовательно, нам стоит оставить большой шаг на первых итерациях и по мере продвижения вперед шаг уменьшать. Мы не будем этого делать в этой статье — она и так уже затянулась. Желающие могут и сами подумать, как это сделать, это не сложно 🙂

Теперь выполним стохастический градиентный спуск, используя библиотеку NumPy (и не будем спотыкаться о камни, которые мы выявили раннее)

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Значения получились почти такими же, как и при спуске без использования NumPy. Впрочем, это логично.

Узнаем сколько же времени занимали у нас стохастические градиентные спуски.

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии

Чем дальше в лес, тем темнее тучи: опять «самописная» формула показывает лучший результат. Все это наводит на мысли о том, что должны существовать еще более тонкие способы использования библиотеки NumPy, которые действительно ускоряют операции вычислений. В этой статье мы о них уже не узнаем. Будет о чем подумать на досуге:)

Резюмируем

Перед тем как резюмировать, хотелось бы ответить на вопрос, который скорее всего, возник у нашего дорогого читателя. Для чего, собственно, такие «мучения» со спусками, зачем нам ходить по горе вверх и вниз (преимущественно вниз), чтобы найти заветную низину, если в наших руках такой мощный и простой прибор, в виде аналитического решения, который мгновенно телепортирует нас в нужное место?

Ответ на этот вопрос лежит на поверхности. Сейчас мы разбирали очень простой пример, в котором истинный ответ Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессиизависит от одного признака Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии. В жизни такое встретишь не часто, поэтому представим, что у нас признаков 2, 30, 50 или более. Добавим к этому тысячи, а то и десятки тысяч значений для каждого признака. В этом случае аналитическое решение может не выдержать испытания и дать сбой. В свою очередь градиентный спуск и его вариации будут медленно, но верно приближать нас к цели — минимуму функции. А на счет скорости не волнуйтесь — мы наверняка еще разберем способы, которые позволят нам задавать и регулировать длину шага (то есть скорость).

А теперь собственно краткое резюме.

Во-первых, надеюсь, что изложенный в статье материал, поможет начинающим «дата сайнтистам» в понимании того, как решать уравнения простой (и не только) линейной регрессии.

Во-вторых, мы рассмотрели несколько способов решения уравнения. Теперь, в зависимости от ситуации, мы можем выбрать тот, который лучше всего подходит для решения поставленной задачи.

В-третьих, мы увидели силу дополнительных настроек, а именно длины шага градиентного спуска. Этим параметром нельзя пренебрегать. Как было подмечено выше, с целью сокращения затрат на проведение вычислений, длину шага стоит изменять по ходу спуска.

В-четвертых, в нашем случае, «самописные» функции показали лучший временной результат вычислений. Вероятно, это связано с не самым профессиональным применением возможностей библиотеки NumPy. Но как бы то ни было, вывод напрашивается следующий. С одной стороны, иногда стоит подвергать сомнению устоявшиеся мнения, а с другой — не всегда стоит все усложнять — наоборот иногда эффективнее оказывается более простой способ решения задачи. А так как цель у нас была разобрать три подхода в решении уравнения простой линейной регрессии, то использование «самописных» функций нам вполне хватило.

Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии Предыдущая работа автора — «Исследуем утверждение центральной предельной теоремы с помощью экспоненциального распределения»
Что означает уравнение регрессии. Смотреть фото Что означает уравнение регрессии. Смотреть картинку Что означает уравнение регрессии. Картинка про Что означает уравнение регрессии. Фото Что означает уравнение регрессии Следующая работа автора — «Приводим уравнение линейной регрессии в матричный вид»

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *