Нелинейная регрессия

17.12.2022


Нелинейная регрессия — это вид регрессионного анализа, в котором экспериментальные данные моделируются функцией, являющейся нелинейной комбинацией параметров модели и зависящей от одной и более независимых переменных. Данные аппроксимируются методом последовательных приближений.

Общие положения

Данные состоят из свободных от ошибок независимых переменных x и связанных наблюдаемых зависимых переменных (откликов) y. Каждая переменная y моделируется как случайная величина со средним значением, задаваемым нелинейной функцией f(x,β). Методическая погрешность может присутствовать, но её обработка выходит за границы регрессионного анализа. Если независимые переменные не свободны от ошибок, модель становится моделью с ошибками в переменных и также выходит за рамки рассмотрения.

Например, модель Михаэлиса — Ментен для ферментативной кинетики

v = V max   [ S ] K m + [ S ] {displaystyle v={frac {V_{max } [{mbox{S}}]}{K_{m}+[{mbox{S}}]}}}

можно записать как

f ( x , β ) = β 1 x β 2 + x {displaystyle f(x,{oldsymbol {eta }})={frac {eta _{1}x}{eta _{2}+x}}}

где β 1 {displaystyle eta _{1}} — параметр V max {displaystyle V_{max }} , β 2 {displaystyle eta _{2}} — параметр K m {displaystyle K_{m}} , а [S] — независимая переменная (x). Эта функция нелинейна, поскольку не может быть выражена в виде линейной комбинации β 1 {displaystyle eta _{1}} и β 2 {displaystyle eta _{2}} .

Другими примерами нелинейных функций служат показательные функции, логарифмические функции, тригонометрические функции, степенные функции, гауссова функция и кривые Лоренца. Регрессионный анализ с такими функциями, как показательная или логарифмическая, иногда может быть сведён к линейному случаю и может быть применена стандартная линейная регрессия, но применять её следует осторожно. Подробнее в разделе «Линеаризация» ниже.

В общем случае представления в замкнутом виде (как в случае линейной регрессии) может и не быть. Обычно для определения наилучших оценок параметров используются оптимизационные алгоритмы. В отличие от линейной регрессии может оказаться несколько локальных минимумов оптимизируемой функции и глобальный минимум даже может дать смещённую оценку. На практике используются оценочные значения параметров совместно с оптимизационным алгоритмом в попытке найти глобальный минимум суммы квадратов.

Подробнее о нелинейном моделировании см. «Метод наименьших квадратов» и «Нелинейный метод наименьших квадратов».

Регрессионная статистика

Предположение, лежащее в основе этой процедуры, заключается в возможности аппроксимации модели линейной функцией.

f ( x i , β ) ≈ f 0 + ∑ j J i j β j {displaystyle f(x_{i},{oldsymbol {eta }})approx f^{0}+sum _{j}J_{ij}eta _{j}}

где J i j = ∂ f ( x i , β ) ∂ β j {displaystyle J_{ij}={frac {partial f(x_{i},{oldsymbol {eta }})}{partial eta _{j}}}} . Это следует из того, что оценка по методу наименьших квадратов задаётся формулой

β ^ ≈ ( J T J ) − 1 J T y . {displaystyle {hat {oldsymbol {eta }}}approx mathbf {(J^{T}J)^{-1}J^{T}y} .}

Статистика нелинейной регрессии вычисляется и используется как статистика линейной регрессии, но вместо X в формулах используется J. Линейная аппроксимация вносит смещение в статистику, поэтому следует более осторожно интерпретировать статистики, полученные из нелинейной модели.

Обычный и взвешенный метод наименьших квадратов

Лучшей аппроксимирующей кривой часто предполагается та, что минимизирует сумму квадратов невязок. Это подход (обычного) метода наименьших квадратов (МНК). Однако, в случае, когда зависимая переменная не имеет постоянной дисперсии, можно минимизировать сумму взвешенных квадратов. Каждый вес, в идеальном случае, должен быть равен обратной величине от дисперсии наблюдений, однако веса могут пересчитываться в итеративном алгоритме взвешенных наименьших квадратов на каждой итерации.

Линеаризация

Преобразование

Некоторые задачи нелинейной регрессии могут быть сведены к линейным путём подходящего преобразования формулировки модели.

Например, рассмотрим задачу нелинейной регрессии

y = a e b x U {displaystyle y=ae^{bx}U,!}

с параметрами a и b и с мультипликативным множителем ошибки U. Если взять логарифм от обеих частей, мы получим

ln ⁡ ( y ) = ln ⁡ ( a ) + b x + u , {displaystyle ln {(y)}=ln {(a)}+bx+u,,!}

где u = ln(U). Из этого можно получить оценку неизвестных параметров с помощью линейной регрессии ln(y) от x и вычисления не потребуют итеративной оптимизации. Однако использование нелинейного преобразования требует осторожности. Влияние значений данных изменится, меняется структура ошибок модели и интерпретация любых полученных результатов, что может привести к нежелательным результатам. С другой стороны, в зависимости от наибольшего источника ошибки, нелинейное преобразование может распределять ошибки в виде распределения Гаусса, так что при применении нелинейного преобразования необходимо учитывать модель.

Например, для уравнения Михаэлиса — Ментен широко используется линейное представление Лайнуивер-Берка

1 v = 1 V max + K m V max [ S ] {displaystyle {frac {1}{v}}={frac {1}{V_{max }}}+{frac {K_{m}}{V_{max }[S]}}} .

Тем не менее, из-за сильной чувствительности к ошибкам данных, а также вследствие сильного смещения, это не рекомендуется.

Для распределений ошибок, принадлежащих семейству экспоненциальных распределений, может быть использована связывающая функция для преобразования параметров под обобщённую линейную модель.

Сегментация

Независимая переменная (скажем, X) может быть разбита на классы или сегменты и может быть осуществлена линейная регрессия посегментно. Сегментированная регрессия с анализом достоверности может дать результат, в котором зависимая переменная или отклик (скажем, Y) ведёт себя различно в различных сегментах .

График справа показывает, что засолённость почвы (X) начально не оказывает никакого влияния на урожайность (Y) горчицы, пока не будет достигнуто критического или порогового значения, после которого сказывается отрицательное влияние на урожайность

Примеры

Правило Тициуса — Боде в виде математической формулы представляет собой одномерное уравнение нелинейной регресии, связывающее порядковые номера планет солнечной системы, считая от Солнца, с приближёнными значениями больших полуосей их орбит. Точность вполне удовлетворительная не для астрономических целей.