Что такое экспоненциальная регрессия?
Экспоненциальная регрессия подбирает кривую вида \(y = A \cdot B^{x}\) к набору парных наблюдений. Это подходящий инструмент в тех случаях, когда величина растёт или убывает примерно в постоянное число раз при каждом увеличении x на единицу: рост населения, сложные проценты, радиоактивный распад, размножение бактерий и многие другие природные процессы. Это универсальный статистический метод, не зависящий от каких-либо национальных правил.
Как пользоваться калькулятором
Вводите данные по одной паре в строке в формате x,y. Понадобится минимум две точки, значения x не должны быть все одинаковыми, а каждое значение y должно быть строго положительным (метод берёт натуральный логарифм от y). Выберите число знаков для вывода — и сразу увидите A, B и коэффициент корреляции \(r\).
Разбор формулы
Модель нелинейна, но логарифмирование делает её линейной: \(\ln(y) = \ln(A) + x \cdot \ln(B)\). Поэтому мы применяем обычный метод наименьших квадратов к преобразованным точкам \((x_{i}, \ln y_{i})\). Обозначим \(\bar{x}\) — среднее значение x, а \(\overline{\ln y}\) — среднее значение ln y, и определим $$S_{xx} = \sum (x_{i} - \bar{x})^{2}, \quad S_{yy} = \sum (\ln y_{i} - \overline{\ln y})^{2}, \quad S_{xy} = \sum (x_{i} - \bar{x})(\ln y_{i} - \overline{\ln y}).$$ Тогда $$B = \exp\!\left(\frac{S_{xy}}{S_{xx}}\right), \quad A = \exp\!\left(\overline{\ln y} - \bar{x} \cdot \ln B\right), \quad r = \frac{S_{xy}}{\sqrt{S_{xx}} \cdot \sqrt{S_{yy}}}.$$
Пример расчёта
Для точек (1, 2.7), (2, 7.4), (3, 20.1), (4, 54.6), (5, 148.4): \(n = 5\), \(\bar{x} = 3\), \(\overline{\ln y} \approx 2.99906\). \(S_{xx} = 10\), \(S_{xy} \approx 10.01167\), \(S_{yy} \approx 10.02337\). Получаем $$B = \exp(1.001167) \approx 2.7215, \quad A = \exp(2.99906 - 3 \cdot 1.001167) \approx 0.9956, \quad r \approx 0.99999985.$$ Подобранная модель \(y \approx 0.9956 \cdot 2.7215^{x}\) отлично совпадает с исходной зависимостью \(y \approx e^{x}\).
Частые вопросы
Почему y должно быть положительным? Подгонка выполняется по ln(y), а логарифм нуля или отрицательного числа не определён.
Что означает r в данном случае? Это корреляция между x и ln(y). Ориентир такой: \(0.7 < |r| \le 1\) — сильная связь, \(0.4 < |r| < 0.7\) — умеренная, \(0.2 < |r| < 0.4\) — слабая, ниже 0.2 — связи нет.
Что делать, если все значения x одинаковы? Тогда \(S_{xx} = 0\), и наклон не определён; укажите хотя бы два различных значения x.
Интерпретация вашего результата
Экспоненциальная регрессия возвращает три числа — \(A\), \(B\) и \(r\) — которые вместе описывают модель \(y = A \cdot B^{\,x}\). Вот как читать каждое из них.
Основание \(B\): рост или спад
Основание \(B\) контролирует направление и скорость изменения при каждом увеличении \(x\) на одну единицу:
- \(B > 1\) означает рост. Каждый шаг в \(x\) умножает \(y\) на \(B\), поэтому кривая поднимается. Процентное изменение на единицу — это \((B-1)\times100\%\). Например, \(B = 1.08\) соответствует 8% роста на единицу \(x\).
- \(B < 1\) означает спад. Каждый шаг умножает \(y\) на число меньше единицы, поэтому кривая падает к нулю. По той же формуле \((B-1)\times100\%\) получается отрицательный результат; например, \(B = 0.85\) — это \(-15\%\) изменения на единицу.
- \(B = 1\) — плоская линия. \(y\) остаётся равным \(A\) независимо от \(x\) (нулевое процентное изменение).
Коэффициент \(A\): пересечение с осью Y
\(A\) — это значение \(y\) при \(x = 0\), потому что \(A \cdot B^{0} = A\). Он закрепляет кривую по вертикали и представляет начальное количество, исходную популяцию, основную сумму или дозу у начала вашей оси \(x\).
Коэффициент корреляции \(r\): соответствие на логарифмической шкале
Этот способ работает путём преобразования \(z_i = \ln y_i\) и выполнения обычной линейной регрессии \(z\) относительно \(x\). Следовательно, \(r\) измеряет, насколько хорошо логарифмически преобразованные данные \(\ln(y)\) лежат на прямой линии — не то, насколько хорошо исходные значения \(y\) соответствуют кривой. Значение \(r\), близкое к \(+1\) или \(-1\), указывает на сильную экспоненциальную зависимость; знак совпадает с направлением (положительный для роста, отрицательный для спада).
Используя стандартные диапазоны интерпретации корреляции для \(|r|\):
- 0.9 – 1.0: очень сильное соответствие — данные тесно следуют экспоненциальной модели.
- 0.7 – 0.9: сильное соответствие — экспоненциальная модель хорошо описывает данные с некоторым разбросом.
- 0.5 – 0.7: умеренное соответствие — тренд существует, но в игре другие факторы.
- ниже 0.5: слабое соответствие — экспоненциальная модель может быть неподходящей.
Поскольку \(r\) отражает соответствие на логарифмической шкале, высокое значение \(r\) не гарантирует малые ошибки на исходной шкале \(y\); большие значения \(y\) имеют меньший вес после преобразования \(\ln\). Всегда график подогнанной кривой сравните с вашими исходными данными как проверку правильности.