Что такое калькулятор взвешенной регрессии кривой?
Это универсальный статистический инструмент, который подбирает выбранную модель кривой по набору данных с частотными весами. Вы вводите строки вида (x, y, частота) и выбираете модель — линейную, логарифмическую, e-экспоненциальную, ab-экспоненциальную, степенную, обратную или квадратичную, — а калькулятор возвращает подобранные коэффициенты (A, B, а для квадратичной — ещё и C), коэффициент корреляции r и понятное словесное описание силы связи. Это чистая математика, поэтому инструмент работает в любой стране и не привязан ни к юрисдикции, ни к единицам измерения.
Как пользоваться
Вводите данные по три числа в строке, разделяя их запятыми или пробелами: x, y, частота. Частота (вес) показывает, сколько раз встречается данная пара (x, y); если оставить поле пустым, частота по умолчанию равна 1 (без весов). Выберите модель и нажмите «Рассчитать». Используйте не менее 2 различных точек (3 — для квадратичной). Для логарифмической и степенной моделей требуется \(x > 0\); для экспоненциальных и степенной — \(y > 0\); для обратной модели — \(x \ne 0\).
Разбор формулы
Большинство моделей подбираются методом линеаризации: x и/или y преобразуют в (X, Y) так, чтобы зависимость стала прямой \(Y = a + b\cdot X\), а затем выполняют взвешенный метод наименьших квадратов с весами \(w_i = f_i\). При \(N = \Sigma w\) угловой коэффициент равен $$b = \frac{N\cdot S_{xy} - S_x\cdot S_y}{N\cdot S_{xx} - S_x^{2}}$$ а свободный член $$a = \frac{S_y - b\cdot S_x}{N}$$ где все суммы взвешенные. Коэффициент Пирсона r вычисляется уже в преобразованном пространстве. Для e-экспоненциальной и ab-экспоненциальной моделей подбирают \(\ln(y)\) по x; для степенной — \(\ln(y)\) по \(\ln(x)\); для обратной — y по \(1/x\). Квадратичная модель напрямую решает систему из 3 взвешенных нормальных уравнений 3×3 и выдаёт множественный коэффициент корреляции $$R = \sqrt{1 - \frac{SSE}{SST}}$$
Пример расчёта
Точки (x, y, f): (1,2,1), (2,3,1), (3,5,1), (4,4,1), (5,6,1), линейная модель. \(N=5\), \(S_x=15\), \(S_y=20\), \(S_{xx}=55\), \(S_{xy}=69\), \(S_{yy}=90\). Тогда $$b = \frac{5\cdot 69 - 15\cdot 20}{5\cdot 55 - 225} = \frac{45}{50} = 0{,}9$$ и $$a = \frac{20 - 0{,}9\cdot 15}{5} = 1{,}3$$ Получаем \(y = 1{,}3 + 0{,}9x\) при \(r = \frac{45}{\sqrt{50\cdot 50}} = 0{,}9\) — сильная корреляция.
Частые вопросы
Зачем нужен столбец частоты? Он задаёт вес каждой точке: частота 3 учитывает пару трижды в каждой сумме — ровно так, как в таблице частотного распределения. Частота 0 исключает строку из расчёта.
Как классифицируется сила связи? По модулю \(|r|\): больше 0,7 — сильная, 0,4–0,7 — умеренная, 0,2–0,4 — слабая, 0,2 и ниже — связи нет.
Почему может возникнуть ошибка? Если все значения X одинаковы, знаменатель обращается в ноль и единственной прямой не существует; ошибка также появится, если данные нарушают область определения модели (например, неположительное y при экспоненциальной модели).