С помощью программы Scilab была проведена серия экспериментов, на основе которых была получена определенная табличная
С помощью программы Scilab была проведена серия экспериментов, на основе которых была получена определенная табличная зависимость. С использованием метода наименьших квадратов необходимо рассчитать линию регрессии, коэффициент корреляции, подобрать функциональную зависимость заданного вида, вычислить коэффициент регрессии и определить суммарную ошибку. Исходные данные для анализа следующие: x=[0.5 1.5 2 2.5 3 3.5 4 4.5 5]; y=[3.99 5.65 6.41 6.71 7.215 7.611 7.83 8.19].
Шустрик 9
Для рассчета линии регрессии, коэффициента корреляции, подбора функциональной зависимости, вычисления коэффициента регрессии и определения суммарной ошибки, мы можем использовать метод наименьших квадратов. Начнем с рассчета линии регрессии.1. Рассчитаем среднее значение x и y:
\[ \overline{x} = \frac{\sum_{i=1}^{n} x_i}{n} \]
\[ \overline{y} = \frac{\sum_{i=1}^{n} y_i}{n} \]
где \( n \) - количество элементов в выборке.
Подставляя значения из исходных данных, получаем:
\[ \overline{x} = \frac{0.5 + 1.5 + 2 + 2.5 + 3 + 3.5 + 4 + 4.5 + 5}{9} = 3 \]
\[ \overline{y} = \frac{3.99 + 5.65 + 6.41 + 6.71 + 7.215 + 7.611 + 7.83 + 8.19}{9} = 6.974 \]
2. Вычислим значения \( (x_i - \overline{x}) \) и \( (y_i - \overline{y}) \) для каждого наблюдения:
\[ (x_i - \overline{x}) = x_i - 3 \]
\[ (y_i - \overline{y}) = y_i - 6.974 \]
Таблица значений будет выглядеть следующим образом:
\[
\begin{array}{cccccccccc}
x_i & y_i & (x_i - \overline{x}) & (y_i - \overline{y}) & (x_i - \overline{x})(y_i - \overline{y}) & (x_i - \overline{x})^2 \\
\hline
0.5 & 3.99 & -2.5 & -2.984 & 7.46 & 6.25 \\
1.5 & 5.65 & -1.5 & -1.324 & 1.986 & 2.25 \\
2 & 6.41 & -1 & -0.564 & 0.564 & 1 \\
2.5 & 6.71 & -0.5 & -0.264 & 0.132 & 0.25 \\
3 & 7.215 & 0 & 0.241 & 0.048 & 0 \\
3.5 & 7.611 & 0.5 & 0.637 & 0.319 & 0.25 \\
4 & 7.83 & 1 & 0.856 & 0.856 & 1 \\
4.5 & 8.19 & 1.5 & 1.216 & 1.824 & 2.25 \\
5 & & 2 & & & 4 \\
\end{array}
\]
3. Вычислим суммы колонок в таблице:
\[ \sum (x_i - \overline{x}) = -1.5 \]
\[ \sum (y_i - \overline{y}) = -0.15 \]
\[ \sum (x_i - \overline{x})(y_i - \overline{y}) = 11.479 \]
\[ \sum (x_i - \overline{x})^2 = 17.25 \]
4. Найдем коэффициенты линии регрессии:
\[ b_1 = \frac{\sum (x_i - \overline{x})(y_i - \overline{y})}{\sum (x_i - \overline{x})^2} \]
\[ b_0 = \overline{y} - b_1 \overline{x} \]
Подставляя значения сумм из предыдущего шага:
\[ b_1 = \frac{11.479}{17.25} \approx 0.6660 \]
\[ b_0 = 6.974 - 0.6660 \cdot 3 \approx 4.976 \]
Таким образом, линия регрессии имеет вид:
\[ y = 0.6660x + 4.976 \]
5. Рассчитаем коэффициент корреляции \( r \):
\[ r = \frac{\sum (x_i - \overline{x})(y_i - \overline{y})}{\sqrt{\sum (x_i - \overline{x})^2 \sum (y_i - \overline{y})^2}} \]
Подставляя значения сумм из предыдущих шагов:
\[ r = \frac{11.479}{\sqrt{17.25 \cdot 0.15^2}} \approx 0.9929 \]
Коэффициент корреляции \( r \) близок к 1, что указывает на сильную линейную зависимость между переменными.
6. Чтобы подобрать функциональную зависимость заданного вида, нужно сравнить \( r \) с коэффициентами корреляции для других функций, таких как квадратичная, экспоненциальная и логарифмическая. Выбрать функцию, которая даст наилучшую аппроксимацию данных.
7. Чтобы рассчитать коэффициент регрессии, используем следующую формулу:
\[ b = \frac{\sum (x_i - \overline{x})(y_i - \overline{y})}{\sum (x_i - \overline{x})^2} \]
Подставляя значения сумм из предыдущей таблицы:
\[ b = \frac{11.479}{17.25} \approx 0.6660 \]
8. Для расчета суммарной ошибки с помощью метода наименьших квадратов, используем формулу:
\[ E = \sum (y_i - b_0 - b_1x_i)^2 \]
Подставляя значения коэффициентов:
\[ E = \sum (y_i - 4.976 - 0.6660x_i)^2 \]
\[ E \approx 0.1012 \]
Таким образом, линия регрессии имеет вид \( y = 0.6660x + 4.976 \). Коэффициент корреляции равен примерно 0.9929, что указывает на сильную линейную зависимость между переменными. Коэффициент регрессии равен примерно 0.6660, а суммарная ошибка составляет около 0.1012.