Основные задачи регрессионного анализа

Лекция 3

Зависимость именуется стохастической, если каждому определенному значению объясняющей переменной соответствует некое вероятностное рассредотачивание зависимой переменной (рассматриваемой как случайная величина).

А именно, стохастическая зависимость проявляется в том, что при изменении одной из величин меняется среднее значение другой. Такие стохастические зависимости именуются корреляционными.

К примеру, рост дохода ведет к повышению употребления; рост цены – к Основные задачи регрессионного анализа понижению спроса; понижение процентной ставки наращивает инвестиции; повышение обменного курса валюты уменьшает объем незапятнанного экспорта и т.д.

Но такая зависимость не является конкретной в том смысле, что каждому определенному значению объясняющей переменной может соответствовать не одно, а огромное количество значений из некой области.

Главные задачки регрессионного анализа

В Основные задачи регрессионного анализа силу неоднозначности корреляционной зависимости меж Y и X, для исследования воздействия независящей переменной на объясняемую переменную употребляют «усредненные» зависимости, т.е. изучают условное математическое ожидание M[Y|X=x] (математическое ожидание случайной величины, вычисленную в предположении, что переменная X приняла значение x) зависимо от x.

Так как при разных значениях будут Основные задачи регрессионного анализа получаться разные значения условного математического ожидания, то мы будем иметь дело с некоторой функцией

, (1)

которая именуется функцией регрессии Y на X.

Отметим, что реальные значения зависимой переменной Y не всегда совпадают с ее условными математическими ожиданиями и могут быть разными при одном и том же значении объясняющей переменной Основные задачи регрессионного анализа.

Потому связь меж зависимой и объясняющей переменной обычно записывают в виде

, (2)

называемое теоретическим уравнением регрессии. Величину e обычно именуют случайным отклонением (ошибкой, возмущением). Это слагаемое, которое, по существу, является случайной величиной и показывает на стохастическую сущность зависимости.

Для определения характеристик функции регрессии следует знать и использовать все значения переменных X Основные задачи регрессионного анализа и Y генеральной совокупы, что фактически нереально.

Главные задачки регрессионного анализа заключаются в том, чтоб по имеющимся статистическим данным для переменных X и Y:

а) установить форму зависимости меж переменными;

б) оценить функцию регрессии (т.е. получить лучшие оценки неведомых характеристик, проверить статистические догадки о параметрах модели);

в) проверить Основные задачи регрессионного анализа, довольно ли отлично модель согласуется со статистическими данными (адекватность модели данным наблюдений);

г) оценить неведомые значения зависимой переменной (сделать прогноз значений).

Используя выборочные данные можно выстроить так называемое эмпирическое уравнение регрессии:

, (3)

где – оценка условного математического ожидания , – оценка функции регрессии.

Как следует, в определенном случае

, (4)

где отклонение ei – оценка теоретического случайного отличия Основные задачи регрессионного анализа εi. Данную величину также именуют остатками (residuals).

Решений задачки построения высококачественного уравнения регрессии, соответственного эмпирическим данным и целям исследования, является довольно сложным и многоступенчатым процессом. Его можно разбить на три шага:

1) выбор формулы уравнения регрессии (спецификация);

2) определение характеристик выбранногоуравнения (параметризации);

3) анализ свойства уравнения и поверка адекватности уравнения эмпирическим данным, улучшение Основные задачи регрессионного анализа уравнения (верификации).

В случае парной регрессия выбор формулы обычно осуществляетсяпо графическому изображению реальных статистических данных в виде точек в декартовой системе координат, которое именуется корреляционным полем (диаграммой рассеивания)(см., к примеру, рис. 5.1).

Рис. 1

На рис. 1 представлены три ситуации.

На графике 5.1, а связь меж Х и Y близка к Основные задачи регрессионного анализа линейной, и ровная 1 достаточнохорошо соответствуетэмпирическим точкам. Потому в этом случае в качестве зависимости меж Х и Y целенаправлено избрать линейную функцию .

На графике 1, б настоящая связь меж Х и Y, вероятнее всего, описывается квадратичной функцией (линия 2).

И какую бы мы ни провели прямую (к примеру, линия I), отличия точек наблюдений Основные задачи регрессионного анализа от нее будут существенными и неслучайными.

На графике 1, в очевидная связь меж Х и Y отсутствует. Какую бы мы ни избрали форму связи, результаты ее спецификации и параметризации (определение коэффициентов уравнения) будут плохими.

А именно, прямые 1 и 2, проведенные через центр «облака» наблюдений и имеющие обратный наклон, идиентично Основные задачи регрессионного анализа плохи для того, чтоб делать выводы об ожидаемых значениях переменной Y по значениям переменной X.

Более тщательно вопросы спецификации, также вопросы параметризациии верификации уравнения регрессии, будут оговорены в последующих лекциях.


osnovnie-vivodi-avtoreferat-razoslan-27-avgusta-2012-g.html
osnovnie-vivodi-i-teoreticheskie-polozheniya-po-discipline.html
osnovnie-vivodi-obespechenie-tochnosti-ispolnitelnih-dvizhenij-v-precizionnih-avtomatizirovannih-stankah-na-osnove.html