Главная » Книжные издания

1 ... 11 12 13 14 15 16 17 ... 45

1 - (7.4.11)

V S(y-y)

Для решения проблемы определения достаточности объема выборочной совокупности можно воспользоваться методом уточненной выборки.

7.5. Модели множественной регрессии

в большинстве случаев необходимо идентифицировать более одного фактора, влияющего на стоимость объекта оценки. Количественные измерения влияния множества факторов на зависимую переменную (у) можно осуществить на основе методики многофакторного регрессионного анализа. В данном случае, так же как и в парной регрессии, зависимость может характеризоваться как линейной, так и нелинейной связью.

Линейная модель множественной регрессии имеет общий вид:

у = Ь, + х^ + х^ +...+ Ь„ х^, (7.5.1)

где bj, bg, b - коэффициенты множественной регрессии;

Xj, Xg, х^ - факторы, влияющие на стоимость объекта оценки, включенные в анализ;

Ь^ - постоянная величина, не зависящая от влияния отобранных факторов;

п - объем статической выборочной совокупности данных.

Отбор факторов начинается с логического анализа: если вариация у в зависимости от вариации конкретного фактора х логически не объяснима, в модель фактор включать не следует.

Можно исследовать линейную зависимость между у и любой комбинацией независимых переменных, однако модель будет иметь силу только в случае, если существует значимая связь и если каждый коэффициент регрессии b значимо отличается от нуля.

Факторы - это технические, экономические, природно-климатические, организационные, технологические, социально-демографические и другие показатели, оказываюп^ие количественное вли-

Теснота связи высокая, так как корреляционное отношение близко к единице.

Средняя относительная ошибка аппроксимации



яние на какой-либо результирующий экономический показатель: себестоимость, прибыль, выручка, стоимость объекта, денежный поток.

Задача математического моделирования состоит в выявлении количественной связи между факторами и результирующим показателем (признак-фактором).

Факторы не должны быть тесно связаны между собой, т. е. не должно быть мультиколлинеарности.

Рассмотрим методику построения многофакторной регрессионной модели на примере (табл. 7.5.1). Необходимо установить закономерность влияния на стоимость 1 м^ жилья (у) двух факторов: удаленность от центра города (Х^) и площадь кухни (Xg).

Таблица 7.5.1 Расчет параметров регрессионной модели

п/п

У, дол.

Xj, км

Х2, кв. м

(Х,-Х,)2

(Х,-Х,)2

(VY,)2

. 6

2601

1681

1521

1521

Итого

3972

12547

Среднее значение ,

Определим парные коэффициенты корреляции:



Таблица 7.5.2

Парные коэффициенты корреляции

у

-0,599

-0,239

+0,713

-0,239

На основе полученных результатов следует вычислить коэффициенты регрессии в стандартизированном виде, опираясь на следующую систему уравнений:

Pj-0,239p2 =-0,599 (7.5.2)

-0,239 р^ + р2 = 0,713

Решив систему уравнений, получим значения:

Р, = -0,456 р2 = 0,604

Коэффициенты регрессии в нормализованном виде определим по.формулам:

а

(7.5.3)

2 =h

(7.5.4) (7.5.5)

где Оу, о^р02 ~ средние квадратичные отклонения, определенные по формулам:

а = У

п

12547 19

= 25,70 (7.5.6)

между У и Х^; между У и Х^; между Xj и Xg.

Полученные значения приведены в табл. 7.5.2. Промежуточные расчеты опускаем, так как методика такого рода вычислений рассмотрена ранее.



а =

1(1 - xf i

116 19

= 2,47

1(2 -2>

i

п

= - 0,456

= 0,604

110 19

= 2,41

(7.5.7)

(7.5.8)

25,70 2,47

25,70 2,41

= -4,74; = 6,44;

\ = 209 - (-4,74) X 9-6,44 х 9 = 193,7.

X Xj, Xg - средние значения соответствующих переменных.

Окончательное уравнение регрессии имеет вид:

У = 193,7-4,74 хХ, 4-6,44 хХ (7.5.9)

Полученная модель указывает на то, что удаленность от центра влияет на стоимость жилья отрицательно и каждый дополнительный 1 км приведет к снижению стоимости 1 кв. м на 4,74 дол. Напротив, такой фактор как площадь кухни влияет положительно: увеличение площади на 1 кв. м ведет к росту стоимости 1 кв. м на 6,44 дол.

Коэффициент множественной корреляции для данной линейной модели может быть получен по следующей формуле:

1 ух 2 ух

(7.5.10)

R = ,У(-0,456) (-0,599) + 0,604 -0,713 = 0,839

Коэффициент детерминации:

Det = = 0,703, т. е. 70,3 %.

Коэффициент детерминации измеряет долю вариации у, объяснимую влиянием факторов X Х^......Х,, включенных в анализ.

В данном случае эта доля составляет 0,703.



(7.5.11)

где (п - 2) - число степеней свободы.

Критерий следует определить для каждой п^ры, образованной зависимой переменной с каждой независимой переменной. В нашем примере п = 19; г - парный коэффициент корреляции.

(-0,599) (19-2) З^З

1 - (-0,599)

(0,713)2(19-2)

1-(0,713)2

Критические значения t-критериев для уровня значимости 0,025 составляет 2,1098. Рассчитанные нами значения выше (3,08 и 4,19), что дает основание предположить, что парные коэффициенты корреляции между указанными показателями в генеральной совокупности не равны нулю и указанная линейная связь действительно существует.

Оценим общую значимость полученной многофакторной модели, применив F-критерий Фишера, который определим по формуле:

У( у. - у )2 1(у. - У1)2 F = У! . -1-L ; (7.5.12)

df df

регресс. остат.

где Y. - значения независимой переменной, рассчитанные на основе модели множественной регрессии; У - среднее значение переменной; У. - статистические значения переменной.

1( Y. -Y )2 = 8816,72 и I(Y.-Y.) = 3725,72

Данные получены расчетным путем на основе табл. 7.5.1.

Для оценки полученной модели на достоверность необходимо проверить значимость парных коэффициентов корреляции и коэффициентов регрессии каждой независимой переменной.

Формула t-критерия Стьюдента:



регресс ~ исло степенвй свободы для регрессии с числом независимых переменных к , числом данных в совокупности п . В нашем примере:

df =п-1 = 19-1-18.

регресс.

df = df - к = 18 - 2 =16.

остат регресс.

Из таблиц стандартного распределения F-критерия получим его значение для следующих параметров: уровень значимости = 0,05 к = 2 п-1-к=16

F-критерий = 1/19,43 = 0,051.

Расчетное значение F =2,104 > 0,051, что свидетельствует о том, что полученная нами модель имеет высокую достоверность. . Проверим каждое из значений коэффиццентов регрессии и Ь^,

Граничные значения t-критерия при 5 % уровне, значимости при (п-1-к) степенях свободы следующие:

Чо5оив = ±17459.

Значение t-критерия:

Значение t-критерия для каждого коэффициента регрессии должно лежать вне указанных границ.

Р = О, если проверяем гипотезу, что между параметрами нет связи и X не помогает в прогнозировании У;

р = 1, если выдвигается обратная гипотеза (в нашем примере Р -0);

Ь. - значение коэффициента регрессии; S Ь. - стандартная ошибка Ь..

sb. 2;(у.у)2

/(х-х)2 .(п-2)

Расчетно получили следующие значения на основе информации, приведенной в табл. 7.5.1.

Ку-У) = 3725,72 139



S(x -х^)2 = 116 => n/116 - 10,77

-х^) = 110 л/По = 10,49

, Н,74)-0 20,35

. М4 Ix 20,89

Полученные нами значения для обеих переменных не выходят за пределы интервального табличного значения, следовательно, полученная модель в целом недостоверна.

Применение метода математической статистики для массовой оценки объектов

Массовая оценка - это оценка систематической группы объектов по состоянию на определенную дату с использованием стандартных процедур анализа статистической информации.

Целью массовой оценки являются обоснование базы налогообложения, определение стоимости приватизации для объектов.

Этапы построения математической модели зависимости стоимости объекта недвижимости от набора факторов для массовой оценки объектов следующие:

1. Формирование базы данных по реальным сделкам с объектами недвижимости (подбор правильных аналогов, исключение нетипичных объектов).

2. Формирование перечня факторов, логически связанных со стоимостью объекта оценкрь

3. Классификация факторов и подготовка исходной информации. Факторы, не поддающиеся количественной оценке, могут быть заданы в символьном (0,1,2...) виде.

4. Математическое моделирование зависимости стоимости объекта оценки от набора факторов.

5. Анализ полученной модели и исключение факторов, имеющих незначительное влияние на стоимость объекта.

6. Повторно моделируется зависимость стоимости объекта от скорректированного набора факторов.

7. Выводится окончательная формула стоимости объекта.



Пример. Необходимо осуществить массовую оценку комплекса жилых зданий однотипной серии. Объекты идентифицируются по их почтовому адресу.

В качестве факторов отобраны следующие характеристики объектов:

Xj - количество комнат; Xg - общая площадь, кв.м; Xg - жилая площадь, кв.м; Х^ - площадь кухни, кв.м;

Х^ - тип здания (1 - кирпичный; О - панельный); Xg - этажность дома; Х^ - этаж квартиры;

Xg - планировка комнат (1 - смежные; 2 - смежно-раздельные;

3 - раздельные; 4 - однокомнатные); Xg - тип санузла (1 - ограниченные удобства; 2 - смежный;

3 - раздельный);

XjQ - тип горячего водоснабжения (1 - нет горячей воды; 2 - колонка, 3 - централизованное); Х^ - наличие лоджии; Xj2 - наличие балкона; Xjg - застекление лоджии (балкона); Х^ - наличие телефона;

Xj - состояние квартиры (1 - требуется капитальный ремонт; 2 - требуется косметический ремонт; 3 - улучшенное;

4 - евроремонт).

Сформировав экономико-математическую модель и выявив наиболее значимые факторы, можно строить формулу оценки.



8. Метод кластерного анализа

Метод кластерного анализа относится к методам многомерной классификации объектов и позволяет строить классификацию множества объектов посредством их объединения в группы (кластеры).

Пример. Провести классификацию 10 предприятий по двум показателям структуры активов (табл. 8.1).

Таблица 8.1

Показатели структуры активов, %

Предприятие

Доля ликвидных активов

0,27

0,32

0,20

0,27

0,34

0,20

0,22

0,22

0,21

0,23

Доля запасов

0,40

0,39

0,40

0,39

0,30

0,39

0,42

0,52

0,51

0,42

Систематизируем объекты путем их графического изображения (рис. 8.1).

В результате анализа выявлено, что объекты действительно можно разделить на 2 однородные группы:

кластер I: объекты 3,6,7,8,9,10;

кластер П: объекты 1,2,4,5.

Обобщенная характеристика объектов кластера I: низкая ликвидность активов и высокая доля запасов (60 % объектов).

Обобщенная характеристика объектов кластера II: высокая доля ликвидных активов и низкая доля запасов (40 % объектов).


Рис. 8.1. Изображение двух кластеров объектов в плоскости показате лей структуры баланса



Метод кластерного анализа

Для проверки правильности гипотезы о возможности классификации заданного множества объектов п, характеризуемых некоторым t переменных показателей х на некоторое число кластеров к, следует провести дискриминантный анализ и дать проведенной классификации вероятностную оценку.



1 ... 11 12 13 14 15 16 17 ... 45