. , , ,

,,,

. —

.

-

2007


. 3

. 6

II 8

1. . 10

1.1. . 10

1.2. . . 13

2. . 15

2.1. . 15

2.2. . 17

2.3. . 21

2.4. . 25

2.5. . 26

2.6. Data mining. 27

2.7. . 28

2.8. . 33

. 37

. 41


, . . , , , . , , . .

1988 . (-1), . (-2) 2004 . , () . , , . , , , .

, . -2 , . 2 . - .

, , . , , . . , - , - .

, .

, . . , , . , , , - , .

10 , , ( II). , 2006 , . . -, .

- , 2006 2008-2009 . :

1.  .

2.  . , . , , , , , .

3.  - , , .

II . .


, , . , . , , , Moody's Investors Services u Standard & Poor's.

. , , , .

. . . . .

II , . .

, , . .


II

1. - , , , . , . , , . .

2. , , , . , , . , , , , .

, , . , , . , . , . , . , .

. .

:

1.  ;

2.  , .

. , . SPSS 14.

. . , , .


1.

1.1. 

, , . : () ; ; ; ; ; ; ; ; ; [5].

, . : , , , , . , , . , . . .

, .

- , . , . , , , , . () .

, , .

, () . () . , . 2 10. , , . , .

. . , . 20% . , .

, . , , , . .

. , . .

. . , , .

. , , . . .

, . , . , , . , , . , : ( ).

1.2.  .

20 , ( 1.)

1.

0 Y 2
1 Z1 4
2 Z2 10
3 Z3 5
4 Z4 11
5 Z5 10
6 Z6 5
7 Z7 5
8 Z8 4

9 Z9 4
10 Z10 3
11 Z11 4
12 Z12 4
13 Z13 5
14 Z14 3
15 Z15 3
16 Z16 4
17 Z17 4
18 Z18 2
19 Z19 2
20 Z20 2

2.

. 1000 . 700 1, 300 0.


2.

, , :

  ;

  ;

  ;

  ;

  ;

  Data mining;

  ;

  Logit-;

.

2.1.

, , , , , . , : . , ? , . [4].

: -, ; -, ; -, . , .

, . , , , .

, , , . , , , .

, , : , ; , ; , .

: - -, . - (, , ), - . . (score); , (.3.). . , , , .

, - . , . , . , , , , , ( ).

3.

20 - 25 100
26 - 30 107
31 - 40 123
..
1000 - 3000 130
3001 - 5000 145
5001 - 6000 160
..

. , , .

2.2.

, . - . ( ) - - , ( ) . SPSS (K-Means Clustering) .

: k- "" . . : . , k . , . . , .

, " ", .

; . . . , , - - , .

, , .


X=(X1,,Xm) Y=(Y1,,Ym). (.4. ) , , CLUSTER:

  (Euclidian distance).

  (Squared Euclidian distance)

  .

  - , X Y. , . - , X Y ( 4.), , , . , E(Xi)=X.*(Xi+Yi)/(X.+Y.) E(Yi)=Y.*(Xi+Yi)/(X.+Y.), -

.

  - -, " " , X Y, .. N=X.+Y. .

, , - " ".

20 . 5. ( )

5. Cluster Membership

Case Number Y Cluster Distance
822 0 0 2985,732
823 1 0 2996,715
824 0 0 3040,706
825 1 0 3054,689
826 0 0 3099,727
827 1 0 3108,674
828 1 1 3100,310
829 1 1 3053,258
830 1 1 3043,285
831 1 1 2991,286

Y , 0 1, Cluster .

6 .


6. Number of Cases in each Cluster

 

Cluster 1 822,000
0 178,000

 

 

Valid 1000,000

 

Missing ,000

.

7. Expectation-Predictable Table

Y=0 Y=1
300 700 1000
178 822 1000
65 587 652
235 113 348
% 21,7% 83,9% 65,2%
% 78,3% 16,1% 34,8%

, , 83,9%, 21,7%. , .. .

2.3.

; . ( ) ( ) . [2]

D=b1*x1+b2*x2++bn*xn+a

1 2 , , x1 - xn , . , .

, . - .

: , , , , .

, . .

SPSS. 2 :

1. . 8


8. Classification Results(a)

 

Y Predicted Group Membership Total
0 1

 

Original Count 0 218 82 300
1 188 512 700
% 0 72,7 27,3 100,0
1 26,9 73,1 100,0

a 73,0% of original grouped cases correctly classified.

9

9. Canonical Discriminant Function Coefficients

Function

 

1
Z1 ,503
Z2 -,127
Z3 ,338
Z4 ,024
Z5 -,150
Z6 ,174
Z7 ,134
Z8 -,242
Z9 ,225
Z10 ,314
Z11 -,006
Z12 -,172
Z13 ,035
Z14 ,242
Z15 ,272
Z16 -,210
Z17 ,023
Z18 -,135
Z19 ,271
Z20 ,611
(Constant) -3,977

(p < 0,001).

10. Wilks' Lambda

Test of Function(s) Wilks' Lambda Chi-square df Sig.
1 ,760 271,399 20 ,000

2. . , .

11. Classification Results(a)

Y Predicted Group Membership Total
0 1
Original Count 0 219 81 300
1 203 497 700
% 0 73,0 27,0 100,0
1 29,0 71,0 100,0

a 71,6% of original grouped cases correctly classified.

(p < 0,001).

12. Wilks' Lambda

Test of Function(s) Wilks' Lambda Chi-square df Sig.
1 ,774 254,126 10 ,000

13


13. Canonical Discriminant Function Coefficients

Function

 

1
SCHET ,528
SROK -,140
HISTOR ,315
ZAIM -,145
CHARES ,186
TIMRAB ,133
VZNOS -,240
FAMIL ,248
PORUCHIT ,372
INIZAIMI ,262
(Constant) -3,288

, . - .

2.4.

. n- , ( .1).

.1.

. , . () .

, . .

2.5.

NN , , . . , . NN ( ) (. 2). NN NN .

.2. NN

, ( ) . , . NN- ().

2.6. Data mining

data mining . ; , , data mining [1]. , data mining , , . , , . , ,

data mining , . , , , ,


2.7.

 

, . Y Xk () :

Y=B0+B1X1++BpXp+e

e - . Xk " k", X k. "" Y "" Xk , . e . , , , N(0,σ2), . , X , , , , , X (, ), Y (, ). . :

. Y:

, - .

.

S . S, Y.

, , , , . :

1.  ? , , ?

2.  ?

SPSS , .

. :

- ;

- ;

- .

, , , B1,,Bp . (, sig F=0.003), , ; (, Sign F=0.5), , , .

, , . SSreg/SSt . , , . .

( y ). () . , R . , . :

.

X , bi y, Xi .

? , b1>b2, X1 X2?

. X, , , .

. . - Bk , , .

Y Z1-Z20 (.14.)


14.

Yf () . (.3.)

.3.

, [0,1] LP . , .

2.8.

, (0 , 1 - ). , , Y, , , Y - . . {Y=1} X1,,Xp. P{Y=1|X}=f(X)

, Z=B0+B1X1++BpXp

" " , . , , , , , [3].

, , P/(1-P) .

, Z=Ln(P/(1-P)), P=P{Y=1|X1,,Xp}. Z . , Z=B0+B1X1++BpXp.

P/(1-P)= .

, , , X1,,Xp Xk .

1.  X, , Xj= , {Y=1}. . , Zj.

2.  Z=B0+B1X1++BpXp. , Z X, - .

, X Y, . , ( ).

. SPSS (.15.), .

15. -

B
Step 1(a) schet ,585
srok -,139
histor ,388
naznah ,033
zaim -,181
chares ,239
timrab ,161
vznos -,299
famil ,264
poruchit ,360
timelive -,005
garonti -,191
vozras ,068
inizaimi ,315
kvartir ,318
kolzaim -,240
proff ,021
rodstve -,153
telefon ,312
inosmest 1,225
Constant -4,227

{Y=1}. , LOGISTIC REGRESSION : >0.5 , ; £0.5, , (.16).


16.

17.

17.

Y=0 Y=1
300 700 1000
226 774 1000
150 624 774
150 76 226
% 50,0% 89,1% 77,4%
% 50,0% 10,9% 22,6%

.


  () ,

  ,

  , , , ,

  - .

. . II, .

, , . , , , .

. , . , .

II . , , , . II . . , , , , .

. , , , .

. . II , . , .

II , .

, . , , . , . , , . II, , , , , . .

. .

, , , , , . , , . , .

, , , ., . , ( , ): , ( ). , . : , () . , . , . , , - , . , , , .


[1]  .,  . SPSS: . : . . .: ϻ, 2001. 608 .

[2]  . .,  . .,  . . : . .: , 2000. 352 .

[3] . . - . .: , 2000.

[4] . . - . .: -, 2006.

[5] . . , . . , . . . .: - .- -, 2005.

. - 2007 . 3

 

 

 

! , , , .
. , :