PEMILIHAN MODEL REGRESI LINIER TERBAIK DENGAN METODE VALIDASI SILANG

Tarno, Tarno and Rukun, Santoso (2002) PEMILIHAN MODEL REGRESI LINIER TERBAIK DENGAN METODE VALIDASI SILANG. Documentation. FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM.

[img]PDF - Published Version
Restricted to Repository staff only

638Kb
[img]
Preview
PDF - Published Version
150Kb

Abstract

One of very useful statistical model in application is generalized linear model : y = )03 + ei = I,2,..., n (1) where yi is i-th response , : p-vector predictor variable related with yi, p-vector unknown parameter and a,: error random. Linear regression problem can be formulated as special case of equation (I). Predictor variables factually may not be influence to dependent variable y. Then we need select predictor variable x that significantly influence to response y. Based on the argument the problem of this research is how to select the best tMear model that have mean square error minimum and involve smallest variable. And the goal of this research is select the best linear regression of all possible models by cross-validation methode that based on resampling data Procedure of model selection is being done by minimized error prediction of all possible model, there are 2P-I where p 1 number of predictor. Procedure of model selection by cross-validation is extended from jackknife delete- I. Cross-validation delete-1 divide data to two parts : construction data and validation data. Cross-validation delete-1 is extended to cross-validation delete-d where d is less than the number of sample 11. Error prediction is differences between response y dan their estimation. Cross-validation dcictc-d is consistent as --/ --> I and (1)—s da. Results from a simulation with SPLUS system is also presented. From simulation results, cross-validation delete-d selects a model that have smaller predictor than cross-validation delete-I. Salah satu model statistik yang sangat berguna dalam berbagai bidang aplikasi adalah model linier umum 1 y, = , =1,2,...,n (1 ) dengan yt adalah respon ke-i , x, : p-vektor variabel prediktor yang berkaitan dengan y,, (3: p-vektor parameter yang tidak 61<etahui dan sesatan random. Masalah regresi linier dapat diformulasikan sebagai kasus khusus dart model (1) tersebut. Dalam masalah regresi sernua variabel prediktor yang sebeturnnya diduga berpengaruh terhadap respon, pada prakteknya belurn tentu berpengaruh secara signifikan terhadap respon. Dengan demikian perlu dilakukan pernilihan variable prediktor yang berpengaruh seeara signifikan terhadap variable respon. Flerdasarkan hal tersebut, yang menjadi pennasalahan dalam penelitian ini adalah bagaimana prosedur pemilihan model regresi lerbaik, yaltii model yang inemiliki kesalahan prediksi paling kecil dan melibatkan variable predictor sesedikit mungkin. Dan Unman penelitian ini adalah menentukan model regresi terbaik dari semua model yang mungkin dengan metode yang berdasarkan resatnpling yaitu metode validasi silang. Prosedur pemilihan model terbaik dilakukan dengan menentukan estimasi sesatan prcdiksi yang minimal atas semua model yang mungkin yaitu ada sebanyak 2F-1 model dengan p: banyaknya prediktor. Prosedur pemilihan model dengan menggunakan validasi silang lepas-1 dikembangkan dan metode jackknife lepas-1. Metode validasi silang tapas- I membagi data menjadi duct bagian yaitu data konsttuksi terdiri dari data asli dengan inelepaskan (mengeluarkan) datum yang ke-i (i=1,2,3,...,n) dan data validasi i I. Dan metode validasi silang lepas-1 secara umum dikembangkan menjadi metode validasi silang lepas-d dengan d lebih kecil.

Item Type:Monograph (Documentation)
Subjects:Q Science > QA Mathematics
Divisions:Faculty of Science and Mathematics > Department of Mathematics
ID Code:20857
Deposited By:Mr UPT Perpus 5
Deposited On:24 Aug 2010 08:09
Last Modified:24 Aug 2010 08:09

Repository Staff Only: item control page