Statistik modellashtirish: usullari, tavsifi, qoʻllanilishi

Mundarija:

Statistik modellashtirish: usullari, tavsifi, qoʻllanilishi
Statistik modellashtirish: usullari, tavsifi, qoʻllanilishi
Anonim

Statistik modellashtirishda oʻz ifodasini topgan taxminlar ehtimollik taqsimotlari toʻplamini tavsiflaydi, ularning baʼzilari taqsimotni adekvat ravishda taxmin qiladi deb taxmin qilinadi. Ta'rifdan ma'lum bir ma'lumotlar to'plami tanlanadi. Statistik modellashtirishga xos bo'lgan ehtimollik taqsimoti statistik modellarni boshqa, statistik bo'lmagan, matematik modellardan ajratib turadigan narsadir.

Image
Image

Matematika bilan aloqa

Bu ilmiy usul asosan matematikaga asoslangan. Tizimlarni statistik modellashtirish odatda bir yoki bir nechta tasodifiy o'zgaruvchilar va ehtimol boshqa tasodifiy bo'lmagan o'zgaruvchilar bilan bog'liq bo'lgan matematik tenglamalar bilan beriladi. Shunday qilib, statistik model "nazariyaning rasmiy ifodasidir" (Hermann Ader, Kennet Bollendan iqtibos keltirgan).

Barcha statistik gipoteza testlari va barcha statistik taxminlar statistik modellardan olingan. Umuman olganda, statistik modellar statistik xulosalar asosining bir qismidir.

Statistika usullarimodellashtirish

Norasmiy ravishda statistik modelni ma'lum xususiyatga ega bo'lgan statistik taxmin (yoki statistik taxminlar to'plami) sifatida qarash mumkin: bu taxmin har qanday hodisaning ehtimolini hisoblash imkonini beradi. Misol tariqasida, bir juft oddiy olti qirrali zarni ko'rib chiqing. Biz suyak haqidagi ikki xil statistik taxminni o‘rganamiz.

Birinchi statistik taxmin statistik modelni tashkil qiladi, chunki faqat bitta taxmin bilan biz har qanday hodisaning ehtimolini hisoblashimiz mumkin. Muqobil statistik taxmin statistik modelni tashkil etmaydi, chunki faqat bitta taxmin bilan biz har bir hodisaning ehtimolini hisoblab bo‘lmaydi.

Oddiy statistik model
Oddiy statistik model

Yuqoridagi misolda birinchi taxmin bilan hodisa ehtimolini hisoblash oson. Biroq, ba'zi boshqa misollarda hisoblash murakkab yoki hatto amaliy bo'lmasligi mumkin (masalan, millionlab yillar hisoblashni talab qilishi mumkin). Statistik modelni tashkil etuvchi taxmin uchun bu qiyinchilik maqbuldir: hisob-kitobni amalga oshirish amaliy jihatdan mumkin bo'lishi shart emas, faqat nazariy jihatdan mumkin.

Modellarga misollar

Bizda bolalar soni teng taqsimlangan maktab oʻquvchilari bor deb faraz qilaylik. Bolaning bo'yi stokastik ravishda yoshga bog'liq bo'ladi: masalan, biz bolaning 7 yoshda ekanligini bilsak, bu bolaning bo'yi 5 fut (taxminan 152 sm) bo'lish ehtimoliga ta'sir qiladi. Biz bu munosabatni chiziqli regressiya modelida rasmiylashtirishimiz mumkin, masalan: o'sish=b0 + b1agei+ ei, bu erda b0 - kesishma, b1 - o'sish prognozini olishda yosh ko'paytiriladigan parametr, ei - xato atamasi. Bu shuni anglatadiki, bo'y yoshga qarab xato bilan bashorat qilinadi.

Toʻgʻri model barcha maʼlumotlar nuqtalariga mos kelishi kerak. Shunday qilib, to'g'ri chiziq (heighti=b0 + b1agei) ma'lumotlar modeli uchun tenglama bo'la olmaydi - agar u barcha ma'lumotlar nuqtalariga to'liq mos tushmasa, ya'ni barcha ma'lumotlar nuqtalari chiziqda mukammal yotmasa. Model barcha maʼlumotlar nuqtalariga mos kelishi uchun ii xato atamasi tenglamaga kiritilishi kerak.

gender statistikasi
gender statistikasi

Statistik xulosa chiqarish uchun birinchi navbatda ei uchun ba'zi ehtimollik taqsimotlarini qabul qilishimiz kerak. Masalan, ei ning taqsimlanishi Gauss bo'lib, o'rtacha nolga teng deb taxmin qilishimiz mumkin. Bunday holda, model 3 ta parametrga ega bo'ladi: b0, b1 va Gauss taqsimotining dispersiyasi.

Umumiy tavsif

Statistik model - matematik modelning maxsus sinfi. Statistik modelni boshqa matematik modellardan ajratib turadigan jihati shundaki, u deterministik emas. U statistik ma'lumotlarni modellashtirish uchun ishlatiladi. Shunday qilib, matematik tenglamalar bilan aniqlangan statistik modelda ba'zi o'zgaruvchilar o'ziga xos qiymatlarga ega emas, balki ehtimollik taqsimotiga ega; ya'ni ba'zi o'zgaruvchilar stokastikdir. Yuqoridagi misolda e - stokastik o'zgaruvchi; bu o'zgaruvchisiz, model edideterministik bo'lar edi.

Statistik modellar ko'pincha statistik tahlil va modellashtirishda, hatto modellashtirilayotgan jismoniy jarayon deterministik bo'lsa ham qo'llaniladi. Masalan, tanga tashlash printsipial jihatdan deterministik jarayondir; lekin u odatda stokastik sifatida modellanadi (Bernulli jarayoni orqali).

isinish statistikasi
isinish statistikasi

Parametrik modellar

Parametrik modellar eng koʻp qoʻllaniladigan statistik modellardir. Yarim parametrli va parametr bo'lmagan modellar haqida ser Devid Koks shunday dedi: "Ular odatda taqsimotning tuzilishi va shakli haqida kamroq taxminlarni o'z ichiga oladi, lekin odatda kuchli mustaqillik farazlarini o'z ichiga oladi." Boshqa barcha eslatib o'tilgan modellar singari, ular ham tez-tez matematik modellashtirishning statistik usulida qo'llaniladi.

Ko'p darajali modellar

Ko'p darajali modellar (shuningdek, ierarxik chiziqli modellar, ichki ma'lumotlar modellari, aralash modellar, tasodifiy koeffitsientlar, tasodifiy effektlar modellari, tasodifiy parametr modellari yoki bo'lingan modellar sifatida ham tanilgan) bir nechta darajada o'zgarib turadigan statistik parametr modellaridir. Misol tariqasida alohida o‘quvchilar uchun ko‘rsatkichlar hamda o‘quvchilar guruhlangan sinflar uchun ko‘rsatkichlarni o‘z ichiga olgan o‘quvchilar muvaffaqiyati modelidir. Bu modellarni chiziqli modellarning umumlashmasi (xususan, chiziqli regressiya) deb hisoblash mumkin, garchi ularni chiziqli bo'lmagan modellarga ham kengaytirish mumkin. Bu modellar aylandiEtarli hisoblash quvvati va dasturiy ta'minot mavjud bo'lganda ancha mashhur bo'ldi.

Segmentlar statistikasi
Segmentlar statistikasi

Koʻp darajali modellar, ayniqsa, ishtirokchilar uchun maʼlumotlar bir nechta darajada tashkil etilgan tadqiqot loyihalari uchun mos keladi (yaʼni, ichki maʼlumotlar). Tahlil birliklari odatda kontekst/jamlama birliklari (yuqori darajada) ichida joylashgan shaxslar (pastki darajadagi) hisoblanadi. Ko'p darajali modellarda ma'lumotlarning eng past darajasi odatda individual bo'lsa-da, shaxslarning takroriy o'lchovlari ham hisobga olinishi mumkin. Shunday qilib, ko'p darajali modellar bir yoki ko'p o'lchovli takroriy o'lchovlarni tahlil qilish uchun muqobil tahlil turini taqdim etadi. O'sish egri chizig'idagi individual farqlarni hisobga olish mumkin. Bundan tashqari, ko'p darajali modellar ANCOVA ga muqobil sifatida ishlatilishi mumkin, bunda davolash farqlarini tekshirishdan oldin bog'liq o'zgaruvchilar ballari kovariatlar (masalan, individual farqlar) uchun tuzatiladi. Ko‘p darajali modellar bu tajribalarni ANCOVA talab qiladigan yagona regressiya qiyaliklarisiz tahlil qila oladi.

Koʻp darajali modellar koʻp darajali maʼlumotlar uchun ishlatilishi mumkin, garchi ikki darajali modellar eng keng tarqalgan boʻlsa ham, maqolaning qolgan qismi shularga qaratilgan. Bog'liq o'zgaruvchi tahlilning eng past darajasida tekshirilishi kerak.

Atmosfera bosimi grafigi
Atmosfera bosimi grafigi

Model tanlash

Model tanlashstatistik modellashtirish doirasida amalga oshiriladigan ma'lumotlar berilgan nomzod modellar to'plamidan tanlash vazifasidir. Eng oddiy hollarda, allaqachon mavjud ma'lumotlar to'plami ko'rib chiqiladi. Shu bilan birga, vazifa to'plangan ma'lumotlar model tanlash vazifasiga yaxshi mos kelishi uchun tajribalarni loyihalashni ham o'z ichiga olishi mumkin. Shunga o'xshash bashorat qilish yoki tushuntirish kuchiga ega nomzod modellarni hisobga olsak, eng oddiy model eng yaxshi tanlov bo'lishi mumkin (Occam ustarasi).

Konishi va Kitagava shunday deydi: "Statistik xulosa chiqarish muammolarining aksariyati statistik modellashtirish bilan bog'liq muammolar deb hisoblanishi mumkin". Xuddi shunday, Koks shunday dedi: "Mavzuni statistik modelga qanday tarjima qilish ko'pincha tahlilning eng muhim qismidir."

Model tanlash noaniqlik sharoitida qaror qabul qilish yoki optimallashtirish maqsadida katta hisoblash modellari toʻplamidan bir nechta vakili modellarni tanlash muammosiga ham tegishli boʻlishi mumkin.

Grafik naqshlar

Grafik model yoki ehtimolli grafik model, (PGM) yoki tuzilgan ehtimolli model, grafik tasodifiy oʻzgaruvchilar orasidagi shartli munosabat tuzilishini ifodalovchi ehtimolli modeldir. Ular odatda ehtimollar nazariyasi, statistika (ayniqsa Bayes statistikasi) va mashinani oʻrganishda qoʻllaniladi.

Grafik bilan statistik model
Grafik bilan statistik model

Ekonometrik modellar

Ekonometrik modellar statistik modellardirekonometriya. Ekonometrik model ma'lum bir iqtisodiy hodisa bilan bog'liq bo'lgan turli iqtisodiy miqdorlar o'rtasida mavjud deb hisoblangan statistik munosabatlarni belgilaydi. Ekonometrik model noaniqlikni hisobga oladigan deterministik iqtisodiy modeldan yoki o'zi stokastik bo'lgan iqtisodiy modeldan olinishi mumkin. Biroq, biron bir iqtisodiy nazariyaga bog'lanmagan ekonometrik modellardan ham foydalanish mumkin.

Tavsiya: