Gipotezani tekshirish statistikada zarur protsedura hisoblanadi. Gipoteza testi namunaviy ma'lumotlar tomonidan qaysi bayonot eng yaxshi qo'llab-quvvatlanishini aniqlash uchun bir-birini istisno qiluvchi ikkita bayonotni baholaydi. Agar topilma statistik jihatdan ahamiyatli deb aytilsa, bu gipoteza sinovi tufaylidir.
Tasdiqlash usullari
Statistik gipotezalarni tekshirish usullari statistik tahlil usullaridir. Odatda, ikkita statistik ma'lumotlar to'plami taqqoslanadi yoki namunali ma'lumotlar to'plami ideallashtirilgan modeldagi sintetik ma'lumotlar to'plami bilan taqqoslanadi. Ma'lumotlar yangi ma'nolarni qo'shadigan tarzda talqin qilinishi kerak. Yakuniy natijaning ma'lum bir tuzilishini qabul qilish va taxminni tasdiqlash yoki rad etish uchun statistik usullardan foydalanish orqali ularni sharhlashingiz mumkin. Faraz gipoteza deb ataladi va bu maqsadda foydalaniladigan statistik testlar statistik farazlar deb ataladi.
H0 va H1 gipotezalari
Ikkita asosiy borgipotezalarni statistik tekshirish tushunchalari - "asosiy yoki nol gipoteza" va "muqobil gipoteza" deb ataladigan tushunchalar. Ular Neyman-Pirson gipotezalari deb ham ataladi. Statistik test taxmini nol gipoteza, asosiy gipoteza yoki qisqacha H0 deb ataladi. Bu ko'pincha standart taxmin yoki hech narsa o'zgarmagan degan taxmin deb ataladi. Sinov taxminining buzilishi ko'pincha birinchi gipoteza, muqobil gipoteza yoki H1 deb ataladi. H1 boshqa gipotezalarning qisqartmasi, chunki biz bu haqda faqat H0 maʼlumotlarini oʻchirib tashlash mumkinligini bilamiz.
Nol gipotezani rad etish yoki rad qilmaslikdan oldin test natijasini talqin qilish kerak. Taqqoslash, agar ma'lumotlar to'plami o'rtasidagi bog'liqlik chegara ehtimolligi - ahamiyatlilik darajasi bo'yicha nol gipotezani amalga oshirish bo'lishi ehtimoldan yiroq bo'lsa, statistik ahamiyatga ega deb hisoblanadi. Statistik gipotezalarni tekshirish uchun moslik mezonlari ham mavjud. Bu noma'lum taqsimotning taxminiy qonuni bilan bog'liq bo'lgan gipotezani tekshirish mezonining nomi. Bu empirik va nazariy taqsimotlar oʻrtasidagi tafovutning raqamli oʻlchovidir.
Statistik gipotezalarni tekshirish tartibi va mezonlari
Gipotezani tanlashning eng keng tarqalgan usullari Akaike axborot mezoniga yoki Bayes koeffitsientiga asoslanadi. Statistik gipoteza sinovi xulosa chiqarishda ham, Bayes xulosasida ham asosiy usul hisoblanadi, garchi bu ikki tur sezilarli farqlarga ega. Statistik gipoteza testlarinoto'g'ri defolt yoki nol gipoteza bo'yicha noto'g'ri qaror qabul qilish ehtimolini nazorat qiluvchi protsedurani aniqlang. Jarayon uning ishlash ehtimoli qanchalik katta ekanligiga asoslanadi. Noto'g'ri qaror qabul qilish ehtimoli - bu nol gipotezaning to'g'ri bo'lishi va alohida muqobil gipoteza mavjud emasligi ehtimoli. Sinov uning rost yoki yolgʻonligini koʻrsata olmaydi.
Qarorlar nazariyasining muqobil usullari
Qarorlar nazariyasining muqobil usullari mavjud boʻlib, ularda nol va birinchi gipotezalar tengroq asosda koʻrib chiqiladi. Qaror qabul qilishning boshqa yondashuvlari, masalan, Bayes nazariyasi, bitta nol gipotezaga e'tibor qaratish o'rniga, barcha imkoniyatlar bo'yicha noto'g'ri qarorlar oqibatlarini muvozanatlashga harakat qiladi. Gipotezalarning qaysi biri to'g'ri ekanligini aniqlashning bir qator boshqa yondashuvlari ma'lumotlarga asoslanadi, ulardan qaysi biri kerakli xususiyatlarga ega. Ammo gipoteza sinovi fanning koʻplab sohalarida maʼlumotlarni tahlil qilishda asosiy yondashuv hisoblanadi.
Statistik gipotezani sinab ko'rish
Natijalar toʻplami boshqa toʻplamdan farq qilganda, statistik gipoteza yoki statistik gipoteza testlariga tayanish kerak. Ularning talqini p-qiymatlari va tanqidiy qadriyatlarni to'g'ri tushunishni talab qiladi. Shuni ham tushunish kerakki, muhimlik darajasidan qat'i nazar, testlar hali ham xatolarni o'z ichiga olishi mumkin. Shuning uchun xulosa toʻgʻri boʻlmasligi mumkin.
Sinov jarayoni quyidagilardan iboratbir necha qadam:
- Tadqiqot uchun dastlabki gipoteza yaratilmoqda.
- Tegishli nol va muqobil farazlar koʻrsatilgan.
- Testdagi namuna haqidagi statistik taxminlarni tushuntiradi.
- Qaysi test mos ekanligini aniqlash.
- Muhimlik darajasini va nol gipoteza rad etiladigan ehtimollik chegarasini tanlang.
- Nol gipoteza testi statistikasining taqsimoti nol gipoteza rad etilishi mumkin boʻlgan qiymatlarni koʻrsatadi.
- Hisoblash davom etmoqda.
- Muqobil gipotezani rad etish yoki qabul qilish toʻgʻrisida qaror qabul qilinadi.
P-qiymatini ishlatadigan muqobil mavjud.
Ahamiyatlilik testlari
Sof ma'lumotlardan talqinisiz amaliy foyda yo'q. Statistikada ma'lumotlar haqida savollar berish va natijalarni sharhlash haqida gap ketganda, javoblarning aniqligi yoki ehtimolini ta'minlash uchun statistik usullar qo'llaniladi. Statistik gipotezalarni sinab ko'rishda ushbu toifadagi usullar statistik test yoki ahamiyatlilik testlari deb ataladi. "Gipoteza" atamasi gipoteza va nazariyalar o'rganiladigan ilmiy usullarni eslatadi. Statistikada gipoteza testi berilgan faraz berilgan miqdorni beradi. Bu taxminning toʻgʻri yoki buzilganligini izohlash imkonini beradi.
Testlarning statistik talqini
Gipoteza testlariQaysi tadqiqot natijalari oldindan belgilangan ahamiyat darajasi uchun nol gipotezani rad etishga olib kelishini aniqlash uchun ishlatiladi. Statistik gipoteza testining natijalari, u ustida ishlash davom etishi uchun talqin qilinishi kerak. Statistik gipotezalarni tekshirish mezonlarining ikkita umumiy shakli mavjud. Bular p-qiymati va kritik qiymatlardir. Tanlangan mezonga qarab, olingan natijalar boshqacha talqin qilinishi kerak.
p-qiymati nima
Chiqish p-qiymatini sharhlashda statistik ahamiyatga ega deb ta'riflanadi. Aslida, bu ko'rsatkich, agar nol gipoteza rad etilsa, xatolik ehtimolini anglatadi. Boshqacha qilib aytganda, u test natijasini sharhlash yoki miqdorini aniqlash uchun ishlatilishi mumkin bo'lgan qiymatni nomlash va nol gipotezani rad etishda xatolik ehtimolini aniqlash uchun ishlatilishi mumkin. Misol uchun, siz ma'lumotlar namunasi bo'yicha normallik testini o'tkazishingiz mumkin va u erdan chiqish ehtimoli kamligini aniqlashingiz mumkin. Biroq, nol gipotezani rad etish shart emas. Statistik gipoteza testi p-qiymatini qaytarishi mumkin. Bu p qiymatini muhimlik darajasi deb ataladigan oldindan belgilangan chegara qiymati bilan solishtirish orqali amalga oshiriladi.
Ahamiyat darajasi
Ahamiyat darajasi ko'pincha yunoncha kichik "alfa" harfi bilan yoziladi. Alfa uchun ishlatiladigan umumiy qiymat 5% yoki 0,05. Kichikroq alfa qiymati nol gipotezani ishonchliroq talqin qilishni taklif qiladi. p-qiymati bilan solishtiriladioldindan tanlangan alfa qiymati. Agar p-qiymati alfadan kichik bo'lsa, natija statistik ahamiyatga ega. Muhimlik darajasini birdan ayirish yo'li bilan o'zgartirish mumkin. Bu kuzatilgan namuna ma'lumotlarini hisobga olgan holda gipotezaning ishonch darajasini aniqlash uchun amalga oshiriladi. Statistik gipotezalarni tekshirishning ushbu usulidan foydalanganda P-qiymati ehtimollikdir. Bu shuni anglatadiki, statistik test natijasini sharhlash jarayonida nima to'g'ri yoki noto'g'ri ekanligini bilib bo'lmaydi.
Statistik gipotezalarni tekshirish nazariyasi
Nol gipotezani rad etish uning ehtimoliy koʻrinishi haqida yetarlicha statistik dalillar mavjudligini bildiradi. Aks holda, bu uni rad etish uchun etarli statistik ma'lumotlar yo'qligini anglatadi. Statistik testlarni nol gipotezani rad etish va qabul qilish dixotomiyasi nuqtai nazaridan o'ylash mumkin. Nol gipotezani statistik tekshirishning xavfliligi shundaki, agar qabul qilingan bo'lsa, u haqiqat bo'lib ko'rinishi mumkin. Buning o'rniga, nol gipoteza rad etilmaydi, deyish to'g'riroq bo'ladi, chunki uni rad etish uchun statistik dalillar yetarli emas.
Bu lahza ko'pincha yangi boshlovchilarni chalkashtirib yuboradi. Bunday holatda, natija ehtimollik ekanligini va hatto nol gipotezani qabul qilishda ham xatolik ehtimoli kamligini eslatib turish muhimdir.
To'g'ri yoki noto'g'ri nol gipoteza
p qiymatini talqin qilish nol degani emasgipoteza to'g'ri yoki noto'g'ri. Bu empirik ma'lumotlar va tanlangan statistik test asosida ma'lum bir statistik ahamiyatga ega bo'lgan nol gipotezani rad etish yoki rad etmaslik tanlovi qilinganligini anglatadi. Shuning uchun, p-qiymatini statistik testlarga kiritilgan oldindan belgilangan taxmin ostida berilgan ma'lumotlarning ehtimolligi deb hisoblash mumkin. p-qiymati nol gipoteza to'g'ri bo'lsa, ma'lumotlar namunasi qanchalik kuzatilishi mumkinligini ko'rsatadigan o'lchovdir.
Muhim qiymatlarni talqin qilish
Ba'zi testlar p.ni qaytarmaydi. Buning o'rniga ular muhim qiymatlar ro'yxatini qaytarishi mumkin. Bunday tadqiqot natijalari xuddi shunday talqin qilinadi. Yagona p-qiymatini oldindan belgilangan ahamiyatlilik darajasi bilan solishtirish o'rniga, test statistikasi kritik qiymat bilan taqqoslanadi. Agar u kamroq bo'lib chiqsa, bu nol gipotezani rad etish mumkin emasligini anglatadi. Agar dan katta yoki teng bo'lsa, nol gipoteza rad etilishi kerak. Statistik gipotezani tekshirish algoritmining ma'nosi va uning natijasini talqin qilish p-qiymatiga o'xshaydi. Tanlangan muhimlik darajasi maʼlumotlar asosidagi testning asosiy taxminini rad etish yoki rad etmaslik haqidagi ehtimolli qarordir.
Statistik testlardagi xatolar
Statistik gipoteza testining talqini ehtimolga asoslangan. Statistik gipotezalarni sinab ko'rish vazifasi to'g'ri yoki noto'g'ri bayonotni topish emas. Sinov dalillari noto'g'ri bo'lishi mumkin. Misol uchun, agar alfa 5% bo'lsa, bu ko'pincha 20 tadan 1 qismini anglatadinol gipoteza xato bilan rad etiladi. Yoki bu ma'lumotlar namunasidagi statistik shovqin tufayli bo'lmaydi. Ushbu nuqtani hisobga olgan holda, nol gipotezani rad etish uchun kichik p qiymati uning noto'g'ri ekanligini yoki xatolik yuz berganligini anglatishi mumkin. Agar bunday turdagi xatolik yuzaga kelsa, natija noto'g'ri ijobiy deb ataladi. Va bunday xatolik statistik gipotezalarni tekshirishda birinchi turdagi xatodir. Boshqa tomondan, agar p-qiymati nol gipotezani rad etish uchun etarlicha katta bo'lsa, bu uning haqiqat ekanligini anglatishi mumkin. Yoki noto'g'ri va xatolikka yo'l qo'yilgan ba'zi bir ehtimol bo'lmagan hodisa yuz berdi. Bunday xatolik noto‘g‘ri salbiy deb ataladi.
Xatolar ehtimoli
Statistik gipotezalarni sinab koʻrishda ham bu turdagi xatolarga yoʻl qoʻyish imkoniyati mavjud. Noto'g'ri ma'lumotlar yoki noto'g'ri xulosalar ehtimoli katta. Ideal holda, ushbu xatolardan birining ehtimolini kamaytiradigan muhimlik darajasini tanlash kerak. Masalan, nol gipotezalarni statistik tekshirish juda past darajadagi ahamiyatga ega bo'lishi mumkin. 0,05 va 0,01 kabi muhimlik darajalari fanning ko'plab sohalarida keng tarqalgan bo'lsa-da, eng ko'p ishlatiladigan muhimlik darajasi 310^-7 yoki 0,0000003. U ko'pincha "5-sigma" deb ataladi. Bu shuni anglatadiki, xulosa tasodifiy bo'lib, tajribalarning 3,5 million mustaqil takrorlanishidan 1 ta ehtimollik bilan. Statistik gipotezalarni sinab ko'rish misollari ko'pincha bunday xatolarni o'z ichiga oladi. Mustaqil natijalarga erishish muhimligining sababi ham shu.tekshirish.
Statistik tekshirishdan foydalanishga misollar
Amalda gipotezalarni tekshirishning bir nechta keng tarqalgan misollari mavjud. Eng mashhurlaridan biri "Choyni tatib ko'rish" deb nomlanadi. Doktor Muriel Bristol, biometrika asoschisi Robert Fisherning hamkasbi, u birinchi bo'lib bir piyola choy yoki sutga qo'shilganligini aniq ayta olishini da'vo qildi. Fisher unga tasodifiy sakkizta stakan (har bir navdan to'rttasi) berishni taklif qildi. Sinov statistikasi oddiy edi: kubokni tanlashda muvaffaqiyatlar sonini hisoblash. Muhim mintaqa 4 tadan yagona muvaffaqiyat edi, ehtimol odatiy ehtimollik mezoniga asoslangan (< 5%; 70da 1 ≈ 1,4%). Fisher muqobil gipoteza kerak emasligini ta'kidladi. Xonim har bir stakanni to'g'ri aniqladi, bu statistik jihatdan muhim natija deb hisoblanadi. Bu tajriba Fisherning “Statistical Methods for Researchers” kitobiga olib keldi.
Ayblanuvchiga misol
Statistik sud jarayonini sudlanuvchining aybi isbotlanmaguncha aybsiz deb hisoblangan jinoiy sud bilan solishtirish mumkin. Prokuror sudlanuvchining aybini isbotlashga harakat qiladi. Faqatgina ayblov uchun etarli dalillar mavjud bo'lganda, sudlanuvchi aybdor deb topilishi mumkin. Protseduraning boshida ikkita faraz mavjud: "Sudlanuvchi aybdor emas" va "Ayblanuvchi aybdor". Aybsizlik gipotezasi faqat xato ehtimoli juda kam bo'lganda rad etilishi mumkin, chunki aybsiz ayblanuvchini hukm qilishni xohlamaydi. Bunday xatolik I turdagi xato va uning yuzaga kelishi deyiladikamdan-kam hollarda nazorat qilinadi. Ushbu assimetrik xatti-harakatlar natijasida II turdagi xatolik, ya'ni jinoyatchini oqlash ko'proq uchraydi.
Statistikalar katta hajmdagi ma'lumotlarni tahlil qilishda foydalidir. Bu ilmiy nazariya mavjud bo'lmasa ham, xulosalarni asoslashi mumkin bo'lgan gipotezalarni sinab ko'rishga ham tegishli. Choyni tatib ko‘rish misolida choyga sut quyish yoki sutga choy quyish o‘rtasida hech qanday farq yo‘qligi “ravshan” edi.
Gipoteza testining haqiqiy amaliy qoʻllanilishi quyidagilarni oʻz ichiga oladi:
- erkaklar ayollarga qaraganda koʻproq dahshat koʻradimi yoki yoʻqligini tekshirish;
- hujjat atributi;
- To'lin oyning xulq-atvorga ta'sirini baholash;
- koʻrshapalaklar aks-sado yordamida hasharotlarni aniqlay oladigan diapazonni aniqlash;
- chekishni tashlash uchun eng yaxshi vositalarni tanlash;
- Bamper stikerlari avtomobil egasining xatti-harakatlarini aks ettiradimi yoki yoʻqmi tekshirilmoqda.
Statistik gipotezalarni tekshirish umumiy statistikada va statistik xulosa chiqarishda muhim rol oʻynaydi. Qiymat testi ilmiy usulning asosi sifatida taxmin qilingan qiymat va eksperimental natijani an'anaviy taqqoslash o'rniga qo'llaniladi. Agar nazariya faqat munosabatlar belgisini bashorat qilishga qodir bo'lsa, yo'n altirilgan gipoteza testlari nazariyani faqat statistik ahamiyatga ega bo'lgan natija qo'llab-quvvatlaydigan tarzda sozlanishi mumkin. Baholash nazariyasining bu shakli eng qattiq hisoblanadigipoteza testidan foydalanishni tanqid qilish.