Statistik ma'lumotlar: yig'ish, qayta ishlash, tahlil qilish

Mundarija:

Statistik ma'lumotlar: yig'ish, qayta ishlash, tahlil qilish
Statistik ma'lumotlar: yig'ish, qayta ishlash, tahlil qilish
Anonim

Statistika tarixi davomida oʻlchov darajalarining taksonomiyasini yaratishga turli urinishlar qilingan. Psixofizik Stenli Smit Stivens nominal, tartibli, intervalli va proportsional shkalalarni aniqladi.

Nominal oʻlchovlar qiymatlar orasida muhim darajalarga ega emas va har qanday birma-bir konvertatsiya qilishga imkon beradi.

Oddiy oʻlchamlar ketma-ket qiymatlar oʻrtasida aniq farqlarga ega, lekin bu qiymatlarning maʼlum tartibiga ega va har qanday tartibni saqlaydigan oʻzgartirishga ruxsat beradi.

Interval oʻlchovlari nuqtalar orasidagi maʼnoli masofalarga ega, lekin nol qiymati ixtiyoriydir (Telsiy yoki Farengeyt boʻyicha uzunlik va harorat oʻlchovlarida boʻlgani kabi) va har qanday chiziqli oʻzgarishlarga imkon beradi.

Nisob oʻlchovlari maʼnoli nol qiymatiga va turli oʻlchamlar orasidagi masofalarga ega va har qanday masshtabni oʻzgartirishga imkon beradi.

Image
Image

Oʻzgaruvchilar va maʼlumotlar tasnifi

Chunki o'zgaruvchilarfaqat nominal yoki tartibli o'lchovlarga mos keladiganlarni raqamli ravishda o'lchash mumkin emas va ba'zan kategorik o'zgaruvchilar sifatida guruhlanadi. Nisbat va intervalli o'lchovlar miqdoriy o'zgaruvchilar sifatida guruhlangan bo'lib, ular raqamli tabiatiga ko'ra diskret yoki doimiy bo'lishi mumkin. Bunday farqlar ko'pincha informatika fanidagi ma'lumotlar turi bilan erkin bog'liqdir, chunki dixotom toifali o'zgaruvchilar mantiqiy qiymatlar, integral ma'lumotlar turidagi ixtiyoriy butun sonli ko'ptomli toifali o'zgaruvchilar va suzuvchi nuqtali hisoblashni o'z ichiga olgan haqiqiy komponentlar bilan uzluksiz o'zgaruvchilar bilan ifodalanishi mumkin. Ammo statistik maʼlumotlar turlarini koʻrsatish qaysi tasnif qoʻllanilishiga bogʻliq.

Ishchilar bo'yicha statistik ma'lumotlar
Ishchilar bo'yicha statistik ma'lumotlar

Boshqa tasniflar

Statistik ma'lumotlarning (ma'lumotlarning) boshqa tasniflari ham yaratilgan. Masalan, Mosteller va Tukey baholar, darajalar, hisoblangan ulushlar, hisoblar, miqdorlar va balanslarni ajratib ko'rsatishdi. Nelder bir vaqtning o'zida uzluksiz hisoblashlarni, uzluksiz nisbatlarni, hisoblashlarning korrelyatsiyasini va ma'lumotlarni uzatishning kategorik usullarini tasvirlab berdi. Ushbu tasniflash usullarining barchasi statistik ma'lumotlarni to'plashda qo'llaniladi.

Muammolar

Turli oʻlchash (toʻplash) protseduralari orqali olingan maʼlumotlarga har xil turdagi statistik usullarni qoʻllash maqsadga muvofiqmi degan savol oʻzgaruvchilarni konvertatsiya qilish va savollarni aniq talqin qilish bilan bogʻliq masalalar bilan murakkablashadi.tadqiqot. Ma'lumotlar va ular tasvirlangan narsalar o'rtasidagi munosabatlar shunchaki statistik bayonotlarning ba'zi turlari ma'lum transformatsiyalar ostida o'zgarmas bo'lmagan haqiqat qiymatlariga ega bo'lishi mumkinligini aks ettiradi. Oʻzgartirishni koʻrib chiqishga arziydimi, siz javob bermoqchi boʻlgan savolga bogʻliq.

Statistik ma'lumotlarga misol
Statistik ma'lumotlarga misol

Ma'lumot turi nima

Ma'lumotlar turi o'zgaruvchining semantik tarkibining asosiy komponenti bo'lib, o'zgaruvchini tavsiflash uchun qanday ehtimollik taqsimotlaridan mantiqiy foydalanish mumkinligini, unda ruxsat etilgan operatsiyalarni, uni bashorat qilish uchun ishlatiladigan regressiya tahlili turini boshqaradi., va hokazo. Ma'lumotlar turi tushunchasi o'lchov darajasi tushunchasiga o'xshash, ammo aniqroq - masalan, ma'lumotlarni hisoblash manfiy bo'lmagan haqiqiy qiymatlarga qaraganda boshqacha taqsimlashni (Poisson yoki binomial) talab qiladi, lekin ikkalasi ham bir xil darajaga tushadi. o'lchov darajasi (koeffitsient shkalasi).

Sudyalar bo'yicha statistik ma'lumotlar
Sudyalar bo'yicha statistik ma'lumotlar

Tarozilar

Statistik ma'lumotlarni qayta ishlash uchun o'lchov darajalari taksonomiyasini yaratishga turli xil urinishlar qilingan. Psixofizik Stenli Smit Stivens nominal, tartibli, intervalli va proportsional shkalalarni aniqladi. Nominal o'lchovlar qiymatlar orasida muhim darajalarga ega emas va har qanday o'zgartirishga imkon beradi. Oddiy o'lchovlar ketma-ket qiymatlar o'rtasida aniq bo'lmagan farqlarga ega, ammo bu qiymatlarning muhim tartibida farqlanadi vatartibni saqlaydigan har qanday transformatsiya. Intervalli o'lchovlar o'lchovlar orasidagi ma'noli masofalarga ega, ammo nol qiymati o'zboshimchalik bilan (Selsiy yoki Farengeyt bo'yicha uzunlik va harorat o'lchovlarida bo'lgani kabi) va har qanday chiziqli transformatsiyaga imkon beradi. Nisbatan oʻlchovlari maʼnoli nol qiymatiga va turli belgilangan oʻlchamlar orasidagi masofalarga ega va har qanday masshtabni oʻzgartirishga imkon beradi.

Diagramma modeli
Diagramma modeli

Bitta raqam yordamida tasvirlab boʻlmaydigan maʼlumotlar koʻpincha haqiqiy tasodifiy oʻzgaruvchilarning tasodifiy vektorlariga kiritiladi, garchi ularni oʻzingiz qayta ishlash tendentsiyasi kuchaymoqda. Bunday misollar quyida muhokama qilinadi.

Tasodifiy vektorlar

Alohida elementlar oʻzaro bogʻlanishi yoki oʻzaro bogʻliq boʻlmasligi mumkin. Korrelyatsiya qilingan tasodifiy vektorlarni tavsiflash uchun ishlatiladigan taqsimotlarga misollar ko'p o'zgaruvchan normal taqsimot va ko'p o'zgaruvchan t-tarqatishdir. Umuman olganda, har qanday elementlar o'rtasida o'zboshimchalik bilan bog'liqlik bo'lishi mumkin, biroq bu ko'pincha ma'lum bir o'lchamdan yuqori bo'lib boshqarib bo'lmaydigan holga keladi va korrelyatsiya qiluvchi komponentlar uchun qo'shimcha cheklovlarni talab qiladi.

statistik atributlar
statistik atributlar

Tasodifiy matritsalar

Tasodifiy matritsalar chiziqli tartibga solinishi va tasodifiy vektorlar sifatida koʻrib chiqilishi mumkin, ammo bu turli elementlar orasidagi korrelyatsiyani ifodalashning samarali usuli boʻlmasligi mumkin. Ba'zi ehtimollik taqsimotlari oddiy matritsa kabi tasodifiy matritsalar uchun maxsus ishlab chiqilgantarqatish va Wishart tarqatish.

Tasodifiy ketma-ketliklar

Ba'zan ular tasodifiy vektorlar bilan bir xil deb hisoblanadi, lekin boshqa hollarda bu atama har bir tasodifiy o'zgaruvchi faqat yaqin o'zgaruvchilar bilan korrelyatsiya qiladigan holatlarga nisbatan qo'llaniladi (Markov modelidagi kabi). Bu Bayes tarmog'ining alohida holati bo'lib, gen zanjirlari yoki uzun matnli hujjatlar kabi juda uzun ketma-ketliklar uchun ishlatiladi. Bir qator modellar yashirin Markov ketma-ketliklari kabi ketma-ketliklar uchun maxsus ishlab chiqilgan.

Oddiy diagramma
Oddiy diagramma

Tasodifiy jarayonlar

Ular tasodifiy ketma-ketliklarga o'xshaydi, lekin faqat ketma-ketlikning uzunligi noaniq yoki cheksiz bo'lganda va ketma-ketlikdagi elementlar birma-bir qayta ishlanadi. Bu ko'pincha vaqt seriyalari sifatida tavsiflanishi mumkin bo'lgan ma'lumotlar uchun ishlatiladi. Bu, masalan, ertasi kungi aksiya narxi haqida gap ketganda to'g'ri.

Xulosa

Statistik ma'lumotlarni tahlil qilish butunlay uni to'plash sifatiga bog'liq. Ikkinchisi, o'z navbatida, uni tasniflash imkoniyatlari bilan kuchli bog'liqdir. Albatta, statistik ma'lumotlarni tasniflashning ko'plab turlari mavjud, ularni o'quvchi ushbu maqolani o'qiyotganda ko'rishi mumkin edi. Shunga qaramay, samarali vositalarning mavjudligi va matematikani yaxshi bilish, shuningdek, sotsiologiya sohasidagi bilimlar o'z vazifalarini bajaradi, bu sizga xatolarni jiddiy tuzatishlarsiz har qanday so'rov yoki o'rganishni o'tkazishga imkon beradi. Shaklda statistik ma'lumotlarning manbalariodamlar, tashkilotlar va sotsiologiyaning boshqa sub'ektlari, xayriyatki, juda ko'p ifodalangan. Va hech qanday qiyinchilik haqiqiy tadqiqotchining yo'lida turolmaydi.

Tavsiya: