Logistik regressiya: model va usullar

Mundarija:

Logistik regressiya: model va usullar
Logistik regressiya: model va usullar
Anonim

Logistik regressiya va diskriminant tahlil usullari respondentlarni maqsadli toifalar boʻyicha aniq farqlash zarur boʻlganda qoʻllaniladi. Bunday holda, guruhlarning o'zlari bitta variantli parametr darajalari bilan ifodalanadi. Keling, logistik regressiya modelini batafsil ko‘rib chiqamiz va u nima uchun kerakligini aniqlaymiz.

logistik regressiya
logistik regressiya

Umumiy ma'lumot

Logistik regressiya qo'llaniladigan muammoga misol sifatida respondentlarni xantal sotib oladigan va sotib olmaydigan guruhlarga ajratish mumkin. Differensiatsiya ijtimoiy-demografik belgilarga muvofiq amalga oshiriladi. Bularga, xususan, yoshi, jinsi, qarindoshlar soni, daromadlari va boshqalar kiradi. Operatsiyalarda farqlash mezonlari va o'zgaruvchanlik mavjud. Ikkinchisi, aslida respondentlar bo'linishi kerak bo'lgan maqsadli toifalarni kodlaydi.

Nyuanslar

Shuni aytish kerakki, logistik regressiya qo'llaniladigan holatlar diapazoni diskriminant tahliliga qaraganda ancha torroqdir. Shu munosabat bilan, ikkinchisidan farqlashning universal usuli sifatida foydalanish ko'rib chiqiladiko'proq afzal. Bundan tashqari, mutaxassislar diskriminant tahlili bilan tasniflash bo'yicha tadqiqotlarni boshlashni tavsiya qiladilar. Va faqat natijalar haqida noaniqlik bo'lsa, logistik regressiyadan foydalanishingiz mumkin. Bu ehtiyoj bir necha omillarga bog'liq. Logistik regressiya mustaqil va bog'liq o'zgaruvchilar turi haqida aniq tushuncha mavjud bo'lganda qo'llaniladi. Shunga ko'ra, 3 ta mumkin bo'lgan protseduralardan biri tanlanadi. Diskriminant tahlilida tadqiqotchi doimo bitta statik operatsiya bilan shug'ullanadi. U har qanday turdagi masshtabga ega bir qaram va bir nechta mustaqil toifali oʻzgaruvchilarni oʻz ichiga oladi.

Koʻrishlar

Logistik regressiyadan foydalanadigan statistik tadqiqotning vazifasi ma'lum bir respondentning ma'lum bir guruhga tayinlanishi ehtimolini aniqlashdir. Differensiatsiya muayyan parametrlar bo'yicha amalga oshiriladi. Amalda, bir yoki bir nechta mustaqil omillarning qiymatlariga ko'ra, respondentlarni ikki guruhga bo'lish mumkin. Bunday holda, ikkilik logistik regressiya sodir bo'ladi. Shuningdek, ko'rsatilgan parametrlar ikkitadan ortiq guruhlarga bo'linishda ishlatilishi mumkin. Bunday vaziyatda multinomial logistik regressiya sodir bo'ladi. Olingan guruhlar bitta oʻzgaruvchining darajalarida ifodalanadi.

logistik regressiya
logistik regressiya

Misol

Aytaylik, respondentlarning Moskva chekkasida er uchastkasini sotib olish taklifiga qiziqishi haqidagi savolga javoblari bor. Variantlar "yo'q"va ha. Potentsial xaridorlarning qaroriga qaysi omillar ustun ta'sir ko'rsatishini aniqlash kerak. Buning uchun respondentlarga hududning infratuzilmasi, poytaxtgacha bo'lgan masofa, saytning maydoni, turar-joy binosining mavjudligi / yo'qligi va boshqalar haqida savollar beriladi. Binar regressiyadan foydalanib, uni taqsimlash mumkin. Respondentlarni ikki guruhga bo'lish. Birinchisiga sotib olishdan manfaatdor bo'lganlar - potentsial xaridorlar, ikkinchisiga esa mos ravishda bunday taklifdan manfaatdor bo'lmaganlar kiradi. Bundan tashqari, har bir respondent uchun u yoki bu toifaga tayinlanish ehtimoli hisoblab chiqiladi.

Qiyosiy xususiyatlar

Yuqoridagi ikkita variantdan farqi guruhlar sonining har xilligi va bogʻliq va mustaqil oʻzgaruvchilar turidir. Ikkilik regressiyada, masalan, dixotomiya omilining bir yoki bir nechta mustaqil shartlarga bog'liqligi o'rganiladi. Bundan tashqari, ikkinchisi har qanday turdagi o'lchovga ega bo'lishi mumkin. Multinomial regressiya ushbu tasnif variantining o'zgarishi hisoblanadi. Unda 2 dan ortiq guruh tobe o'zgaruvchiga tegishli. Mustaqil omillar tartibli yoki nominal shkalaga ega boʻlishi kerak.

Spss-da logistik regressiya

11-12 statistik to'plamda tahlilning yangi versiyasi - tartibli kiritildi. Bu usul tobe omil bir xil nomli (tartibli) masshtabga tegishli bo'lganda qo'llaniladi. Bunday holda, mustaqil o'zgaruvchilar aniq bir turdagi tanlanadi. Ular tartibli yoki nominal bo'lishi kerak. Bir nechta toifalarga tasniflash eng ko'p hisoblanadiuniversal. Ushbu usul logistik regressiyadan foydalanadigan barcha tadqiqotlarda qo'llanilishi mumkin. Biroq, model sifatini yaxshilashning yagona yo‘li uchta texnikadan foydalanishdir.

muvofiqlik sifatini tekshirish va logistika regressiyasi
muvofiqlik sifatini tekshirish va logistika regressiyasi

Tartibiy tasnif

Shuni aytish kerakki, ilgari statistik paketda tartibli shkalaga ega bo'lgan bog'liq omillar uchun ixtisoslashtirilgan tahlilni o'tkazishning odatiy imkoniyati yo'q edi. 2 dan ortiq guruhga ega bo'lgan barcha o'zgaruvchilar uchun multinominal variant ishlatilgan. Nisbatan yaqinda kiritilgan tartibli tahlil bir qator xususiyatlarga ega. Ular o'lchovning o'ziga xos xususiyatlarini hisobga oladi. Shu bilan birga, o'quv qo'llanmalarida tartibli logistik regressiya ko'pincha alohida texnika sifatida ko'rib chiqilmaydi. Bu quyidagilar bilan bog'liq: tartibli tahlil multinomialga nisbatan sezilarli afzalliklarga ega emas. Tadqiqotchi ikkinchisini ham tartib, ham nominal qaram o'zgaruvchi ishtirokida qo'llashi mumkin. Shu bilan birga, tasniflash jarayonlarining o'zi deyarli bir-biridan farq qilmaydi. Bu tartibli tahlil qilish hech qanday qiyinchilik tugʻdirmasligini bildiradi.

Tahlil opsiyasi

Oddiy holatni ko'rib chiqamiz - ikkilik regressiya. Aytaylik, marketing tadqiqotlari jarayonida ma'lum bir poytaxt universiteti bitiruvchilariga bo'lgan talab baholanadi. Anketada respondentlarga savollar berildi, jumladan:

  1. Siz ishlayapsizmi? (ql).
  2. Bitiruv yilini kiriting (21-q).
  3. Oʻrtacha qanchabitiruv balli (oʻrtacha).
  4. Jins (22-q).

Logistik regressiya ql oʻzgaruvchisiga aver, q 21 va q 22 mustaqil omillarning taʼsirini baholaydi. Oddiy qilib aytganda, tahlildan maqsad yo‘nalish, bitirgan yili va GPA haqidagi ma’lumotlar asosida bitiruvchilarning ishga joylashishini aniqlashdan iborat bo‘ladi.

logistik sigmasimon regressiya ko'rsatkichi
logistik sigmasimon regressiya ko'rsatkichi

Logistik regressiya

Iklik regressiya yordamida parametrlarni oʻrnatish uchun Analyze►Regression►Binary Logistic menyusidan foydalaning. Logistik regressiya oynasida chapdagi mavjud o'zgaruvchilar ro'yxatidan qaram omilni tanlang. Bu ql. Ushbu o'zgaruvchi "Dependent" maydoniga joylashtirilishi kerak. Shundan so'ng, Covariates uchastkasiga mustaqil omillarni kiritish kerak - q 21, q 22, aver. Keyin ularni tahlilingizga qanday kiritishni tanlashingiz kerak. Agar mustaqil omillar soni 2 dan ortiq bo'lsa, u holda sukut bo'yicha o'rnatiladigan barcha o'zgaruvchilarni bir vaqtning o'zida kiritish usuli qo'llaniladi, lekin bosqichma-bosqich. Eng mashhur usul - Orqaga: LR. Tanlash tugmasi yordamida tadqiqotga barcha respondentlarni emas, balki faqat aniq maqsadli toifani kiritishingiz mumkin.

Kategorik oʻzgaruvchilarni aniqlash

Kategorik tugmasi mustaqil oʻzgaruvchilardan biri 2 dan ortiq toifali nominal boʻlsa ishlatilishi kerak. Bunday holatda, "Kategorik o'zgaruvchilarni aniqlash" oynasida, "Kategorik kovariatsiyalar" bo'limida aynan shunday parametr joylashtirilgan. Ushbu misolda bunday o'zgaruvchi yo'q. Shundan so'ng, ochiladigan ro'yxatda kontrast paydo bo'ladi"Og'ish" bandini tanlang va "O'zgartirish" tugmasini bosing. Natijada, har bir nominal omildan bir nechta qaram o'zgaruvchilar hosil bo'ladi. Ularning soni dastlabki holat toifalari soniga mos keladi.

Yangi oʻzgaruvchilarni saqlash

Tadqiqotning asosiy dialog oynasidagi Saqlash tugmasi yordamida yangi parametrlarni yaratish oʻrnatiladi. Ular regressiya jarayonida hisoblangan ko'rsatkichlarni o'z ichiga oladi. Xususan, siz quyidagilarni belgilaydigan oʻzgaruvchilar yaratishingiz mumkin:

  1. Muayyan tasnif toifasiga tegishli (Guruh a'zoligi).
  2. Har bir tadqiqot guruhiga respondentni tayinlash ehtimoli (Ehtimollar).

Tanlovlar tugmasidan foydalanganda tadqiqotchi muhim variantlardan foydalana olmaydi. Shunga ko'ra, uni e'tiborsiz qoldirish mumkin. "OK" tugmasini bosgandan so'ng, tahlil natijalari asosiy oynada ko'rsatiladi.

logistik regressiya koeffitsienti
logistik regressiya koeffitsienti

Sifatning muvofiqligi va logistik regressiya tekshiruvi

Model koeffitsientlarining omnibus testlari jadvalini ko'rib chiqing. U modelni yaqinlashtirish sifatini tahlil qilish natijalarini aks ettiradi. Bosqichma-bosqich variant o'rnatilganligi sababli, siz oxirgi bosqich natijalariga qarashingiz kerak (2-qadam). Yuqori darajadagi muhimlik darajasida keyingi bosqichga o'tishda Chi-kvadrat ko'rsatkichining ortishi aniqlansa, ijobiy natija ko'rib chiqiladi (Sig. < 0,05). Modelning sifati Model qatorida baholanadi. Agar salbiy qiymat olinsa, lekin u modelning umumiy yuqori moddiyligi bilan ahamiyatli hisoblanmasa, oxirgiamalda mos deb hisoblash mumkin.

Jadvallar

Model xulosasi tuzilgan model (R kvadrat indeksi) tomonidan tavsiflangan umumiy dispersiya indeksini baholash imkonini beradi. Nagelker qiymatidan foydalanish tavsiya etiladi. Nagelkerke R Square parametri 0,50 dan yuqori bo'lsa, ijobiy ko'rsatkich deb hisoblanishi mumkin. Shundan so'ng, tasniflash natijalari baholanadi, unda o'rganilayotgan u yoki bu toifaga mansublikning haqiqiy ko'rsatkichlari regressiya modeli asosida bashorat qilinganlar bilan taqqoslanadi. Buning uchun tasniflash jadvalidan foydalaniladi. Shuningdek, u ko'rib chiqilayotgan har bir guruh uchun farqlashning to'g'riligi haqida xulosa chiqarish imkonini beradi.

Logistik regressiya modeli
Logistik regressiya modeli

Quyidagi jadval tahlilga kiritilgan mustaqil omillarning statistik ahamiyatini, shuningdek, har bir standartlashtirilmagan logistik regressiya koeffitsientini aniqlash imkonini beradi. Ushbu ko'rsatkichlarga asoslanib, tanlovdagi har bir respondentning ma'lum bir guruhga tegishliligini taxmin qilish mumkin. Saqlash tugmasi yordamida siz yangi o'zgaruvchilarni kiritishingiz mumkin. Ular ma'lum bir tasnif toifasiga mansubligi (Predictedcategory) va ushbu guruhlarga qo'shilish ehtimoli (Predicted probabilities a'zoligi) haqida ma'lumotni o'z ichiga oladi. "OK" tugmasini bosgandan so'ng, hisoblash natijalari Multinomial Logistic Regressionning asosiy oynasida paydo bo'ladi.

Tadqiqotchi uchun muhim boʻlgan koʻrsatkichlarni oʻz ichiga olgan birinchi jadval Modelni moslashtirish maʼlumotlaridir. Statistik ahamiyatga ega bo'lgan yuqori daraja yuqori sifatni ko'rsatadi vaamaliy masalalarni yechishda modeldan foydalanishning maqsadga muvofiqligi. Yana bir muhim jadval Pseudo R-square. Tahlil uchun tanlangan mustaqil o'zgaruvchilar tomonidan aniqlanadigan qaram omildagi umumiy dispersiyaning ulushini baholashga imkon beradi. Ehtimollik nisbati testlari jadvaliga ko'ra, biz ikkinchisining statistik ahamiyati haqida xulosa chiqarishimiz mumkin. Parametr baholari standartlashtirilmagan koeffitsientlarni aks ettiradi. Ular tenglamani qurishda qo'llaniladi. Bundan tashqari, o'zgaruvchilarning har bir kombinatsiyasi uchun ularning bog'liq omilga ta'sirining statistik ahamiyati aniqlandi. Shu bilan birga, marketing tadqiqotlarida respondentlarni toifalar bo'yicha alohida emas, balki maqsadli guruhning bir qismi sifatida ajratish kerak bo'ladi. Buning uchun Kuzatiladigan va bashorat qilingan chastotalar jadvalidan foydalaniladi.

Amaliy ilova

Ko'rib chiqilgan tahlil usuli treyderlar ishida keng qo'llaniladi. 1991 yilda logistik sigmasimon regressiya ko'rsatkichi ishlab chiqildi. Bu narxlarni "haddan tashqari qizib ketishdan" oldin bashorat qilish uchun ishlatish uchun qulay va samarali vositadir. Ko'rsatkich diagrammada ikkita parallel chiziqdan tashkil topgan kanal sifatida ko'rsatilgan. Ular trenddan bir xil masofada joylashgan. Yo'lakning kengligi faqat vaqt oralig'iga bog'liq bo'ladi. Ko'rsatkich deyarli barcha aktivlar bilan ishlashda ishlatiladi - valyuta juftlaridan tortib qimmatbaho metallargacha.

spss da logistik regressiya
spss da logistik regressiya

Amalda asbobdan foydalanishning 2 ta asosiy strategiyasi ishlab chiqilgan: parchalanish uchun vaburilish uchun. Ikkinchi holda, treyder kanal ichidagi narxlarning o'zgarishi dinamikasiga e'tibor qaratadi. Qiymat qo'llab-quvvatlash yoki qarshilik chizig'iga yaqinlashganda, harakatning teskari yo'nalishda boshlanishi ehtimoliga garov qo'yiladi. Agar narx yuqori chegaraga yaqinlashsa, siz aktivdan qutulishingiz mumkin. Agar u pastki chegarada bo'lsa, unda siz sotib olish haqida o'ylashingiz kerak. Chiqib ketish strategiyasi buyurtmalardan foydalanishni o'z ichiga oladi. Ular nisbatan kichik masofada chegaralardan tashqarida o'rnatiladi. Narx ba'zi hollarda ularni qisqa vaqt davomida buzganligini hisobga olib, siz uni xavfsiz o'ynashingiz va stop losslarni belgilashingiz kerak. Shu bilan birga, albatta, tanlangan strategiyadan qat'i nazar, treyder bozorda yuzaga kelgan vaziyatni imkon qadar xotirjam qabul qilishi va baholashi kerak.

Xulosa

Shunday qilib, logistik regressiyadan foydalanish respondentlarni berilgan parametrlar boʻyicha tez va oson toifalarga ajratish imkonini beradi. Tahlil qilishda siz har qanday maxsus usuldan foydalanishingiz mumkin. Xususan, multinomial regressiya universaldir. Biroq, mutaxassislar yuqorida tavsiflangan barcha usullarni birgalikda qo'llashni tavsiya qiladilar. Buning sababi, bu holda modelning sifati sezilarli darajada yuqori bo'ladi. Bu, o'z navbatida, uni qo'llash doirasini kengaytiradi.

Tavsiya: