Ko'p qirrali masshtablash (MDS) - bu ma'lumotlar to'plamidagi alohida holatlarning o'xshashlik darajasini vizualizatsiya qilish vositasi. Bu ma'lumotni vizualizatsiya qilishda, xususan, masofaviy matritsada mavjud bo'lgan ma'lumotlarni ko'rsatishda ishlatiladigan tegishli tayinlash usullari to'plamini anglatadi. Bu chiziqli bo'lmagan o'lchamlarni kamaytirish shaklidir. MDS algoritmi har bir ob'ektni N o'lchovli fazoga shunday joylashtirishga qaratilganki, ob'ektlar orasidagi masofalar iloji boricha saqlanib qoladi. Keyin har bir ob'ektga N o'lchamdagi koordinatalar tayinlanadi.
MDS grafigining oʻlchamlari soni 2 dan oshishi mumkin va apriori koʻrsatilgan. N=2 ni tanlash 2D scatterplot uchun ob'ektni joylashtirishni optimallashtiradi. Siz maqoladagi rasmlarda ko'p o'lchovli masshtablash misollarini ko'rishingiz mumkin. Rus tilidagi belgilarga misollar ayniqsa illyustrativdir.
Essensiya
Koʻp oʻlchovli masshtablash usuli (MMS,MDS) - yo'qotish funktsiyalari to'plami va og'irliklar va boshqalar bilan ma'lum masofalarning kirish matritsalarini optimallashtirish tartibini umumlashtiruvchi klassik vositalarning kengaytirilgan to'plami. Shu nuqtai nazardan, foydali yo'qotish funktsiyasi stress deb ataladi, bu ko'pincha stressni kattalashtirish deb ataladigan protsedura orqali minimallashtiriladi.
Qoʻllanma
Koʻp oʻlchovli masshtablashning bir nechta variantlari mavjud. MDS dasturlari yechim olish uchun yukni avtomatik ravishda kamaytiradi. Nometrik MDS algoritmining yadrosi ikki tomonlama optimallashtirish jarayonidir. Birinchidan, optimal monotonik yaqinlik o'zgarishini topish kerak. Ikkinchidan, konfiguratsiya nuqtalari ularning masofalari masshtabdagi yaqinlik qiymatlariga imkon qadar mos kelishi uchun optimal tarzda joylashtirilishi kerak.
Kengaytirish
Statistikada metrik koʻp oʻlchovli masshtabning kengaytmasi, bunda maqsadli fazo ixtiyoriy silliq evklid boʻlmagan fazodir. Bu erda farqlar sirtdagi masofalar va maqsadli bo'shliq boshqa sirtdir. Tematik dasturlar bir sirtni boshqasiga minimal buzilish bilan biriktirmani topish imkonini beradi.
Qadamlar
Koʻp oʻlchovli masshtab yordamida tadqiqot oʻtkazishda bir necha bosqichlar mavjud:
- Muammoni shakllantirish. Qaysi o'zgaruvchilarni solishtirmoqchisiz? Qancha o'zgaruvchini solishtirmoqchisiz? Tadqiqot qanday maqsadda qo'llaniladi?
- Kiritilgan ma'lumotlar olinmoqda. Respondentlarga bir qator savollar beriladi. Har bir mahsulot juftligi uchun ulardan o'xshashlikni baholash so'raladi (odatda 7 ballli Likert shkalasi bo'yicha juda o'xshashdan juda o'xshashga qadar). Birinchi savol Coca-Cola/Pepsi uchun bo'lishi mumkin, masalan, keyingisi pivo, keyingisi Doktor Pepper va hokazo. Savollar soni brendlar soniga bog'liq.
Muqobil yondashuvlar
Boshqa ikkita yondashuv mavjud. "Perceptual Data: Derived Approach" deb nomlangan texnika mavjud bo'lib, unda mahsulotlar atributlarga bo'linadi va baholash semantik differentsial shkalada amalga oshiriladi. Yana bir usul “afzal maʼlumotlarga yondashuv” boʻlib, unda respondentlardan oʻxshashliklar emas, balki afzalliklar haqida soʻraladi.
U quyidagi bosqichlardan iborat:
- MDS statistik dasturi ishga tushirilmoqda. Jarayonni bajarish uchun dasturiy ta'minot ko'plab statistik dasturlar paketlarida mavjud. Ko'pincha metrik MDS (interval yoki nisbat darajasi ma'lumotlari bilan shug'ullanadi) va metrik bo'lmagan MDS (tartibiy ma'lumotlar bilan shug'ullanadi) o'rtasida tanlov mavjud.
- O'lchovlar sonini aniqlash. Tadqiqotchi kompyuterda yaratmoqchi bo'lgan o'lchovlar sonini aniqlashi kerak. Qanchalik ko'p o'lchovlar bo'lsa, statistik moslik shunchalik yaxshi bo'ladi, lekin natijalarni sharhlash shunchalik qiyin bo'ladi.
- Natijalarni ko'rsatish va o'lchovlarni aniqlash - statistik dastur (yoki tegishli modul) natijalarni ko'rsatadi. Xarita har bir mahsulotni ko'rsatadi (odatda 2D).bo'sh joy). Mahsulotlarning bir-biriga yaqinligi ularning o'xshashligini yoki qaysi yondashuv ishlatilganiga qarab afzalligini ko'rsatadi. Biroq, o'lchovlar aslida tizim xatti-harakatlarining o'lchovlariga qanday mos kelishi har doim ham aniq emas. Muvofiqlikka sub'ektiv baho berish mumkin.
- Natijalarning ishonchliligi va haqiqiyligini tekshirish - MDS protsedurasi bilan hisoblanishi mumkin bo'lgan masshtabdagi ma'lumotlar tafovuti ulushini aniqlash uchun R-kvadratini hisoblang. Kvadrat R 0,6 minimal qabul qilinadigan daraja hisoblanadi. R kvadrati 0,8 metrik masshtablash uchun, 0,9 esa metrik bo‘lmagan masshtablash uchun yaxshi hisoblanadi.
Turli sinovlar
Boshqa mumkin boʻlgan testlar: Kruskal tipidagi stress testlari, maʼlumotlarni taqsimlash testlari, maʼlumotlar barqarorligi testlari va ishonchlilik sinovlari. Sinovdagi natijalar haqida batafsil yozing. Xaritalash bilan birga masofaning kamida oʻlchovi (masalan, Sorenson indeksi, Jakkard indeksi) va ishonchlilik (masalan, stress qiymati) koʻrsatilishi kerak.
Agar siz boshlang'ich konfiguratsiyani bergan bo'lsangiz yoki tasodifiy tanlovga ega bo'lsangiz, ko'pincha ishlatiladigan dastur tomonidan aniqlanadigan algoritmni (masalan, Kruskal, Mather) berish juda ma'qul (ba'zan algoritm hisobotini almashtiradi), o'lchovlar, Monte-Karlo natijalari, iteratsiyalar soni, barqarorlik balli va har bir o'qning proportsional dispersiyasi (r-kvadrat).
Vizual axborot va ma'lumotlarni tahlil qilish usuliko'p o'lchovli masshtab
Axborot vizualizatsiyasi - bu inson idrokini kuchaytirish uchun mavhum ma'lumotlarning interaktiv (vizual) tasvirlarini o'rganish. Abstrakt ma'lumotlarga sonli va noaniq ma'lumotlar kiradi, masalan, matn va geografik ma'lumotlar. Biroq, axborot vizualizatsiyasi ilmiy vizualizatsiyadan farq qiladi: “fazoviy tasvir tanlanganda axborot (axborot vizualizatsiyasi) va fazoviy tasvir berilganda scivis (ilmiy vizualizatsiya)”
Axborotni vizualizatsiya qilish sohasi inson va kompyuter oʻrtasidagi oʻzaro taʼsir, kompyuter fanlari ilovalari, grafika, vizual dizayn, psixologiya va biznes usullari boʻyicha tadqiqotlar natijasida paydo boʻlgan. U ilmiy tadqiqotlar, raqamli kutubxonalar, maʼlumotlarni qidirish, moliyaviy maʼlumotlar, bozor tadqiqotlari, ishlab chiqarishni nazorat qilish va hokazolarda muhim komponent sifatida tobora koʻproq foydalanilmoqda.
Usul va tamoyillar
Axborot vizualizatsiyasi vizualizatsiya va oʻzaro taʼsir usullari foydalanuvchilarga bir vaqtning oʻzida katta hajmdagi maʼlumotlarni koʻrish, oʻrganish va tushunish imkonini beruvchi inson idrokining boyligidan foydalanishini koʻrsatadi. Axborot vizualizatsiyasi mavhum ma'lumotlar va ma'lumotlarni intuitiv tarzda etkazish uchun yondashuvlarni yaratishga qaratilgan.
Ma'lumotlarni tahlil qilish sanoatdagi barcha amaliy tadqiqotlar va muammolarni hal qilishning ajralmas qismidir. Ko'pchilikMa'lumotlarni tahlil qilishning asosiy yondashuvlari vizualizatsiya (gistogrammalar, tarqalish chizmalari, sirt chizmalar, daraxtlar xaritalari, parallel koordinatalar chizmalari va boshqalar), statistika (gipotezani tekshirish, regressiya, PCA va boshqalar), ma'lumotlarni tahlil qilish (moslashtirish va boshqalar)..d.) va mashinani oʻrganish usullari (klasterlash, tasniflash, qarorlar daraxtlari va boshqalar).
Ushbu yondashuvlar orasida axborotni vizualizatsiya qilish yoki vizual ma'lumotlarni tahlil qilish eng ko'p tahliliy xodimlarning kognitiv qobiliyatlariga bog'liq bo'lib, faqat inson tasavvuri va ijodi bilan chegaralangan tuzilmagan, harakatga keltiriladigan tushunchalarni ochishga imkon beradi. Tahlilchi ma'lumotlar vizualizatsiyasini sharhlay olish uchun har qanday murakkab texnikani o'rganishi shart emas. Axborotni vizualizatsiya qilish, shuningdek, gipoteza yaratish sxemasi boʻlib, u odatda statistik gipoteza sinovi kabi koʻproq analitik yoki rasmiy tahlil bilan birga olib boriladi.
Oʻqish
Zamonaviy vizualizatsiyani oʻrganish kompyuter grafikasidan boshlandi, u boshdanoq ilmiy muammolarni oʻrganish uchun qoʻllanilgan. Biroq, dastlabki yillarda grafik quvvatning etishmasligi koʻpincha uning foydaliligini cheklab qoʻygan. Vizuallashtirishga ustuvor ahamiyat berila boshlandi. 1987 yilda ilmiy hisoblashda kompyuter grafikasi va vizualizatsiya uchun maxsus dasturiy ta'minot chiqarilishi bilan ishlab chiqildi. O'shandan beri IEEE Kompyuter Jamiyati va ACM SIGGRAPH tomonidan birgalikda tashkil etilgan bir nechta konferentsiya va seminarlar bo'lib o'tdi.
Ular ma'lumotlarni vizualizatsiya qilish, axborotni vizuallashtirish va ilmiy vizualizatsiyaning umumiy mavzularini qamrab oldi,shuningdek, ovoz balandligini koʻrsatish kabi aniqroq sohalar.
Xulosa
Umumlashtirilgan koʻp oʻlchovli masshtablash (GMDS) metrik koʻp oʻlchovli masshtablashning kengaytmasi boʻlib, maqsad fazo Evklid boʻlmagan. Farqlar sirtdagi masofalar boʻlsa va maqsadli boʻshliq boshqa sirt boʻlsa, GMDS minimal buzilish bilan bir sirtning boshqasiga joylashishini topish imkonini beradi.
GMDS yangi tadqiqot yoʻnalishidir. Hozirda asosiy ilovalar deformatsiyalanadigan ob'ektni aniqlash (masalan, 3D yuzni aniqlash uchun) va teksturani xaritalashdir.
Koʻp oʻlchovli masshtablashdan maqsad koʻp oʻlchovli maʼlumotlarni koʻrsatishdir. Ko'p o'lchovli ma'lumotlar, ya'ni tasvirlash uchun ikki yoki uchdan ortiq o'lchov talab qiladigan ma'lumotlarni izohlash qiyin bo'lishi mumkin. Soddalashtirishga yondashuvlardan biri qiziq ma'lumotlar yuqori o'lchamli fazoda o'rnatilgan chiziqli bo'lmagan manifoldda yotadi deb taxmin qilishdir. Agar kollektor yetarlicha past oʻlchamga ega boʻlsa, maʼlumotlarni past oʻlchamli boʻshliqda koʻrish mumkin.
Chiziq bo'lmagan o'lchamlarni kamaytirish usullarining ko'pchiligi chiziqli usullar bilan bog'liq. Chiziqli bo'lmagan usullarni ikki guruhga bo'lish mumkin: xaritalashni ta'minlaydiganlar (yuqori o'lchamli bo'shliqdan past o'lchamli joylashtirishgacha yoki aksincha) va oddiygina vizualizatsiyani ta'minlaydiganlar. Mashinani o'rganish kontekstida xaritalash usullarini ko'rib chiqish mumkinxususiyatlarni ajratib olishning dastlabki bosqichi, undan so'ng naqshni aniqlash algoritmlari qo'llaniladi. Odatda vizualizatsiyani taqdim etadiganlar yaqinlik ma'lumotlariga, ya'ni masofa o'lchovlariga asoslanadi. Ko'p o'lchovli masshtablash psixologiya va boshqa gumanitar fanlarda ham keng tarqalgan.
Agar atributlar soni koʻp boʻlsa, unda noyob mumkin boʻlgan satrlar maydoni ham eksponensial darajada katta boʻladi. Shunday qilib, o'lcham qanchalik katta bo'lsa, makonni tasvirlash shunchalik qiyin bo'ladi. Bu juda ko'p muammolarni keltirib chiqaradi. Yuqori o'lchamli ma'lumotlarda ishlaydigan algoritmlar juda yuqori vaqt murakkabligiga ega. Ma'lumotlarni kamroq o'lchamlarga qisqartirish ko'pincha tahlil algoritmlarini samaraliroq qiladi va mashinani o'rganish algoritmlariga aniqroq bashorat qilishga yordam beradi. Shuning uchun ko'p o'lchovli ma'lumotlarni masshtablash juda mashhur.