Daha çox

CartoDB beynəlxalq coğrafi kodlaşdırmanı necə edir?


Xaricdəki layihələr üzərində işləyirəm, buna görə beynəlxalq coğrafi kodlaşdırmanın necə aparıldığını görmək istədim - ünvanları, şəhər adlarını, məhəllə adlarını və ya nə istifadə edə bilər və ya istifadə edir? Və bu, hansı sahələri əhatə edir?


Geokoder üçün iki seçimimiz var. Ünvanları yüksək dəqiqlikli coğrafi kodlaşdırıcıdan istifadə edə bilərsiniz ("Ünvanlarla" seçimi) və ya ölkələr, ölkələr, əyalətlər, şəhər adları və ya digər inzibati bölgələr kimi "ümumi" məlumatları xəritəyə gətirmək üçün digərlərini istifadə edə bilərsiniz. Kanada, ABŞ, Fransa, Avstraliya, İspaniyada da poçt kodları sahələrini əhatə edirik.

Hər gün yeni şəhər adları, yeni inzibati bölgələr əlavə edərək daxili geokoderi yaxşılaşdırmaq üçün çalışırıq. Geokoderdən əlavə, sizin üçün maraqlı ola biləcək faydalı məlumatlar topladığımız (ABŞ-da Konqresin Bölgələri kimi) ümumi məlumat bölməmiz var. İdarə panelinizin yuxarı sağ küncündə yerləşən Ümumi Məlumat bağlantısını tıklayaraq bu bölməyə baxa bilərsiniz.

Ümid edirəm kömək edər. Bəzi ölkələrlə bağlı spesifik əhatə dairəsi məlumatlarına ehtiyacınız varsa, bizə bildirin və bu ölkə ilə əlaqəli və ya coğrafi kodlayıcı statusu haqqında daha ətraflı məlumat verəcəyik.


Bölmə 46: Ünvan uyğunluğu

Ünvan uyğunluğu istifadəçiyə poçt ünvanlarını və / və ya poçt kodlarını coğrafi koordinatlara çevirməyə, bu nöqtələri ehtiva edən yeni bir məlumat qatını yaratmağa və məlumatları xəritədə göstərməyə imkan verir. Ünvan uyğunluğu prosesini başa çatdırmaq üçün üç komponent lazımdır: coğrafi əsas sənəd (GBF), ünvan məlumatlarını ehtiva edən bir cədvəl və konversiyanı həyata keçirən bir kompüter proqram paketi. Ünvan coğrafi kodlaşdırma funksionallığı əksər coğrafi informasiya sistemi (CİS) proqram paketlərində mövcuddur. Yaranan yeni nöqtə məlumat qatından sonra məkan nümunələrini təhlil etmək üçün istifadə edilə bilər.

Aşağıdakı nümunələr ünvan coğrafi kodlaşdırmanın tətbiq oluna biləcəyi tipik problemlərdir. Çox vaxt sualları cavablandırmaq üçün sadəcə xəritədəki məlumatları vizuallaşdırmaq kifayətdir. Bununla birlikdə, coğrafi kodlaşdırma prosesi tez-tez məlumatların əlavə məkan təhlili üçün hazırlanmasında istifadə edilən ilkin bir addımdır.

İştirak edən şirkətlər, fərdlər, həkimlər və yerli xəstəxana və diaqnostika müəssisələri barədə məlumatlar daxil olmaqla bir neçə məlumat bazasını saxlayırsınız. Bu məlumat bazalarını çeşidləyərək öyrənərək xəstələrin harada yaşadığını və ya həkimlərin və müəssisələrin yerləşdiyini təsəvvür etmək çətindir. Xoşbəxtlikdən, bütün verilənlər bazalarında ünvan məlumatlarını ehtiva edən bir sahə var.


Aşağıdakı siyahıda tələbələrin hər bir təlim səviyyəsi üçün mənimsəməsi lazım olan gözlənilən bacarıqları, yəni Şüur / Yetkinlik / Ustalıq təsvir olunur.

Xəbərdarlıq:

Təlimin məqsədi mənbələri müəyyənləşdirmək və coğrafi kodlaşdırma prosesini başa çatdırmaq üçün lazım olan üç komponent barədə iş biliklərini inkişaf etdirməkdir: coğrafi baza faylı, ünvan faylı və proqram təminatı. (Təklif olunan vaxt: bir 50 dəqiqəlik vahid)

Təlimin məqsədləri müvafiq baza sənədlərini müəyyənləşdirmək və qiymətləndirmək, standartlaşdırılmış ünvan sənədlərinin əhəmiyyətini anlamaq, lazımi faylları bir proqram paketinə gətirmək, coğrafi kodlaşdırma prosesini həyata keçirmək və nəticələri görüntüləməkdir. (Təklif olunan vaxt: bir 50 dəqiqəlik vahid və bir 50 dəqiqəlik laboratoriya)

Təlimin məqsədi həm əsas sənədlərin, həm də ünvan sənədlərinin düzgünlüyünü effektiv qiymətləndirmək, ünvan sənədlərini standartlaşdırmaq, uyğunsuzluqları qiymətləndirmək, yenidən görüşmə prosesini başa düşmək və ünvan sənədində verilən atribut məlumatlarını istifadə edərək əsas yenidən təsnifat analizini aparmaqdır. (Təklif olunan vaxt: bir 50 dəqiqəlik vahid)


Hazırlıq bölmələri:

Bölmə 19 Cədvəlli verilənlər bazasının planlaşdırılması

Təlimatçı üçün çox tövsiyə olunan fon

Bölmə 016 GIScience-də NCGIA Əsas Kurikulum: Ayrı-ayrı Yerləşdirmə

  • Coğrafi baza (istinad) sənədlərinin mənbələrini müəyyənləşdirin.
  • Ünvan sənədlərinin mənbələrini müəyyənləşdirin.
  • Ünvan coğrafi kodlama tətbiqetmələrini müəyyənləşdirin.
  • Masaüstü Xəritəçəkmə proqramını qiymətləndirin.
  • Ünvan coğrafi kodlaşdırma komponentlərini anlayın.
  • Dövlət mənbələri
    • CD-də, kitabxanalardan, onlayn (Census Tiger Files) mövcuddur
    • Müvafiq proqram formatına çevrilməlidir
    • İlçe tərəfindən düzəldilmiş və aşağıdakıları ehtiva edən sətir faylları:
        Yollar, dəmir yolları, çaylar
        Siyahıya alma statistik sərhədləri
        Siyasi sərhədlər
        Küçələr üçün şəhər ünvanları və poçt kodları
      • Yerli idarəetmə: İlçe xəritələşdirmə təşkilatları
        • Normalda yalnız mahalın dəstəklədiyi formatda mövcuddur
        • Müvafiq proqram formatına çevrilməsini tələb edir
        • Müxtəlif satıcılardan əldə etmək olar
        • Ətraflı TIGER sənədləri
        • Daha dəqiq və müasir ola bilər (yer və atribut)
        • Xüsusi proqram formatına çevrilmişdir
        • Ünvan məlumatı olan bir sahə olan hər hansı bir təşkilati məlumat bazası
        • Ümumiyyətlə sarı səhifələrdəki girişlər vasitəsilə toplanan ünvan sənədləri əldə edilə bilər
        • Onlayn rejimdə CDROM-da mövcuddur (GeoScience-də Bölmə 016 NCGIA Əsas Tədris Planı, bölmə 5.1.1)
        • Məkanın müəyyənləşdirilməsi
            yəni müştərilər, rəqiblər, icazələr, cinayətlər, yanğınlar, mövcud daşınmaz əmlak
          • yəni mövcud paylama mərkəzləri, səhiyyə təminatçıları, xidmət müəssisələri
            yəni məktəblərin yaxınlığında yanğınlar, bir mağazanın xidmət etmədiyi potensial müştərilər
            yəni poçt, kütləvi poçt, mallar, xidmətlər
            yəni rəqiblərin yeri
          • Əksər masa üstü paketlərin ünvan uyğunluğu imkanları var
          • Bəzi paketlərdə coğrafi əsas sənədlər var
          • Proqram aşağıdakı imkanları özündə birləşdirməlidir:
            • Ünvan sənədlərindəki səhvlərə qarşı dözümlü olun
            • "Demək olar ki" matçların nəzərdən keçirilməsinə və nəzərdən keçirilməsinə icazə verin
            • Dəyişdirilməsini təmin edin
            • Həm ardıcıl partiyada, həm də tək hadisə rejimində fəaliyyət göstərin
            • İstinad sənədləri (Coğrafi əsas sənədlər (GBF))
            • Ünvanlar cədvəli və digər atribut məlumatları
            • Proqram təminatı
            • Müvafiq istinad sənədlərini qiymətləndirin.
            • Ünvan sənədlərini tamlıq və standartlaşdırma üçün qiymətləndirin.
            • Ünvan uyğunluğu əməliyyatlarını həyata keçirin.
            • Nəticədə nöqtə məlumat qatlarının vizual analizini aparın.
            • Praktiki İş: coğrafi kodlaşdırma.
            • Ünvan sənədinin detalı və dəqiqliyi
            • İstinad sənədlərindəki detal üçündür
              yəni evin nömrəsi, bir küçə boyu sıra, küçənin sol və ya sağ tərəfində nə olduğu barədə məlumat yoxdur
            • yəni bir küçə boyunca ev, sıra, küçənin sol və ya sağ tərəfində olanlar barədə məlumat
            • Tətbiqin coğrafi dərəcəsini təyin edin
              Soruşun: Tətbiq istinad sənədinin artan qətnaməsini dəstəkləyirmi?
              (yəni kənd marşrutları küçə tərzi ünvanlarını istifadə etməməlidir)
            • Uğurlu tətbiq tələb olunur
            • Ünvanlar bir hadisənin və ya hadisənin yeri haqqında məlumat verir
            • Ümumiyyətlə standart format nəzərə alınmadan toplanır: xüsusiyyətləri müəyyənləşdirmək üçün standart bir metod yoxdur
            • ABŞ Poçt Xidməti formatı istifadə edilərək sənədlər ticari olaraq standartlaşdırıla bilər
            • Ünvan faylı nə qədər tam və standartlaşdırılsa, ünvan uyğunlaşma prosesi bir o qədər uğurlu olur
            • Məlumat hazırlayın
              • Əsas və ünvan sənədlərini müəyyənləşdirin
              • Ünvan üslubunu təyin edin
              • Arayış və ünvan sənədləri üçün uyğun strategiyaları müəyyənləşdirin

              Hansı sahələr uyğunlaşdırılacaq?

                • Əsas və ünvan sənədlərini standartlaşdırın
                • Əsas faylı hazırlayın: Məlumatları ayrı-ayrı sahələrə ayırın və qısaltmaları standartlaşdırın (bu ümumiyyətlə məlumat təminatçısı tərəfindən edilir)
                • İndeks
                  • Veriləri ayrı-ayrı sahələrə ayıraraq və çeşidləyərək Ünvan Cədvəlini hazırlayın (bu proqram tərəfindən həyata keçirilir)
                  • Müqayisə metodlarını təyin edərək ünvan sənədinin əsas istinad sənədinə necə keçid verəcəyini müəyyənləşdirərək uyğunluq prosesini qurun (bu, təyin etdiyiniz parametrlərə əsasən proqram tərəfindən həyata keçirilir)
                    • Ünvan sənədini sahə üzrə baza istinad faylı sahəsi ilə müqayisə edir
                    • Ünvanı simvolla müqayisə edir
                    • Uyğun hesabı hesablamaq üçün ehtimalları göstərin
                    • Qarşılaşmanı həyata keçirin
                      • Proqram bir matçın nə qədər yaxın olduğunu aşkarlayır
                      • Ünvan yerini təyin etmək üçün küçə şəbəkəsi boyunca interpolatlar
                      • Tapılan hər ünvan üçün bir nöqtə olan yeni coğrafi məlumat qatını yaradın
                      • Nəticədə coğrafi nöqtə məlumat qatını göstərin
                      • Yeni məlumatları digər məlumatlarla əlaqələndirin

                      Texasın San Antonio şəhərindəki İqtisadi İnkişaf Ofisində işləyirsiniz və San Antonio şəhərində neçə təyyarə istehsal müəssisəsi olduğunu və harada yerləşdiyini müəyyənləşdirmək üçün bazar araşdırması aparırsınız. Təsislərin xəritəsini yaratmaq üçün ünvan coğrafi kodlaşdırma istifadə etmək istəyirsiniz. Atacağınız üç addım bunlardır: 1) məlumatları hazırlamaq
                      2) ünvanları uyğunlaşdırın və,
                      3) nəticələri göstərin. Məlumat hazırlayın: İstehsal müəssisələrinin ünvanlarını elektron sarı səhifələr vasitəsilə əldə edirsiniz (http://www.bigbook.com çox baxıla bilən yerlərdən biridir.) Bu məlumatları özündə cəmləşdirən bir məlumat bazası yaradır və bir coğrafi əsas istinad sənədini alırsınız. yerli məlumat təmin edəndən. Üçüncü məlumatınız San Antonio bölgəsindəki aerodromların yerləşməsidir. GIS masa üstü proqram paketinizi açır və verilənlər bazanızı (təyyarə istehsalçıları) və iki coğrafi məlumat qatını (hava limanları və küçələr) əlavə edirsiniz. (Bu görünüşün necə görünə biləcəyinə dair bir nümunə.)

                      Artıq proqram təyyarə istehsalçıları ünvan cədvəlindəki məlumatları coğrafi əsas sənədinizlə (küçələrinizlə) müqayisə edə bilmək üçün coğrafi baza sənədini indeksləşdirməyə hazırsınız. 406 West Rhapsody Drive-da ofisi olan Zee Systems, Inc.-in məsələsini götürək. Proqram verilənlər bazasından ünvanı alacaq. Daha sonra coğrafi baza sənədindəki bütün Rhapsody Drive küçə seqmentlərini axtaracaqdır (nümunəyə bax). Qurduğunuz matç qaydalarından istifadə edərək Şərqi Rapsodiyada olan bütün küçələri xaric edəcək, 306 ilə 598 West Rapsodiya arasında gedən seqmenti müəyyənləşdirəcək və ofisin küçənin sağ tərəfindəki yolun 2/3 hissəsini interpolasiya edəcək. (nümunəyə bax) Maç müəyyən edildikdən sonra təyyarə istehsal edən obyektlərin nöqtə məlumat qatına yeni bir qeyd əlavə olunur və nəticələr xəritədə göstərilir.

                      Proqramın coğrafi məlumat qat və ünvan cədvəli arasında bu müqayisəni aparmaq üçün bir neçə addımı atmalısınız. İlk addım əsas sənədinizin növünü müəyyənləşdirməkdir. Bu nümunədə ABŞ Küçələri formatlı bir sənəd istifadə edirsiniz. ABŞ küçə formatından istifadə edərkən verilənlər bazanızda sol ünvanı, sol ünvanı, sağ ünvanı, sağ ünvanı və küçə adını tutan sahələr olmalıdır. Könüllü sahələrdə küçə növü, prefiks və ya şəkilçi və istiqamət ola bilər. (nümunəyə bax). Lazımi sahələrin mövcud olduğuna diqqət yetirin. Bu verilənlər bazası iki istiqamət sahəsinə (prefiks və şəkilçi) malik olması ilə mürəkkəbləşir. İndeks parametrlərini qurarkən hər ikisini də təyin edə bilərsiniz. ArcView-də, məlumat qatında ABŞ Küçə məlumatları olduğunu tanımaq üçün Tema Tercihlərini təyin etməlisiniz. Tercihləri təyin etdikdən sonra, proqram sənədi qurmağınızı xahiş edir. İndeksləşdirmə prosesi proqramın coğrafi əsas qat ilə ünvan faylı arasında müqayisə aparmasına imkan verir.

                      Ünvanları uyğunlaşdırın: Artıq istehsalçı cədvəlinizi coğrafi kodlaşdırmağa hazırsınız. Coğrafi əsas sənədlə istehsalçı cədvəlindəki ünvan sahəsi arasında əlaqəni qurdunuz. ArcView-də Görünüş, Geocode Ünvanlar (nümunəyə bax) seçimini edəcək və əlaqəni quracaqsınız (nümunəyə bax). İstinad mövzunuz coğrafi əsas sənəddir (küçələr). İstifadə etdiyiniz əsas sənəd növünü ABŞ Küçələrində artıq təyin etmisiniz. Təyyarə İstehsalçısı, ünvan sahəsi olaraq ünvanı istifadə edəcəyiniz proqramı söyləməyiniz lazım olan ünvan cədvəlidir. Hər bir istehsalçının yerləşdiyi nöqtəni ehtiva edən yeni bir fayl da yaratmalısınız. İki verilənlər bazasını uyğunlaşdırmağı seçdiyiniz zaman proqram ünvan cədvəlindəki ilk qeydləri götürür və uyğun küçəni tapmağa çalışır (nümunəyə bax). Hər bir qeyddə hərəkət edir və hansı qeydlərin uyğunlaşdığını və hansının uyğun olmadığını müəyyənləşdirir (nümunəyə bax). Ünvan qeydlərinin% 73-nin uyğun gəldiyinə diqqət yetirin. Bu nümunədə uyğunsuzluqlar barədə narahat olmayın.

                      Nəticələri göstərin: Proqram artıq təyyarə istehsal edən şirkətləri ehtiva edən yeni nöqtə məlumat qatını yaradır (nəticələrə baxın). İstehsalat müəssisələrinin San Antonio Beynəlxalq Hava Limanı və Kelly Hava Qüvvələri Bazası ətrafında toplandığını görə bilərsiniz.

                      Ustalıq

                      • Ünvan və istinad sənədləri ilə bağlı potensial problemləri müəyyənləşdirin.
                      • Daxil olmaqla uyğunlaşdırma prosesini tamamlayın
                        • Uyğun olmayan qeydlərin qiymətləndirilməsi
                        • İstinad sənədini redaktə etmək
                        • Ünvan cədvəlinin standartlaşdırılması
                        • Praktik məşq: atribut məlumatlarını istifadə edərək xəritə yaratmaq.
                        • Ümumilikdə problemlər
                          • Geocoding fərziyyələrə əsaslanır
                          • ünvanlar bir aralıqdadır və aralıq boyunca bərabər aralıqdadır
                          • tək nömrələr küçənin bir tərəfində, digər tərəfdə cütlərdir
                          • yerlərin ünvanları var
                          • Əsas sənəd
                            • Cari deyil: yəni küçələr sənəddə deyil
                            • Yanlış yerlər
                            • Səhv və ya kimliyi məlum olmayan küçələr
                            • Yanlış və ya təyin olunmayan ünvan aralıkları
                            • Tutarsız atribut, yəni I10 da McArthur Freewaydır
                            • Yarımçıq
                            • Səhv
                            • Standartlaşdırılmamışdır
                            • Yazı həssaslığı çox yüksək və ya aşağı səviyyədədir
                            • Nəzərə alınacaq bal çox yüksək və ya aşağıdır
                            • Problemi müəyyənləşdirmək üçün uyğunsuzluğu qiymətləndirin
                            • GBF faylı
                              • Əhatə olunan coğrafi ərazini artırın
                              • Yeni inkişaflar əlavə edin
                              • Standartlaşdırın
                              • İndeks axtarışını tənzimləyin (blok qaydaları)
                              • Uyğun ağırlıqları tənzimləyin (bir matçın nə qədər yaxın olması lazımdır)
                              • Bir matç hesab olunmaq üçün minimum hesabı tənzimləyin
                                Əvvəlki nümunədə, ünvan sənədinin 73% -i GBF-də bir coğrafi yerə uyğunlaşdırıldı. İlkin parametrlərə əsasən, bir qismən uyğunluq və uyğun olmayan üç ünvan var idi. Cavab oyunu prosesi qeydin niyə uyğun gəlmədiyini qiymətləndirməyə, hər hansı bir problemi həll etməyə və daha çox uyğunluq tapmağa imkan verir. Uyğun olmayan qeydlərə səbəb:
                                  səhv və ya natamam ünvan faylı qeydləri,
                                  coğrafi baza sənədindəki səhvlər və ya səhvlər və ya
                                  uyğunlaşdırılan məlumatlar üçün üstünlükləri səhv təyin edərək.

                                Eşsiz qeydlərə baxaq. (nümunəyə baxın) Alcor Aviation qeydləri natamam bir ünvan nümunəsidir. Colwick küçəsində küçə nömrəsi yoxdur. Verilənlər bazasına bir küçə nömrəsi daxil edildikdən sonra qeydləri yenidən bərpa edə və uyğunluq tapa bilərsiniz. Alternativ olaraq, Colwick-i interaktiv şəkildə tapa bilərsiniz, hava limanının yaxınlığındakı kiçik bir küçə olduğunu və nöqtənin yerini interpolasiya edə bilərsiniz. (nümunəyə bax)

                                Coğrafi baza sənədindəki səhvlər və ya səhvlər: Digər iki uyğun olmayan qeydin adekvat olduğu görünür. (nümunəyə bax) Növbəti addım GBF sənədini qiymətləndirməkdir. "410" adlı bütün küçələri göstərmək üçün küçə verilənlər bazasını sıralaya bilərsiniz. (nümunəyə bax) Bir neçə problem aydın olur. Adın uyğunsuz olduğuna və ünvan aralığının olmadığına diqqət yetirin. Başqa hansı problemləri görürsünüz?


                                Fon

                                Ekoloji epidemiologiya həm müvəqqəti, həm də məkana məruz qalma komponentlərinin etibarlı qiymətləndirilməsini tələb edir. Bu çağırışlara cavab olaraq, epidemioloji tədqiqatlar ətraf mühitin təsirinin xarakteristikasını yaxşılaşdırmaq və çoxsaylı xəstəlik şərtləri üçün insan sağlamlığı riskləri ilə əlaqələrini araşdırmaq üçün tədqiqat iştirakçılarının yaşayış yerlərindən və coğrafi məlumat sistemlərindən (CİS) getdikcə daha çox istifadə edirlər [1]. Məsələn, CİS ətraf mühitə məruz qalma ilə döş xərçəngi riski arasındakı əlaqəni araşdırmaq üçün istifadə edilmişdir [2-4], lösemi [5-7], Parkinson xəstəlikləri [8, 9], doğuşun mənfi nəticələri [10, 11], və tənəffüs sağlamlığı [12-15]. Ətraf mühitə məruz qalma mənbəyinə (məsələn, pestisidlər, sənaye obyektləri və ya nəqliyyat yolları ilə işlənmiş əkin sahələri) yaşayış məsafəsindən istifadə edərək CBS əsaslı məruz qalma qiymətləndirməsi məruz qalma təsnifatını qarşısını almaq üçün subyektlərin yaşayış yerlərinin mövqelərinin dəqiqliyinə əsaslanır [16]. Xəstəliklərin ətraf mühitdəki səbəblərinin araşdırılması üçün mövcud perspektivli qrupların istifadəsi getdikcə artmaqdadır, baxmayaraq ki, əksəriyyəti əvvəlcə ətraf mühitə məruz qalma qiymətləndirilmək üçün yaradılmamışdır [17, 18]. Mövcud kohortlardan istifadənin gücü fərdi səviyyədə risk faktorlarına uyğunlaşmağa imkan verən uzun illər ərzində fərdi səviyyədə perspektivli məlumatların toplanmasına əsaslansa da, subyektlərin poçt ünvanları coğrafi kodlaşdırılmaq üçün (yəni dəqiq coğrafi koordinatlara çevrilmək üçün) nadir hallarda toplanmışdır. ) CİS-də istifadəsi üçün. Bu, subyektlərin ünvanlarının zəif mövqe dəqiqliyinə səbəb ola bilər və ətraf mühitə məruz qalma qiymətləndirilməsində səhv təsnifat və qeyri-dəqiqliyin vacib mənbəyini təmsil edə bilər [13, 16, 19-24].

                                Geocoding və tədqiqat subyektinin yaşayış ünvanlarına coğrafi koordinatların (en və uzunluq) təyin edilməsi prosesi CBS əsaslı epidemioloji tədqiqatların ilk addımlarından biridir [20, 24-26]. Coğrafi kodlaşdırmanın keyfiyyəti yerləşmiş adreslərin tamlığından və mövqelərin dəqiqliyi səviyyəsindən asılıdır. Tamamlıq, coğrafi kodlaşdırıla bilən və nisbətlər üzərində toplanan məlumatların keyfiyyətindən asılı olan ünvanların nisbətidir. Mövqe dəqiqliyi coğrafi kodlu cisimlərin həqiqi yerlərinə yaxınlıq səviyyəsini əks etdirir [27, 28]. Yaşayış ünvanlarının geokodlaşdırılması üç metoddan istifadə etməklə həyata keçirilə bilər. Birinci metod, subyektlərin koordinatlarını əldə etmək və ya subyektlərin yaşayış yerləri ilə onlayn xəritələr yaratmaq üçün onlayn coğrafi kodlama xidmətlərindən istifadə etməkdir [29, 30]. Bu pulsuz xidmətlər İnternetdə mövcuddur və coğrafi kodlaşdırmada xüsusi təcrübəyə ehtiyac yoxdur [21]. İkinci bir yanaşma, ünvanların yazım yoxlanışından xəritə yerləşmələrinə qədər bütün coğrafi kodlaşdırma mərhələlərini idarə edə biləcək bir ticarət xidmətindən istifadə etməkdən ibarətdir [11, 13, 24, 31]. Üçüncü metod, coğrafi kodlaşdırma prosesinin tədqiqat qrupu tərəfindən coğrafi kodlaşdırma aləti və istinad küçə məlumat bazası ilə təchiz olunmuş CİS proqram təminatından istifadə edildiyi daxili kodlaşdırma metodundan istifadə edilməsidir [7, 21, 24, 32, 33] . Avropada və xüsusən də Fransada, müxtəlif coğrafi kodlama alətləri arasındakı coğrafi kodlaşdırma dəqiqliyini və yaşayış yerlərinin xüsusiyyətlərinə və yaşayış tarixinə görə müqayisə edən bir iş yoxdur.

                                Bir sıra Amerika və Avropa tədqiqatları, fərqli coğrafi kodlama metodlarının və istinad şəbəkəsi verilənlər bazasının düzgünlüyünü Qlobal Mövqe Təyinetmə Sistemi (GPS) [13, 20, 27, 34] və hava fotoqrafiyasına əsaslanan əl yeri ilə müqayisədə sahə yeri ilə müqayisədə qiymətləndirmişdir [28 , 35]. Bu işlər, 25 m-dən 201 m-ə qədər olan orta mövqe səhvlərindəki dəyişikliklərlə, metodlar arasındakı coğrafi kodlaşdırma dəqiqliyinin fərqliliyi barədə məlumatlılığı artırdı. Ayrıca, coğrafi kodlaşdırmanın dəqiqlik səviyyəsi, subyektlərin yaşayış yerinin şəhər və ya kənd vəziyyətinə görə dəyişə bilər [20, 24, 35, 36]. Bundan əlavə yaşayış yerlərinin yerləşmə tarixinə görə coğrafi kodlaşdırma dəqiqliyindəki fərqləri araşdıran tədqiqatlar uyğunsuz nəticələr verdi [20, 36].

                                Avropa kontekstində mövcud bir kohortun yaşayış yerlərinin coğrafi kodlaşdırma imkanlarını və keyfiyyətini əvvəllər araşdıran az sayda iş kiçik əhali üzərində aparıldı (yəni. n = 30 [29], n = 100 [27] və ya n = 354 [13]). Üstəlik, bu tədqiqatlar müxtəlif coğrafi ərazilərdə (şəhər və ya kənd) və ya zaman kəsiyində coğrafi kodlaşdırmanın dəqiqliyini araşdırmamışdır. Bundan əlavə, şəhərlərin və kənd yerlərinin məkan bölgüsü xüsusiyyətləri, küçə nümunəsi (məs.cədvəl növü, küçə uzunluğu) və coğrafi kodlaşdırmanın dəqiqliyinə təsir göstərdiyi əhali sıxlığı faktorları [20, 24, 35, 37], Avropa ilə ABŞ arasında (əvvəlki tədqiqatların əksəriyyətinin aparıldığı yerdə) fərqlənir. Araşdırmamız 1990-cı ildə başladılan bir Fransız milli perspektiv kohortunda bir referans olaraq istifadə edilən bir elektron metod və bir daxili metod ilə iki avtomatik coğrafi kodlama metodunun dəqiqliyini müqayisə etmək məqsədi daşıyırdı. Bu iş Avropa kontekstində sınaqdan keçirilmiş hər bir coğrafi kodlaşdırılan metodun dəqiqliyi və güvən səviyyələri. Araşdırmamız, ünvanların şəhər və kənd vəziyyətinə və yaşayış müddətinə görə coğrafi kodlaşdırma dəqiqliyini daha da qiymətləndirdi. Tədqiqat sonradan mövqelərin dəqiqliyi, ünvanların etik istifadəsi və məxfiliyin qorunması ilə əlaqədar olaraq eyni perspektivli kohort daxilində yuvalanmış bir vəziyyət nəzarəti tədqiqatında ətraf mühitin məruz qalmasını qiymətləndirmək üçün subyektlərin yaşayış yerlərinin coğrafi kodlaşdırılması üçün ən uyğun metoddan istifadə etmək üçün həyata keçirilmişdir. tələb olunan vaxt və mənbələr kimi.


                                CartoDB beynəlxalq coğrafi kodlaşdırmanı necə edir? - Coğrafi İnformasiya Sistemləri

                                Ticarət Coğrafi İnformasiya Sistemi (CİS) proqramında güclü coğrafi kodlama vasitələrinin geniş yayılması və fərdi səviyyədə məkan analizinə olan maraq, fərdlərin yaşayış adreslərinin xəritələşdirilməsini ictimai səhiyyə tədqiqatlarında geniş istifadə olunan bir texnika halına gətirdi [1 & # x2013 6]. Yerləşdirilmiş, fərdi səviyyədə sağlamlıq məlumatlarının məkan təhlili və xəritələşdirilməsi mühüm coğrafi nümunələri müəyyənləşdirməyə kömək edə bilər [1, 2, 7, 8]. Bununla birlikdə, mikro məlumatların məxfiliyinin qorunması üçün ehtiyac və / və ya qanuni tələb nəzərə alınmaqla, müəyyən fərdi səviyyəli məlumatların coğrafi təhlilinin aparılması imkanları çox vaxt məhduddur [9, 10]. Məxfi məlumatlara giriş məhdudiyyətləri nəticəsində vacib məlumatlar əlçatmaz qala bilər.

                                Fərdi şəxslərin yerlərinin rəqəmsal və ya kağız formatında sərbəst buraxılması müəyyənləşdirmə riski yaradır, çünki bu yerlər həmin yerlərlə əlaqəli ünvanları və şəxsiyyətləri tapmaq üçün coğrafi kodlaşdırıla bilər. Yenidən tanıma riskini azaltmaq üçün coğrafi maskeleme üsulları hazırlanmışdır. Hazırkı icmalda məlumatların bölüşdürülməsi və fərdi səviyyədəki məlumatlar, səhiyyə ilə əlaqəli məlumat cədvəllərinin coğrafi kodlaşdırma və tərs coğrafi kodlaşdırma istifadəsi və məxfiliyi qorumaq üçün coğrafi maskeleme metodlarının effektivliyi təsvir edilmişdir.

                                2. Fərdi Səviyyəli Məlumat və Coğrafi Kodlama

                                Xalq sağlamlığı tədqiqatlarının bir hissəsi olaraq toplanan məlumat dəstləri çox vaxt məxfi məlumatları ehtiva edir. Buraya fərdin adı, cinsi, yaşı, irqi, etnik mənsubiyyəti, gəliri və digər sosial-iqtisadi xüsusiyyətlər, habelə konkret tədqiqata maraq göstərən xüsusi sağlamlıq şərtləri daxil ola bilər. Tədqiqat məqsədləri üçün bu tip fərdi məlumatların toplanması insan subyektlərinə aiddir. Bu tip məlumatlar ictimaiyyətə açıqlana bilməz, çünki bu, insan subyektlərinin məxfilik müddəalarını pozacaq & # x2019 tədqiqatları [11]. Tipik olaraq, tədqiqatçılar nəticələrini dərc etdikdə, yalnız bütün nümunə və ya xüsusi alt nümunələr haqqında ümumi məlumatları yayımlamaq olar.

                                Getdikcə sağlamlıqla əlaqəli tədqiqatların bir hissəsi olaraq toplanan fərdi səviyyəli məlumatlar coğrafi identifikatorları ehtiva edir. Bu, yerli yurisdiksiya (şəhər və ya bələdiyyə) və ya poçt kodu şəklində nisbətən qaba və ya dəqiq küçə ünvanı şəklində daha incə ola bilər. Bəzi məlumat toplama protokollarına, sahədəki GPS vahidlərindən istifadə edərək koordinatların toplanması da daxil edilə bilər. Bu coğrafi identifikatorlar tədqiqata müxtəlif yollarla dəyər qatır. Birincisi, tədqiqat mövzularında məhdud demoqrafik və sosial-iqtisadi dəyişənlər mövcuddursa, onların yerləşməsi proksi dəyişənləri təmin edə bilər. Məsələn, tədqiqat subyektlərini yerləşdikləri siyahıyaalma sayım vahidinin demoqrafik xüsusiyyətləri ilə əlaqələndirmək çox yaygındır. İkincisi, tədqiqat subyektlərinin yeri sağlamlıq nəticələri ilə əlaqəli ola biləcək digər dəyişkənlər barədə məlumat verə bilər. Nümunələr, maraq göstərdiyiniz ən yaxın səhiyyə müəssisəsinə getməyin vaxtını, çirklənmə mənbələrinə olan məsafəni və ya yaşayış yerlərindəki hava / su / torpaq keyfiyyətini əhatə edir.

                                Küçə ünvanları fərdi səviyyə məlumatları üçün ən çox istifadə olunan coğrafi identifikatorları təmsil edir. Ünvan məlumatları coğrafi kodlaşdırma kimi tanınan bir prosesi istifadə edərək xəritədəki yerlərə çevrilə bilər [1, 12]. Geocoding masa üstü GIS proqramı və ya onlayn xəritəçəkmə xidmətləri istifadə edilə bilər. Avtomatlaşdırılmış coğrafi kodlama metodları böyük ünvan verilənlər bazalarını çox tez çevirə bilər.

                                Geocoding səhvsiz deyil. Tipik olaraq, qeydlərin müəyyən bir hissəsi natamam və ya səhv məlumatlar səbəbindən coğrafi kod vermir. Yanlış istinad məlumatları və ya coğrafi kodlama prosesindəki səhvlər səbəbindən coğrafi kodlu yerlər də dəqiq olmaya bilər [1]. Bununla birlikdə, bu səhvlər nisbətən yaxşı başa düşülür və ədəbiyyatda böyük diqqət görmüşdür [1, 13 & # x2013 20]. Coğrafi kodlaşdırma üçün istifadə edilən məlumat cədvəlləri və coğrafi kodlama texnikaları da tədricən yaxşılaşır [21, 22].

                                Bəzi aparıcı ictimai səhiyyə tədqiqat jurnallarının son cildlərində dərc olunmuş məqalələrin icmalı, coğrafi kodlaşdırmanın çox geniş istifadə olunduğunu göstərir. Bundan əlavə, Beynəlxalq Səhiyyə Coğrafiya Jurnalı və Mekansal və Mekansal-Epidemiyoloji Jurnalı kimi sağlamlığın məkan ölçülərinə açıq bir vurğu ilə bir neçə yeni sağlamlıq dərgisi ortaya çıxdı. Bu, coğrafi kodlaşdırmanın ictimai səhiyyə tədqiqatlarında analitik bir vasitə kimi möhkəm bir şəkildə qurulduğunu təsdiqləyir [6].

                                Coğrafi kodlamanın geniş tətbiqi analizi üçün misilsiz fürsətlər təqdim etməklə yanaşı, məsələn, [23 & # x2013 25], eyni zamanda, ictimai səhiyyə məlumat dəstlərinin məxfiliyinin qorunması üçün problemlər də təqdim edir [2, 6, 26]. Bir sözlə, coğrafi məlumatların fərdi səviyyədə yayılması məxfiliyi poza bilər. Məsələn, bir şəxsin küçə ünvanının dərc edilməsi, əlaqəli ad (lər) in qovluqlarda və əmlak məlumat bazalarında axtarılmasına imkan yaradır. Məkanın koordinatlar şəklində yayımlanması (məs., En / uzunluq) bunların xəritədə çəkiləcəyini və sonra bir ünvanla əlaqələndirilə biləcəyini bildirir. Bir xəritəni kağız və ya rəqəmsal formada dərc etmək həm də yerlərin bir ünvanla əlaqələndirilə biləcəyini göstərir. Şəkil 1, yayımlanmış bir koordinatın müəyyən bir yaşayış yerini müəyyənləşdirmək üçün xəritədə dərc olunduğu bir nümunəni göstərir.

                                Koordinatları dərc edərək məxfi məlumatların açıqlanması. Şəkil 1 (a), hipotetik koordinatlar çoxluğunun bir nümunəsini göstərir. Bunları kiçik miqyaslı xəritədə (b) təsvir etmək təxmini bir yer (yəni Rio Rancho) təmin edir. Böyük bir miqyaslı xəritədən (c) istifadə edərək böyütmək koordinatlar dəsti ilə əlaqəli küçə ünvanını müəyyən etmək üçün istifadə edilə bilən çox dəqiq bir yer təmin edir (məsələn, 1364 Peppoli Loop SE). Hava görüntüləri (d) xüsusi yaşayış yerini təsdiqləmək üçün istifadə edilə bilər.

                                Müəyyən bir yeri təsvir etmək üçün unikal koordinat cütü (hipotetik)

                                Koordinat cütü kiçik miqyaslı bir xəritədə quruldu

                                Koordinat cütü böyük bir miqyaslı xəritədə quruldu

                                Yerin oblique hava görüntüləri

                                Bu texnikalar topluca & # x201creverse geocoding & # x201d [27 & # x2013 34] adlanır. Formal olaraq, əks coğrafi kodlaşdırma, kağız və ya rəqəmsal formatda nəşr edilmiş bir yerlə əlaqəli küçə ünvanının müəyyən edilməsindən ibarətdir. Ters coğrafi kodlama müəyyənləşdirməyə səbəb ola bilər, çünki küçə ünvanı daha sonra ümumi qovluqlardan istifadə edən bir və ya bir neçə şəxslə əlaqələndirilə bilər. Konseptual olaraq, əks coğrafi kodlama, Şəkil 2-də göstərildiyi kimi, müntəzəm ünvan coğrafi kodlaşdırma tərsinə qoymağa bənzəyir.

                                Geocoding və əks coğrafi kodlaşdırma. Geocoding (a), məlumatları ünvanlamaq üçün yerlərin (yəni koordinatların) təyin edilməsi prosesidir. Ünvanların cədvəlli verilənlər bazası bir xəritəyə çevrilir. Ters coğrafi kodlaşdırma (b) sözün əsl mənasında bunu əksinə qoyur və eşlenen yerləri ünvanlara çevirir. Coğrafi kodlaşdırma və tərs coğrafi kodlaşdırma prosesindəki səhvlər uyğun olmayan ünvan məlumatları ilə nəticələnə bilər, yəni əks coğrafi kodlaşdırma istifadə edilərək əldə edilən adreslər orijinal coğrafi kodlaşdırmada istifadə edilənlərlə eyni ola bilməz.

                                Ünvan coğrafi kodlaşdırmanın əsas prosesi

                                Tərs ünvan coğrafi kodlaşdırmanın əsas prosesi

                                Ters coğrafi kodlaşdırma istifadə edərək fərdi ünvanların müəyyənləşdirilməsinin nisbətən asan və dəqiq olduğu göstərilmişdir. Məsələn, [29], coğrafi kodlu xəstə adreslərinin fərziyyə xəritəsini yaratdı və GIS-də əllə tərs coğrafi kodlama üsullarından istifadə edərək ünvanların 79 & # x25-i düzgün müəyyənləşdirə bildi. Eyni müəlliflər, görüntü analizinə əsaslanan yarı avtomatik avtomatlaşdırılmış əks coğrafi kodlaşdırma istifadə edərək oxşar bir yanaşma tətbiq etdilər və ünvanların 26 & # x25-i düzgün müəyyənləşdirə bildilər [35]. Başqa bir nümunədə, Katrina qasırğasının ardınca, yerli bir qəzet ölüm yerlərinin xəritəsini yayımladı. Tədqiqatçılar CİS metodları və sahə işlərinin birləşməsindən istifadə edərək dərc olunmuş xəritədəki əksər yerlər üçün orijinal yaşayış yerini düzgün müəyyənləşdirə bildilər [36]. Bu yaxınlarda Avstriyanın Vyana şəhərində baş verən cinayət hadisələri ilə bağlı bir araşdırma, bir neçə onlayn xəritəçəkmə xidməti üçün əks coğrafi kodlaşdırmanın dəqiqliyini müəyyənləşdirdi [28]. Tapıntılar, ehtimal olunan qurbanların 68 & # x25-inin onlayn əks coğrafi kodlaşdırma və onlayn ünvan və telefon kitabçaları istifadə edərək adları ilə müəyyən edilə biləcəyini göstərir.

                                Daha geniş təfərrüatlı məkan məlumatlarına dair mövcud tendensiyalar və pulsuz onlayn tərs coğrafi kodlama vasitələrinin mövcudluğu şəxsiyyətin müəyyənləşdirilməsi riskini artırır [1]. Məsələn, Google Maps və Microsoft & # x2019s Bing Maps kimi onlayn coğrafi kodlaşdırma xidmətləri (pulsuz) onlayn xəritə xidmətlərinin bir hissəsi olaraq çox dəqiq bina səviyyəli coğrafi kodlaşdırma və əks coğrafi kodlaşdırma təmin edir. Bu, dəqiq və nisbətən inkişaf etmiş & # x201cmap-hack & # x201d alətlərini internet bağlantısı və təvazökar kompüter bacarığı olan hər kəsə təqdim etdi. Aparıcı GIS proqram platforması, ArcGIS by Esri, standart məlumat emalı və təhlil alətləri qrupuna Ters Geocoding alətini də əlavə etdi. Bu, daha güclü və standart bir CBS aracı olaraq tərs coğrafi kodlaşdırma qurdu.

                                4. Məlumat Paylaşımının Faydaları və Riskləri

                                Şəxslərlə bağlı məlumatların necə və necə verilə biləcəyini müəyyənləşdirməyə çalışarkən, aşağıdakı mülahizələrin tarazlaşdırılması lazımdır: (1) məxfiliyin qorunması zərurəti & # x2014 bu fərdi şəxsin məxfilik hüququnun bir hissəsidir və çox vaxt kolleksiyadakı şərtdir orijinal məlumatların, (2) yerlərdə orijinal nümunəni qorumaq istəyi və bu, toplanmış məlumatlar əvəzinə fərdi səviyyəli məkan məlumatlarından istifadə edərək faydalı məlumat əldə etməyə çalışma marağını əks etdirir, (3) məlumatların bölüşdürülməsinin faydası tədqiqatçıların faydası və ümumiyyətlə xalqın faydası. Bu mülahizələr, məxfiliyin ayrı-ayrı yerlərdə dəyişiklikləri maksimum dərəcədə artırmaqla qorunması mənasında ziddiyyət təşkil edir, orijinal nümunəni qorumaq isə dəyişiklikləri minimuma endirməklə həyata keçirilir. Hər hansı bir məxfiliyi qorumaq metodunun məqsədi şəxsiyyətin müəyyənləşdirilməsi riskinin azaldılması ilə orijinal məlumatların xüsusiyyətlərinin qorunması arasında bir tarazlıq tapmaqdır.

                                Məxfilik ehtiyacını tədqiqatçılara və digərlərinə georeferensiyalı fərdi sağlamlıq məlumatlarına giriş təmin etməkdən əldə edə biləcək faydalarla tarazlaşdırmağa çalışarkən bu çətinliklər geniş tanınmışdır. Məsələn, Milli Tədqiqat Şurası 2007-ci ildə & # x201cİnsanları Xəritədə Yerləşdirmə: Bağlı Sosial-Məkan Veriləri ilə Məxfiliyin Qorunması & # x201d adlı bir hesabat yayımladı [37]. Uzaqdan Həssas və Özünü Tanıyan Verilərin İnteqrasiyasından Yaranan Məxfilik Məsələləri üzrə Panel belə nəticəyə gəldi:

                                & # x201cSon vaxt müəyyənləşdirmə və məxfiliyin pozulması riskini azaltmaq üçün texniki yanaşmalara dair araşdırmalar gələcək uğurlar üçün vəd göstərdi. Bununla birlikdə, bu anda, əlaqəli məkan-sosial məlumatların idarə olunması üçün bilinən heç bir texniki strategiya və ya texniki strategiyanın birləşməsi məlumat əlaqəsi, açıq giriş, məlumat keyfiyyəti və məlumat dəstləri və məlumat istifadəsi arasında məxfilik qorunması hədəfləri arasındakı ziddiyyətləri kifayət qədər həll etmir [37]. & # x201d

                                Hazırkı icmal, bu hesabatın dərcindən bəri əldə olunmuş bəzi irəliləyişləri və oxşar bir mesajla digər tədqiqatları sənədləşdirir [38, 39]. Konkret olaraq, icmalda NRC hesabatında bəhs olunan & # x201ctechnical yaklaşımlardan biri kimi ən müasir coğrafi maskeleme özetlenmiştir.

                                5. Məxfilikdən Qoruma Strategiyaları

                                Tədris subyektlərinin məxfiliyini qorumağın ən sadə və ən sərt yolu, tədqiqat çərçivəsində toplanan fərdi səviyyəli məlumatların heç birini bölüşməməkdir. Bir çox məlumat dəsti üçün, məlumatları bir şəkildə yayımlamaq üçün inandırıcı arqumentlər mövcud olmadıqca, bu ən yaxşı standart seçim ola bilər. Ən praktik və inandırıcı arqumentlərdən biri də məlumatların mövcud olmasının bir çox maliyyə agentliyinin tələbi halına gəlməsidir [40, 41].

                                Mümkün həll yollarından biri fərdi səviyyədə verilənlərə çox məhdud bir giriş təmin etməkdir. Bu, əksər xərçəng qeydçiləri tərəfindən qəbul edilən yanaşmadır [10]. Fərdi səviyyədə xərçəng məlumatları xərçəng qeydləri tərəfindən toplanır və təşkil edilir. Fərdi qeydlərə giriş protokolları insan subyektlərinin tələblərinə cavab verən tədqiqatçılar tərəfindən məhdudlaşdırılır & # x2019 baxış. Tədqiqatçılar tez-tez məlumatları harada istifadə edə biləcəyi (bəzən yalnız yerində) və ətraflı nəticələr baxımından yayımlanmalarına icazə verilməsi ilə məhdudlaşırlar. Bu növ məhdudlaşdırılmış giriş tədqiqatçılara orijinal, fərdi qeydlərlə işləmək imkanı verir, lakin sonrakı məlumatların sərbəst buraxılması ciddi şəkildə nəzarət olunur. Bu detallı və institusional protokollar sağlamlıqla əlaqəli digər məlumat növləri üçün çox yaygındır.

                                Yaygın olaraq istifadə edilən digər bir həll, məlumatların məkan baxımından toplanmış şəkildə yayımlanmasıdır [9]. Bu, orijinal məlumatların seçilmiş alt qrupları üçün cədvəl şəklində xülasə məlumatlarını bildirməyə bənzəyir. Fərdi səviyyəli coğrafi kodlu məlumatlar üçün ümumiləşdirmə, adətən, ayrı-ayrı yerləri mənalı bir məkan vahidi daxilində birləşdirməklə həyata keçirilir. Bu, şəhərlər, bölgələr və ya siyahıyaalma vahidləri kimi yerli və ya regional səlahiyyətlərdən ibarət ola bilər. Şəkil 3 məkan toplanması üçün əsas prosesi təsvir edir. Məxfiliyi qorumaq üçün yalnız toplanmış verilənlər bazası yayımlanır və ya paylaşılır.

                                Siyahıyaalma sayım vahidlərindən istifadə edərək ayrı-ayrı halların məkan toplanması. Ayrı-ayrı coğrafi kodlu yerlər (solda) siyahıyaalma sənədlərindən istifadə edərək (sağda) toplanır. Əhalinin siyahıyaalınması başına düşən hadisələrin sayının hesablanması, 10.000 sakinə düşən hadisələrin sayı kimi müvafiq əhali ağırlıqlı indeksləri təyin etmək üçün istifadə olunur. Xam saymalardan fərqli olaraq insidans və ya xəstəlik nisbətlərinin təyin edilməsi, birləşmənin əsas səbəblərindən biridir. İkincil bir fayda olaraq, məkan toplanması, tanınma riskini xeyli azaltdı.

                                Bununla yanaşı, bir çox tətbiqetmə üçün məkan baxımından ümumiləşdirilmiş məlumatların sərbəst buraxılması ayrı-ayrı yerlərə giriş əldə etməklə müqayisədə daha az faydalıdır [26]. Ümumi nöqtə nümunəsi analizi və klasterin aşkarlanması kimi bir çox məkan analitik üsulu ümumiləşdirilmiş məlumatlardan istifadə etməklə daha az güclü və ya sadəcə mümkün deyil.

                                Nəhayət, alternativ bir həll yolu, məlumatları daha iri analiz vahidlərinə toplaymadan yenidən müəyyənləşdirmə riskinin xeyli azaldılması üçün məlumatları dəyişdirməkdir. Buraya coğrafi maskalanma deyilən bəzi sistematik şəkildə orijinal yerlərin dəyişdirilməsi daxildir.

                                6. Coğrafi maskalanma istifadə edərək məxfiliyin təmin edilməsi

                                Coğrafi maskalanma, məlumatların sərbəst buraxılmasından sonra müəyyənləşdirmə riskini məhdudlaşdırmaq üçün nöqtə yerləşmə məlumatlarının koordinatlarının dəyişdirilməsidir. Əslində coğrafi maskalanmanın məqsədi sərbəst buraxılan məlumatların coğrafi kodunun dəqiq tərsinə çevrilməsini çox çətinləşdirməkdir. Şəkil 4 coğrafi maskalanmanın ümumi konsepsiyasını əks etdirir.

                                Coğrafi maskalanmanın konseptual təsviri. Bir sıra orijinal yerlər (a), ünvan coğrafi kodlaşdırma və ya GPS istifadə edərək sahə məlumatlarının toplanmasından istifadə edərək yaradılır. Bu yerlər maraq dairələrinə çox yaxından uyğundur, baxmayaraq ki, müəyyən bir səhv ola bilər. Hər bir yer üçün bir neçə alqoritmdən birini istifadə edərək orijinal yerini dəyişdirərək maskalı bir nümayəndəlik yaradılır (b). Əksər alqoritmlər yerdəyişmədə müəyyən dərəcədə təsadüfilik ehtiva edir. Orijinal yerlər verilənlər bazasından silinir və nəticədə nəşr və paylama məqsədləri üçün bir sıra maskalı yerlər (c) yaranır. Maskalı yerlərin dəsti orijinal yerlərin dəsti ilə eyni sayda müşahidəyə malikdir.

                                Orijinal + maskalı yerlər

                                Coğrafi maskalanma termini ilk dəfə 1999-cu ildə bəzi detallarla təsvir edilmişdir [26]. Bu termin qeyri-patoloji mikro məlumatların maskalanma üsullarının genişləndirilməsi kimi təqdim edilmişdir [42, 43]. Coğrafi maskeleme ən geniş yayılmış termin olsa da, & # x201cgeomasking & # x201d [44 & # x2013 47], & # x201cjittering & # x201d [48, 49], & # x201cdithering & # x201d [50] daxil olmaqla digər şərtlər də istifadə edilmişdir. ]. Coğrafi maskalanma metodlarının orijinal təsviri [26], müxtəlif tərtibat tiplərini əhatə edir, bunlara (1) tərcümələr, miqyasdakı dəyişikliklər və fırlanma ilə yerdəyişməni həyata keçirən afin çevrilmələri və (2) təsadüfi narahatlıq əlavə olunur. koordinatlarına müəyyən miqdarda təsadüfi səs. Transformasiya yanaşması, əsasən yeni koordinatların artıq eyni real dünya kontekstinə sahib olmadığı üçün geniş qəbul edilməmişdir. Məsələn, bir sıra yerlərə bir fırlanma və ya tərcümə tətbiq edildikdən sonra, bu koordinatları digər məkan məlumat qatlarının üstünə qoymaq mənasızdır. Nəticədə, coğrafi maskalanma koordinatlarda təsadüfi narahatlıq tətbiq etməklə böyük ölçüdə sinonim oldu.

                                Coğrafi maskalanma fərdi səviyyəli məlumatları istifadə edən ictimai səhiyyə tədqiqatçıları tərəfindən fəal şəkildə istifadə olunur. Aşağıdakı iki şərti təmin edən bir sıra tədqiqatlar müəyyən edilmişdir: (1) məqalədə fərdi səviyyəli sağlamlıq məlumatlarının coğrafi kodlu yerlərinin olduğu bir xəritə daxil edilmiş və (2) coğrafi kodlaşdırılmış yerlərin səbəblərdən bir şəkildə dəyişdirildiyi xüsusi qeyd edilmişdir. məxfilik (& # x201cgeographic masking & # x201d ifadəsi açıq şəkildə istifadə olunmasa belə). Növbəti hissədə bu xəritələrin təbiəti və tətbiq olunan coğrafi maskeleme metodları haqqında məlumat verilir.

                                Cape Code-dakı bir araşdırmada xərçəng diaqnozu qoyulmuş xəstələrin yaşayış ünvanlarının yerləşdiyi xəritələr dərc edilmişdir [48]. Coğrafi maskeleme yanaşması & # x201c məxfilik səbəbləri ilə izah edildi, nöqtələr sarsıldı [48]. & # X201d Churchill County, NV (ABŞ), bir uşaqlıq lösemi xəstələrinin yaşayış ünvanının olduğu xəritələri nəşr etdi [51]. ]. Coğrafi maskalanma yanaşması & # x201clocations genişləndirilib & məxfiliyi qorumaq üçün & # x201cittered & # x201d kimi təsvir edilmişdir.Coğrafi maskalanma yanaşması & # x201 xəritədə məxfiliyi qorumaq üçün radius 5 & # x2009km dairəvi disk içərisində təsadüfi bir şəkildə sarsılan hər bir təsərrüfatın yerini göstərir [52]. & # X201d. qan qurğuşunu üçün müayinə olunan uşaqların yaşayış ünvanları [24]. Coğrafi maskalanma yanaşması & # x201c açıq şəkildə göstərilən xəritələr olaraq təsvir edildi və uşağın həqiqi yerini sabit bir radial tampon içərisində təsadüfi olaraq köçürdük, bu texnika titrəyiş kimi tanınırdı [24]. & # X201d. xərçəng diaqnozu qoyulmuş şəxslərin yaşayış yerlərinin yerləşmələri [53]. Coğrafi maskeleme yanaşması, xəstələrin məxfiliyini qorumaq üçün hər birinə təsadüfi bir & # x201cjitter & # x201d əlavə etdiyimiz bu məlumatlardakı yaşayış yerlərini & # x201c & # x2026 kimi təsvir etdi (və bəzi halların səbəbini izah etdik) məkan məkanının xaricində yerləşdiyi görünür) [53]. & # x201d Massachusettsdəki (ABŞ) bir araşdırma, PCB ilə çirklənmiş bilinən bir Superfund sahəsinin yaxınlığında yaşayan analardan dünyaya gələn körpələrin yaşayış yerlərinin yerləşdiyi yerləri göstərən xəritələri yayımladı [54]. Coğrafi maskalanma yanaşması iştirakçıların məxfiliyini qorumaq üçün & # x201c yaşayış yerləri 1 & # x25 təsadüfi səs-küylə qarışdırılır [54] kimi təsvir edilmişdir. & # X201d Qərbi Avstraliya (ABŞ) Perth şəhərində aparılan bir araşdırma, yerlərin yerləşdiyi yerləri əks etdirən xəritələr. əsas astma diaqnozu ilə təcili yardım otağını ziyarət edən uşaqların yaşayış ünvanları [54, 55]. Coğrafi maskeleme yanaşması & # x201ccase və nəzarət halları sarsıldı [55]. & # X201d

                                Bu nümunələr coğrafi maskalanma tətbiq olunan bütün nəşr olunmuş tədqiqatların əhatəli bir araşdırmasını təmsil etməsə də, bir sıra xüsusiyyətləri əks etdirir. Birincisi, & # x201cgeographic maskalanma yerinə & # x201cjittering & # x201d termini geniş yayılmışdır. & # X201d Sarsıntı ümumiyyətlə təsadüfi bir narahatlıq növü təklif etmək üçün istifadə olunsa da, nümunələr terminin istifadəsində dəyişir. İkincisi, bir sıra nümunələr 5 & # x2009 km radiuslu bir disk içərisində təsadüfi & # x201cjittered [52] & # x201d və ya 1 & # x25 təsadüfi səs-küylə & # x201cjittered kimi coğrafi maskeleme metodunun təbiətinə dair xüsusiyyətləri təmin edir. iştirakçıların məxfiliyi [54]. & # x201d Bununla yanaşı, başqa bir neçə nümunədə yerlərin başqa bir açıqlama olmadan dəyişdirildiyi bildirilir.

                                7. Coğrafi maskalanmaya fərqli yanaşmalar

                                Bu illər ərzində bir sıra fərqli coğrafi maskalanma üsulları hazırlanmışdır. Bunların hamısı, yenidən müəyyənləşdirmə riskini azaltmaq üçün müəyyən dərəcədə təsadüfi seçimdir. Şəkil 5 bu metodların hər birinin əyani şəkildə təqdim edilməsini təmin edir.

                                Ümumi coğrafi maskeleme texnikasının qrafik təsviri. Qırmızı nöqtə orijinal yeri və mavi nöqtə mümkün olan bir çox maskalı yerdən birini göstərir.

                                Təsadüfi istiqamət və sabit radius

                                Bir dairə daxilində təsadüfi narahatlıq

                                Bimodal Gauss köçürülməsi

                                (1) & # x2009 & # x2009 Təsadüfi İstiqamət və Sabit Radius. Maskeli nöqtələr orijinal yerin ətrafındakı bir dairədə təsadüfi bir yerə yerləşdirilir. Maskalı nöqtələr dairənin içərisinə qoyulmur.

                                (2) & # x2009 & # x2009 Bir dairə daxilində təsadüfi perturbasiya. Maskalı yerlər, orijinal yerin ətrafında dairəvi bir sahənin hər yerinə yerləşdirilir. Dairədəki hər yer eyni dərəcədə ehtimal olunduğundan, maskalı yerlərin kiçik məsafələrə nisbətən daha böyük məsafələrə yerləşdirilməsi ehtimalı yüksəkdir. Bu texnikada bir dəyişiklik təsadüfi istiqamət və təsadüfi radiusun istifadəsidir. Bu texnikada, maskalı nöqtələr təsadüfi istiqamətə və təsadüfi radiusa sahib bir vektor istifadə edərək yerlərindən kənarlaşdırılır. Radius maksimum dəyərlə məhdudlaşır. Bu, maskalı yerlərin yerləşdirilə biləcəyi dairəvi bir sahə ilə nəticələnir, lakin maskalı yerlərin kiçik məsafələrə nisbətən böyük məsafələrdə olması ehtimalı yüksəkdir. Bu səbəbdən bu iki texnika yalnız maskalı yerlərin orijinal yerlərə nə qədər yaxın yerləşmə ehtimalı ilə bir qədər fərqlənir.

                                (3) & # x2009 & # x2009Gaussian Deplasman. Yer dəyişdirmə istiqaməti təsadüfi, lakin məsafə bir Gauss paylanmasını izləyir. Dağılımın dağılması yerli əhali sıxlığı kimi digər maraq parametrlərinə əsasən dəyişdirilə bilər.

                                (4) & # x2009 & # x2009Donut Maskeleme. Bu texnika bir dairə içindəki təsadüfi yerdəyişməyə bənzəyir, ancaq yer dəyişdirilməsinə icazə verilməyən daha kiçik bir daxili dairədən istifadə olunur. Əslində, bu yerdəyişmə üçün minimum və maksimum səviyyəni təyin edir. Maskalı yerlər icazə verilən ərazinin hər yerinə qoyulur. Çörek maskalanmasına bir az fərqli yanaşma təsadüfi bir istiqamət və iki təsadüfi radiusun istifadəsidir: biri maksimum, digəri minimum yerdəyişmə üçün. Bu iki texnika yalnız maskalanmış yerlərin orijinal yerlərə nə qədər yaxın yerləşmə ehtimalı ilə bir qədər fərqlənir. Hər iki yanaşma minimum miqdarda yer dəyişdirmə tətbiq edir.

                                (5) & # x2009 & # x2009Bimodal Gaussian Deplasman. Bu, təsadüfi məsafə funksiyası üçün bimodal bir Gauss dağılımından istifadə edərək Gauss maskeleme texnikasında bir dəyişiklikdir. Əslində, bu pişi maskalanmasına yaxınlaşır, lakin yerləşdirmə ehtimalı daha azdır.

                                Bu metodlar burada ayrı metodlar kimi təqdim edilsə də, bir neçəsi bir-birinin yüngülləşdirilmiş versiyalarıdır. Məsələn, donut maskalanması və bimodal Gauss yerdəyişməsi, maskalanmış yerlərin orijinal yerlərə nisbətən yerləşdirildiyi ümumi sahə baxımından çox oxşardır.

                                Bu beş texnika ədəbiyyatda müxtəlif dərəcələrdə təsvir edilmişdir. Təsadüfi istiqamət və sabit radius [56] tərəfindən istifadə edilmişdir. Bir dairə içərisində təsadüfi narahatlıq [26, 50, 56, 57] tərəfindən öyrənilmişdir. Gauss köçürülməsi [57, 58] tərəfindən tədqiq edilmişdir. Donut maskalanması əvvəlcə [59] tərəfindən irəli sürülmüş və bir sıra son tədqiqatlarda tədqiq edilmişdir [44, 46, 47, 60]. Bimodal Gauss köçürülməsi [61] tərəfindən tədqiq edilmişdir. Bu tədqiqatlar xüsusilə bir və ya daha çox maskalanma metodunun inkişafı və ya testinə yönəlmişdir. Coğrafi maskalanma tətbiqetmələrinin real dünya məlumat dəstlərinə daha əvvəl nəzərdən keçirilməsi bəzi tədqiqatlarda adın xüsusi texnikasından bəhs edilmədiyini göstərdi. Texnikanın təsvirini verən bu tədqiqatlar arasında təsadüfi narahatlıq ən geniş istifadə olunur. Bu, coğrafi maskeleme ədəbiyyatında diqqət çəkən bir az daha mürəkkəb metodların bu günə qədər qəbul edilmədiyini göstərir.

                                Ədəbiyyatda hər bir yerin ən yaxın küçə seqmentinin orta nöqtəsinə və ya ən yaxın küçə kəsişməsinədək köçürülməsi kimi bir sıra digər texnikalardan bəhs edilmişdir [62]. Texniki cəhətdən danışsaq, bu texnikalar mikrospatial toplama metodlarıdır, çünki bir neçə orijinal yer eyni & # x201cmasked & # x201d yerində qala bilər. Bu metodlar, digər məkan toplama metodlarına alternativ olaraq diqqət tələb edərkən, ədəbiyyatda çox məhdud bir diqqət gördülər.

                                Məxfiliyi təmin etmək üçün lazım olan yerdəyişmə miqdarının təyin edilməsi coğrafi maskalanma ilə bağlı bir neçə tədqiqat tərəfindən həll edilmişdir [56], lakin ümumdünya rəhbərliyi ortaya çıxmamışdır. Bununla birlikdə, yerdəyişmə miqdarının yerli əhali sıxlığı ilə tərs mütənasib olması barədə geniş razılığa gəlinir [26, 47, 56, 58, 61]. Məsələn, əhali sıxlığı çox aşağı olan bir kənd ərazisindəki yaşayış yerlərini nəzərdən keçirək. Bu iqamətgahdan 100 metr məsafədə başqa yaşayış yerlərinin olmaması tamamilə mümkündür. Bu səbəbdən 100 metrlik bir yerdəyişmə, şəxsiyyəti müəyyənləşdirmə diskinin azaldılmasında çox təsirli olmayacaqdır. Əksinə, əhalisi çox sıx olan bir şəhər ərazisindəki bir yaşayış yerinin 100 metr məsafədə çox sayda başqa yaşayış yerinə sahib ola biləcəyi və 100 metrlik bir yerdəyişmə, şəxsiyyəti müəyyənləşdirmə riskini əhəmiyyətli dərəcədə azaltmaq üçün kifayət edə bilər. Yuxarıda təsvir olunan bütün maskalanma üsulları, yerdəyişmənin ümumi böyüklüyünə nəzarət edən ən azı bir parametr, məsələn, maksimum yerdəyişməyə uyğun radius və ya normal paylama tətbiq edən texnika üçün standart sapma daxildir. Bu parametr yerli əhali sıxlığı ilə tərs mütənasib olaraq ölçülməlidir (vahid əraziyə düşən insan şəklində ifadə edilir). Əhalinin siyahıyaalma sahələrinin populyasiya sıxlığından istifadə etmək əvəzinə, bir neçə tədqiqat yer dəyişdirmə miqyasını tənzimləmək üçün daha etibarlı bir vasitə kimi yaşayış yerlərinin yerli sıxlığından istifadə etməyi təklif etmişdir [44, 47, 63].

                                Coğrafi maskalanmanın bir dəyişikliyi, maskalı yerlərin əvvəlcədən təyin edilmiş maraq sahələrinə düşməsini təmin etmək üçün əlavə məkan filtrlərinin istifadəsidir. Məsələn, yerdəyişmə açıq şəkildə yaşayış olmayan ərazilərdə maskalı yerlərin görünməməsini təmin etmək üçün yerüstü su hövzələri (məs., Okeanlar, koylar, çaylar və göllər) xaric olmaqla fiziki quru bazası ilə məhdudlaşdırıla bilər. Bu cür filtrlərin digər bir potensial istifadəsi, maskalanmış yerlərin orijinal yerlə eyni sayım vahidlərində (məsələn, siyahıyaalma bloku qrupu, poçt kodu) qalmasını təmin etməkdir. Bu cür əlavə məkan filtrlərinin istifadəsi Şəkil 6-da göstərilmişdir.

                                Yer dəyişdirməyi məhdudlaşdırmaq üçün əlavə bir məkan filtrindən istifadə edərək coğrafi maskalanma texnikasının nümunəsi (yəni bir dairə daxilində təsadüfi yerləşdirmə). Qırmızı nöqtə, sarı sahə maskalı yer üçün bütün mümkün yerləri və mavi nöqtə təsadüfi seçilmiş mümkün bir maskalı yeri təmsil edir. Bu filtr məntiqi olaraq heç bir əhalinin yaşadığı ərazilərdə (su obyektləri və ya parklar) yerləşdirilməməsi və ya müəyyən bir sayım vahidi ilə köçürülməsini məhdudlaşdırmaq üçün istifadə edilə bilər (eyni siyahıyaalma yolu və ya poçt kodu kimi).

                                Konseptual baxımdan nisbətən sadə olsa da, coğrafi maskalanma ilə bağlı heç bir iş bu cür əlavə məkan filtrlərinin istifadəsinə xüsusi toxunmayıb. Bu səbəbdən, məsələn, bunların istifadəsinin şəxsiyyəti təsdiqləmə riskini nə dərəcədə artırdığı məlum deyil.

                                8. Məxfiliyin qorunmasında coğrafi maskalanmanın effektivliyi

                                Coğrafi maskalanmanın səmərəliliyinin qiymətləndirilməsində kritik cəhətlərdən biri də maskalanma alqoritminin yenidən kimlik tanıma riskini necə azaltdığını müəyyən etməkdir. Başqa sözlə, maskalı verilənlər bazasının aşkarlanma ehtimalı nə qədərdir? Bu, məxfiliyin qorunması ilə məlumatların faydalılığının qorunması arasında çox istədiyiniz tarazlığı tapmaq üçün vacibdir.

                                Coğrafi maskalanma ilə bağlı bir çox ilkin araşdırmalar əslində orijinal nöqtənin yerinin & # x201cbüküm və yerdəyişməsinin məxfiliyi qorumaq üçün yetərli olacağını söyləmişdir [56, 64]. Son zamanlarda bunun effektiv şəkildə həyata keçirilməsi üçün tələb olunan yerdəyişmənin xarakterini və ya miqdarını təyin etmək daha çox diqqət çəkməyə başladı [44, 46, 61, 65].

                                Xüsusi coğrafi maskalanma üsulları ilə təmin olunan məxfilik dərəcəsini təyin etmək üçün bir neçə yanaşma hazırlanmışdır. Son illərdə maraq görməyə başlayan ən geniş tətbiq olunan yanaşma & # x201cspatial k -anonimlik konsepsiyasından istifadə edir. & # X201d Bu, & # x201c k -anonimlik, & # x201d konsepsiyasını genişləndirir. cədvəlli məlumatlar üçün kəşf ehtimalı [66 & # x2013 70]. Ənənəvi k -anonimlik, müəyyən bir fərd üçün məlumatların yalnız eyni xüsusiyyətlərin kombinasiyasına malik minimum k - 1 fərdi olduqda yayımlanacağını nəzərdə tutur. K üçün müəyyən bir dəyər müəyyən edildikdə, k -anonimlik üçün gözlənilənin təmin olunmasını təmin etmək üçün məlumat cədvəlləri empirik şəkildə araşdırıla bilər.

                                K -anonimlik konsepsiyası [66] -dan uyğunlaşdırılan və Şəkil 7-də göstərilən bir nümunə ilə daha yaxşı təsvir edilmişdir. Diaqnoz, müalicə və sığorta kimi sağlamlıqla əlaqəli məlumatlara əlavə olaraq ad, doğum tarixi, cinsi, etnik mənsubiyyəti, küçə ünvanı və poçt kodu kimi fərdi identifikatorları olan sağlamlıqla əlaqəli bir sıra qeydləri nəzərdən keçirin. Məxfiliyi qorumaq üçün fərdi identifikatorların adı və ünvanı da daxil olmaqla, məlumat yayımlanmadan əvvəl silinməlidir. Bu məxfiliyi qorumaq üçün yetərli görünsə də, ictimaiyyətə açıq səsvermə qeydlərindən ibarət ikinci bir qeyd dəstini nəzərdən keçirin. Bir çox yurisdiksiyada bu qeydlər partiyanın mənsubiyyəti və son seçkilərdə iştirakın mahiyyəti kimi səsvermə ilə əlaqəli məlumatlara əlavə olaraq fərdi ad, doğum tarixi, cinsi, küçə ünvanı və poçt kodunu da əhatə edir. Səs qeydləri anonim sağlamlıq qeydlərindəki şəxsləri müəyyənləşdirmək üçün istifadə edilə bilər. Bu xüsusi nümunədə, əksər hallarda poçt kodu, doğum tarixi və cinsin birləşməsi tək bir fərdi unikal şəkildə müəyyənləşdirəcəkdir. K üçün dəyər 1 olardı, bu da təbii ki qəbuledilməzdir. Mümkün bir həll doğum tarixini doğum ili ilə əvəz etməkdir, baxmayaraq ki, bəzi hallarda bu kifayət olmaya bilər. Həqiqi məlumat sənədləri dəsti üçün k üçün empirik dəyərlər müəyyən anonimləşdirmə üsullarının yenidən müəyyənləşdirmə riskinə təsirlərini görmək üçün müəyyən edilə bilər.

                                K -anonimlik konsepsiyasının qeyd əlaqəsindən istifadə şəkli. Tibbi sənədlərdə ad və ünvan da daxil olmaqla məxfiliyi qorumaq üçün silinən bir sıra fərqli sahələr var. Ancaq səsvermə qeydləri ilə birləşdirildikdə, tibbi sənədlərdəki şəxsləri poçt kodu, doğum günü və cinsi sahələrini birləşdirərək unikal şəkildə müəyyənləşdirmək mümkün olur. Yayımlanan məlumatların verdiyi k -anonimlik qəbuledilməz dərəcədə aşağıdır. Sahəni doğum tarixi üçün silməklə (və ya doğum ili ilə əvəz etməklə), k -anonimlik əhəmiyyətli dərəcədə artır və məqbul səviyyələrə çata bilər. K -anonimlik anlayışı məxfiliyin qorunmasının kəmiyyət ölçüsünü təmin edir. Daha spesifik olaraq, məlumatların hər bir alt qrupu üçün hesablana bilən bir rəqəmdir. Tibbi qeyd və səsvermə qeydləri nümunəsi üçün, k -anonimlik üçün dəyərlər, poçt indeksi və cinsinin və ya başqa bir maraq sahəsinin bütün birləşmələri üçün buraxılmadan əvvəl hesablana bilər. [66] -dan uyğunlaşdırılıb.

                                K -anonimlik anlayışı coğrafi identifikatorları daxil etmək üçün genişləndirilə bilər. Mekansal k -anonimlik, coğrafi maskeleme texnikasını test etmək və müqayisə etmək üçün bir az diqqət çəkməyə başlayan yeni ortaya çıxan bir anlayışdır [65, 71, 72]. Qeyri-dövlət məlumatları üçün k -anonimlik kimi, məkan k -anonimliyi kəşf etmə ehtimalının kəmiyyət qiymətləndirilməsini təmin edir, lakin indi məlumatların müəyyənləşdirilməsinin əsas mexanizmi olaraq verilənlər bazası qeyd əlaqəsi əvəzinə əks coğrafi kodlaşdırma hesab olunur.

                                Mekansal k -anonimlik yerlərə əsaslanan xidmətlərdə gizliliyin qorunmasına kifayət qədər geniş tətbiq edilmişdir [71, 73 & # x2013 75]. Fərdi yaşayış yerləri kontekstində, məkan k -anonimlik yaxşı inkişaf etməmişdir. Ümumiyyətlə, yaşayış yerləri üçün məkan k-anonimliyinin qiymətləndirilməsinin təyin edilməsi, maskalanma ilə tətbiq olunan bir yerin yerdəyişmə miqdarı ilə maraqlanan yerli əhalinin sıxlığı arasındakı müqayisəyə əsaslanır. Əhali sıxlığı yüksək olan ərazidə nisbətən böyük yerdəyişmə yüksək dərəcədə məkan k -anonimlik təmin edəcəkdir. Bu məntiqi həyata keçirmək üçün təklif olunan bir yanaşmaya & # x201c ən yaxın qonşu nömrəsi & # x201d metodu deyilir, yəni maskalanmış yerə daha əvvəlki yerdən daha yaxın olan potensial yaşayış yerlərinin sayı [44, 47] , 63]. Bu yanaşma faktiki yaşayış yerlərinin empirik şəkildə müşahidə olunan paylanmasını tətbiq edir. Ən yaxın qonşu dəyərlərdən əvvəllər müzakirə edilən verilənlər bazası qeyd əlaqəsinə bənzər bir məkan k -anonimliyinin empirik qiymətləndirilməsi üçün istifadə edilə bilər. Bu yanaşmanın bir çatışmazlığı ondan ibarətdir ki, bu, yüksək qətnamə yaşayış yerləri və ya binaların mövcudluğuna əsaslanır. Həqiqi yaşayış yerlərinin paylanması əvəzinə siyahıyaalma sahələri üçün əhali sıxlığından istifadə edərək bu yanaşmada bir dəyişiklik hazırlanmışdır [61]. Maskalı məlumat dəstləri ilə əlaqəli müəyyənləşdirmə riskini araşdırmaq üçün məkan k -anonimliyini istifadə edərək az iş görülsə də, tipik bir şəraitdə daha böyük yerdəyişmələrin məkan k -anonimliyi üçün ən yüksək dəyərlərlə nəticələndiyi göstərilmişdir [44, 47, 61], gözlənilir.

                                Coğrafi maskalanma xüsusiyyətini nəzərə alaraq, orijinal yerlərin hər hansı bir yerdəyişməsi və ya narahatlığı, maskalı yerin & # x201ctrue & # x201d məkana nisbətən yaxın olması nəzəri ehtimalına hələ də imkan verəcəkdir. Lakin həqiqi məsafə kəşf ehtimalı qədər vacib deyildir, bu da məkan k -anonimliyinə əsaslanan analizlə daha effektiv xarakterizə olunur. Buna görə də, bir yer əhəmiyyətli bir məsafədə yerini dəyişdirsə, lakin məkan k -anonimlik dəyəri hələ də çox azdırsa, kəşf ehtimalı hələ də böyükdür. Bu, az miqdarda yerdəyişmənin belə məxfiliyin lazımi dərəcədə qorunmasını təmin edə bilməyəcəyi aşağı sıxlıqlı bir kənd ərazisindəki vəziyyət ola bilər.

                                Fərdi səviyyəli yerləri dərc edərkən məxfiliyin qorunması üçün standart hazırda mövcud deyil. Bununla birlikdə, tədqiqatçılar üçün ümumi bir təlimat olaraq, belə bir standart yüksək səviyyədə məkan k -anonimlik əldə etməyə əsaslanır. Coğrafi maskeleme texnikaları üzərində araşdırma üçün əsas sual, bu səbəbdən kosmik k -anonimlik üçün yüksək dəyərlər əldə etmək üçün hansı coğrafi maskeleme parametrlərinin lazım olmasıdır? Daha konkret olaraq, müəyyən bir verilənlər bazası üçün k -anonimliyin müəyyən edilmiş minimum səviyyəsini təmin etmək üçün hansı coğrafi maskalanma parametrləri lazımdır? Məkan k -anonimliyi üçün indeks şəklində kəşf etmə ehtimalının ölçülə bilən ölçüsünün istifadəsi bu düşüncə xəttini xeyli asanlaşdırır. Məsələn, Boston, MA (ABŞ) bölgəsindəki təcili yardım şöbəsi ziyarətlərinin konkret bir vəziyyət araşdırması üçün, ortalama 0.25 & # x2009km yerdəyişmənin 99 & # üçün 20 və daha yüksək bir məkan k -anonimlik dəyərinə səbəb olduğu aşkar edilmişdir. x25 orijinal yerlərdən [61].

                                Fərqli coğrafi maskalanma texnikasının effektivliyini müqayisə edən təəccüblü dərəcədə az araşdırma aparılmışdır. Əksər tədqiqatlar müəyyən bir ssenari kontekstində yalnız bir metodu araşdırmışdır. Bu müqayisəli tədqiqatların olmamasına baxmayaraq, minimum miqdarda yerdəyişməni tətbiq etdikləri üçün çörək maskalanması və bimodal Qaussiya yerdəyişməsinin digər texnikalara nisbətən üstünlük verilməsi barədə ümumi bir razılığın olduğu görünür. Bir dairə içərisində təsadüfi narahatlıq və sadə Gauss köçürülməsi, orijinal yerlərə çox yaxın olan maskalı yerlərlə nəticələnə bilər. Sadə Qaus köçkünlüyü üçün bu yaxınlıqdakı yerlər ən çox ehtimal olunur. Bu, arzuolunmazdır, çünki əks coğrafi kodlaşdırma yolu ilə müəyyənləşdirmə riski yüksəkdir. Bu arqument məntiqlə dəstəklənsə də, bu potensial üstünlükləri nümayiş etdirmək üçün az sayda tədqiqat empirik analiz vermişdir [46]. Maskeleme texnikasının müqayisəli analizinin olmaması arzuolunan gələcək tədqiqat istiqamətləri üçün aydın bir göstəricidir.

                                9. Maskalı məlumatların birdən çox yayılması və maskalanma metodlarının açıqlanması

                                Gizlilik, eyni maskalı məlumat dəstlərinin birdən çox versiyasını buraxmaqla pozula bilər [57]. Məsələn, yer haqqında məlumatların yayımlanmasına cavabdeh bir qurum, hər bir buraxılışın unikal olmasını təmin etmək üçün coğrafi maskalanma alqoritmini müəyyən bir verilənlər bazası üçün hər tələb ilə yenidən işə sala bilər. Bu cür bir çox buraxılış mövcud olsaydı, orijinal yerlərin tanınmasına kömək etmək üçün bunlar birləşdirilə bilər. Ən azından nəzəri olaraq birdən çox buraxılış, maskalı məlumat dəstlərini yaratmaq üçün istifadə olunan maskalanma alqoritmini tərs tərtib etməyə imkan verir. Bu səbəbdən, maskalanma alqoritminin özü buraxılmasa da, məlumatların bir neçə dəfə yayımlanması, şəxsiyyətin artırılması riskinə səbəb ola bilər.

                                Fərqli maskalanma üsulları, bu müəyyənləşdirmə formasına olan etibarlılığı ilə fərqlənəcəkdir. Bununla birlikdə, əsas formada olan texnikaların çoxu simmetrikdir (yəni yer dəyişdirmə istiqaməti təsadüfi və yerdəyişmə məsafəsi istiqamətdən asılı deyil). Nəticədə, çox sayda maskalı yerin ortalama yeri orijinal yerə yaxınlaşmağa başlayacaq. Ayrı maskalı yerlər bir-birinə yaxın olduqda və bu səbəbdən də maskalı məlumat dəstlərinin birdən çox versiyasında fərqlənə bilmədikləri təqdirdə əlavə narahatlıq tətbiq edilə bilər. Bununla belə, bu ssenaridə belə, birdən çox maskalı məlumat setindəki birdən çox yerin ortalama yerləşməsi, maskalanma metodlarına dair anlayışlar təmin edəcək və bu da açıqlama riskinin artmasına səbəb olacaqdır. Bu təsir coğrafi maskalanma ilə bağlı ədəbiyyatda tanınsa da [57, 58], çox məhdud empirik testlər aparılmışdır.

                                Diqqətə çatdırılacaq əlavə bir cəhət, xüsusi coğrafi maskeleme texnikasının maskalı verilənlər bazası ilə birlikdə buraxılmasıdır. Şübhəsiz, alqoritm haqqında məlumat, orijinal yeri müəyyənləşdirmək üçün əlavə məlumat verir. Ters coğrafi kodlaşdırma istifadə edərək coğrafi kodlu yerlərin müəyyənləşdirilməsinə bənzər şəkildə, maskalı yerlər & # x201creverse coğrafi maskalanma ilə müəyyən edilə bilər. & # X201d Bu ədəbiyyatda bir qədər diqqət çəkmişdir [57], lakin məlumat dəstləri və maskeleme baxımından məhdudlaşdırılmışdır. metodlar. Fərqli maskalanma üsullarının, bu şəxsiyyətin müəyyənləşdirilməsi formasına olan etibarlılığı ilə dəyişəcəyi gözlənilir. Məsələn, təsadüfi istiqamət və sabit radius metodunun bu baxımdan çox güclü olması gözlənilmir.

                                10. Maskalanmanın məkan-analitik metodlara təsiri

                                Tipik olaraq, fərdi səviyyəli sağlamlıq məlumat dəstlərini bəzi formalarda buraxmağın ən cəlbedici səbəbi, eyni məlumatların ümumiləşdirilmiş və ya məkan baxımından toplanmış versiyalarından daha faydalı məlumat təmin etmələridir. Bir çox analiz növü yalnız fərdi məqamlardan istifadə etməklə mümkündür. Bu səbəbdən bu məlumat dəstlərinin xüsusiyyətlərinin coğrafi maskalanma ilə nə dərəcədə qorunub saxlanıldığını müəyyənləşdirmək çox vacibdir. Coğrafi maskalanma xüsusiyyətləri orijinal nöqtə yerlərinin xüsusiyyətlərinə bənzəməyən bir nöqtə nümunəsi ilə nəticələnirsə, fərdi səviyyəli verilənlər bazası çox daha aşağı analitik dəyərə malikdir.

                                Coğrafi maskalanmanın bir sıra yerin məkan-analitik xüsusiyyətlərinə təsiri ilə bağlı araşdırma, maskeleme texnikasının məxfiliyin qorunması ilə müvafiq məkan əlaqələri əldə etmək bacarığı arasında mənalı bir tarazlıq yaratdığını müəyyən etmək üçün vacibdir. Bundan sonra bu mövzuda aparılan araşdırmaların xülasəsi verilmişdir. Franklin County, Ohio, Kwan et al. [56] iki fərqli maskeleme texnikasının təsirlərini araşdırmaq üçün ağciyər xərçəngi səbəbindən 541 ölümün yaşayış yerlərini istifadə etdi: sabit radius ilə təsadüfi istiqamət və hər iki metod üçün fərqli radiuslardan istifadə edərək bir dairə daxilində təsadüfi yerləşdirmə. Maskalanmanın təsirləri kernel sıxlığının qiymətləndirilməsi və çarpaz K funksiyası istifadə edilərək təyin olundu. Tapıntılar narahatlıq miqdarı ilə analitik nəticələrin dəqiqliyi arasında ardıcıl bir alış-veriş göstərdi [56]. Bimodal Gauss yerdəyişməsindən istifadə edərək maskalanmış nöqtə yerlərinin süni qruplarından istifadə edilən bir iş SaTScan istifadə edərək klaster aşkarlanmasının möhkəmliyini araşdırdı [61]. Nəticələr, orta yerdəyişmə məsafəsinin artması ilə klasterin aşkarlanması həssaslığında və spesifikliyində tədricən azalma olduğunu göstərdi. Ev səyahətləri anketlərinə dair bir araşdırmada, seçilmiş bir sıra ev təsərrüfatları üçün pişi maskası tətbiq edildi və maskalanmanın qurma mühiti ölçülərinə təsiri araşdırıldı [60]. Nəticələr, daha böyük yerdəyişmə məsafələri ilə bu tədbirlərin tətbiqində tədricən azalma olduğunu göstərdi. Oğurluqların yeri ilə bağlı aparılan bir araşdırma, maskalanmanın məkan nöqtəsi nümunələri ölçülərinə (Ən Yaxın Qonşu İndeksi) və məkan toplanmasından sonra qruplaşma tədbirlərinə təsirini təyin etdi (Moran & # x2019s I) [47]. Nəticələr, 250 & # x2009m-ə qədər yerdəyişmələr üçün coğrafi maskalanmanın çox kiçik təsirlərini göstərdi. Süni nöqtələrin maskalı versiyalarından istifadə olunan bir tədqiqat, kernel sıxlığının qiymətləndirilməsinin möhkəmliyini [50] təyin etdi və axtarış radiusunun (və ya bant genişliyinin) güclü təsirini tapdı. Axtarış radiusunun 1/5-dən çox olan yerdəyişmələrin son nəticələrdə əhəmiyyətli fərqlərə səbəb olduğu aşkar edildi.

                                Coğrafi maskalanmanın məkan-analitik texnikanın möhkəmliyinə təsiri barədə ədəbiyyat nisbətən məhduddur. Bununla birlikdə, ədəbiyyatın daha geniş tərkib hissəsindən coğrafi kodlaşdırmada yer alan səhvlərin məkan analizlərinə təsiri barədə dərslər əldə edilə bilər [1, 13 & # x2013 16, 18, 20, 76 & # x2013 82]. Coğrafi maskalanma bir coğrafi kodlama xətası növü olmasa da, məkan təhlilindəki xalis təsir çox oxşardır: yerlər sistematik şəkildə yer dəyişdirilir və bu, bu yerləri giriş olaraq istifadə edərək məkan analitik prosedurlarında müəyyən bir səhv gətirir. Birincil fərq, coğrafi maskalanmadakı yerdəyişmələrin çox spesifik bir aralığa düşməsi və çox vaxt vahid və ya normal paylanmanı izləməsidir, coğrafi kodlaşdırmada mövqe səhvləri isə log-normal paylanmanı izləyir [16, 83]. Bu o deməkdir ki, coğrafi kodlaşdırma istifadə edilərək əldə edilmiş bir sıra yerlər, nisbətən kiçik bir səhv (100 metrə qədər və ya orada) olan yerlərin böyük bir nisbətini və daha böyük bir səhvlə (bir neçə yüzə qədər) daha kiçik, lakin əhəmiyyətsiz olmayan nisbəti ehtiva edir. metr və ya hətta kilometr). Bu fərqə baxmayaraq, coğrafi kodlaşdırma ədəbiyyatı məkan yerdəyişməsinin məkan təhlilinin nəticələrinə təsirləri barədə bəzi faydalı fikirlər verir. Ümumiyyətlə, bu tədqiqat effektlərin analiz metodunun tipinə və analizin spesifik miqyasına çox asılı olduğunu göstərir. Məsələn, kernel sıxlığı təhlili üzərində aparılan tədqiqatlar, nəticələrin möhkəmliyinin, çox etibarsız nəticələr yaradan radius üçün çox kiçik dəyərləri olan kernelin [15] qurulmasında istifadə olunan axtarış radiusundan çox asılı olduğunu göstərir. Eynilə, siyahıyaalma sayım vahidləri ilə uyğunlaşma, istifadə edilən çoxbucaqların tipik ölçüsündən asılıdır, daha kiçik vahidlər analizdə daha böyük səhvlərlə nəticələnir [15, 84].

                                Əksər tədqiqatlar coğrafi maskalanmanın çox spesifik məkan-analitik prosedurlardan istifadə edərək təsirini araşdırsa da, daha az texniki yanaşmalardan da istifadə edilmişdir. Məsələn, [62, 64] maskalanma texnikasının nöqtə naxışlarının vizual təsirinə təsirini müəyyənləşdirmək üçün insan tədqiqat subyektlərindən istifadə etmişdir.

                                11. Maskeleme üçün alternativlər

                                Coğrafi maskeleme metodları 10 ildən çoxdur inkişaf mərhələsindədir. Bir neçə fərqli maskeleme texnikasının inkişafına baxmayaraq, müəyyən bir tapşırıq üçün ən uyğun olan texnikanın ümumi bir fikri yoxdur. Maskeleme texnikasının hazırlanması və test edilməsindəki irəliləyişə əsasən, coğrafi maskalanma sahəsindəki irəliləyişlərin müəyyən bir texnika dəstinin geniş tətbiq edilməsinə və tövsiyəsinə səbəb olub-olmadığı aydın deyil. Buna görə hansı alternativlərin olduğunu nəzərdən keçirməyə dəyər. Bu alternativlər bir sıra kateqoriyalara bölünür.

                                Daha ənənəvi coğrafi maskalanma üsullarından biri də məlumatların daha mürəkkəb məkan manipulyasiyalarının istifadəsidir. Təklif olunan yanaşmalar məkan düzəldilməsini [85], çoxsaylı imputasiyanı [86] və xətti proqramlaşdırmanı əhatə edir [65]. Bu metodlar məkan analitik metodlarından istifadə edərək orijinal yerləri idarə etsə də, coğrafi maskeleme üsulları olaraq adlandırılanların altına girmirlər.

                                Coğrafi maskalanmaya daha radikal alternativ sintetik məlumatların istifadəsidir. Bu yanaşmada, orijinal məlumatların xüsusiyyətlərinə çox bənzər xüsusiyyətlərə malik bir verilənlər bazası yaradılır, lakin bütün fərdlərin şəxsiyyətləri dəyişdirilmişdir. Bu yanaşma cədvəlli məlumat dəstləri üçün uğurla hazırlanmışdır [87].

                                Proqram agentləri başqa bir alternativ təqdim edirlər. Bu yanaşmada, müəyyənləşdirilə bilən detalları yayımlamadan orijinal fərdi məlumat qeydlərinə nəzarət təmin etmək üçün proqram təminatından istifadə olunur [88]. Analiz nəticələri fərdi qeydlərə əsasən geri qaytarılır. Bu yanaşma, məkan baxımından ümumiləşdirilmiş məlumatların yayımlanması ilə təqdim olunan məhdudiyyətlərdən əziyyət çəkmir. Orijinal məlumatların müəyyən xüsusiyyətlərinin təhlil nəticələrindən çıxarıla biləcəyi ilə bağlı bir narahatlıq var, lakin ümumiyyətlə təkrar tanınma riski, fərdi səviyyəli maskalı məlumat dəstlərinin sərbəst buraxılmasına nisbətən daha azdır [88]. Konsepsiya baxımından çox ümidverici olsa da, məxfi sağlamlıq məlumatlarını idarə etmək üçün proqram təminatlarının istifadəsi, qismən yanaşmanı həyata keçirmək üçün etibarlı kompüter infrastrukturunun yaradılması ilə bağlı çətinliklər səbəbindən çox geniş yayılmamışdır.

                                Yenə də başqa bir alternativ, ənənəvi siyahıyaalma vahidlərindən daha incə, lakin dəqiq fərdi yerləri ortaya çıxarmayan çevik toplama metodlarından istifadə etməkdir [89]. Bu cür çevik toplama metodları, şəxsiyyətin müəyyənləşdirilməsi riski üçün asanlıqla ölçülən bir ölçü təmin edir, eyni zamanda məlumatların faydalılığının azalmasını məhdudlaşdırmaq üçün toplama dərəcəsini minimuma endirir.

                                Coğrafi maskalanmaya bir sıra alternativlər ortaya çıxsa da, müəyyən bir tətbiq üçün müxtəlif yanaşmaların nisbi üstünlüklərini araşdırmaq üçün müqayisəli tədqiqatlar aparılmamışdır. Nəticə olaraq, coğrafi maskeleme metodunun nə vaxt tətbiq ediləcəyi və alternativlərin nə vaxt istifadə ediləcəyi barədə dəqiq bir rəhbərlik yoxdur.

                                Coğrafi maskalanma üzrə artan biliklər, müəyyən bir tədqiqat sahəsi üçün xüsusi bir maskeleme texnikasının təmin etdiyi məxfilik dərəcəsinin kəmiyyət qiymətləndirilməsinin mümkün olduğunu göstərir. Coğrafi maskalanmanın spesifik analitik texnikanın möhkəmliyinə təsirlərini kəmiyyət olaraq müəyyənləşdirmək mümkündür. Bu, məxfiliyin qorunması və məlumat faylı arasında bir tarazlığın müəyyən bir ssenari üçün texniki cəhətdən mümkün olduğunu göstərir. Bu son irəliləyişə baxmayaraq, hazırda dünyada qəbul edilmiş və ya təsdiqlənmiş bir coğrafi maskeleme metodu yoxdur. Tədqiqat və maliyyələşdirmə agentlikləri hansı maskalanma metodlarından və ya bunlardan necə istifadə ediləcəyinə dair heç bir rəhbərlik vermir.

                                Bu boşluğu ehtimal ki, bir sıra amillərə aid etmək olar. Birincisi, məxfilik məsələləri barədə məlumatlılıq yüksək olsa da, əksər sağlamlıq tədqiqatçıları arasında məkan savadlılığı yüksək deyil. Coğrafi kodlaşdırma və əsas məkan təhlil üsulları ictimai səhiyyə tədqiqatlarında geniş yayılmışdır, lakin əks coğrafi kodlama, coğrafi maskeleme və məkan k -anonimlik kimi mövzular hələ əsas ictimai səhiyyə tədqiqatlarının lüğət tərkib hissəsi olmamışdır. İkincisi, coğrafi maskalanma ilə bağlı tədqiqatların sayı hələ də nisbətən azdır və tədqiqat cəmiyyəti bir sıra fərqli ssenarilər üçün təsirli ola biləcək müəyyən metodlar üçün çox güclü bir vəziyyət təqdim etməyib. Üçüncüsü və bəlkə də ən əhəmiyyətlisi, coğrafi maskalanmanın məxfiliyi qorumaq üçün bir neçə yanaşma arasındakı ən yaxşı alternativi təqdim edərkən təhlil və nəzarət məqsədləri üçün fərdi səviyyəli məlumatlara nəzarətli bir giriş təmin etdiyi aydın deyil. Coğrafi maskalanma açıq şəkildə vəd versə də, texniki cəhətdən nəyin edilə biləcəyi ilə məhdudlaşır və alternativ yanaşmalar xüsusi tətbiqetmələr üçün eyni ümumi hədəflərə çatmaqda daha təsirli ola bilər.

                                Bu, gələcək tədqiqatlar üçün bir sıra fərqli yollar təklif edir. Birincisi, coğrafi maskalanma ilə bağlı araşdırmalar ilk mərhələdədir və mövcud yanaşmaları müqayisə etmək və yenilərini inkişaf etdirmək üçün daha çox işə ehtiyac var. İkincisi, coğrafi maskalanma ilə bağlı texniki təlimatlara ehtiyac var. Georeferans edilmiş fərdi səviyyədə sağlamlıq məlumatlarının necə və necə yayımlanacağına dair qərarlar açıq-aşkar texniki meyarlara əsaslanmasa da, coğrafi maskalanma imkanlarını və məhdudiyyətlərini daha yaxşı başa düşmək daha məlumatlı qərarlara kömək etməlidir. Üçüncüsü, coğrafi maskalanmanın bir neçə alternativi hazırlanmışdır və bu yanaşmaların güclü və zəif tərəflərini daha köklü maskalanma metodlarına nisbətən müqayisə etmək üçün araşdırma aparmaq lazımdır.

                                Digər tərəfdən tədqiqatçılar bunu ən yaxşı şəkildə necə yerinə yetirəcəyinə dair dəqiq rəhbərlik olmadığı təqdirdə məxfi yerlərin coğrafi maskalanmasından istifadə edərək xəritələr dərc edirlər. Bu cür xəritələri dərc edən hər hansı bir tədqiqatçıya mövcud olan müxtəlif texnika və bunlarla əlaqəli müəyyənləşdirmə riskləri ilə yaxından tanış olmaq tövsiyə olunur.


                                Ümumi müraciət konsepsiyaları: Qisa bir araşdırma

                                Daha əvvəl təqdim edilmiş konsepsiyaların kifayət qədər geniş olub olmadığını yoxlamaq və bu sənəddə müəyyənləşdirilmiş mənbələrin xeyrinə mübahisələrimizi gücləndirmək üçün dünya səviyyəli bir təşkilatın saxladığı ofislər siyahısındakı ünvanların təhlili və müalicəsi halını nəzərdən keçirin. , məsələn Greenpeace. Cədvəl 1-də Greenpeace ofislərinin 20 ünvanı, Dipnot 2-nin hər biri ayrı bir ölkədə. Açıqca bir P.O.-ya əsaslanan poçt ünvanlarını seçmədik. qutu və ya bənzəri, çünki hər bir ünvanın həqiqi quruluşu və içərisində olan yer adları ilə maraqlanırıq. Cədvəl 2 modelimizə (əsas yol növü, yol adı, bina nömrəsi, bina adı, qonşuluq, şəhər, əyalət, ölkə, poçt kodu və tamamlayıcı) görə əsas komponentlərini ayıraraq eyni ünvanları göstərir. Bu tərtibdə heç bir ünvan bu komponentlərin hamısını əhatə etmir və bütün adreslər tərəfindən heç bir komponent istifadə olunmur. Məşhur yerlərin adları ünvan kimi istifadə olunur: məsələn, Greenpeace-in Meksika filialı, İspan bölgəsinin də adı olan Andalucia adlı bir küçədə və ya prospektdə yerləşir. Bu cür qeyri-müəyyənliklər, müəyyən coğrafi yerlərə istinad edən səhifələr tapmağa çalışarkən mövcud Veb axtarış motorlarını səmərəsiz edir. Nə çağırdıq dövlətlər nümunədə və kağızın qalan hissəsi arasında hər hansı bir hiyerarşik səviyyəyə istinad edə bilər şəhərölkəilçeler, vilayətlər və ya ərazilər kimi.

                                Ümumdünya bir standartın olmadığını düşünərək, indi poçt qurumları tərəfindən tanına biləcək hər bir ünvana koordinat təyin etmək niyyətini nəzərə alaraq bütün bu ünvanlama sistemləri arasında bəzi ümumi xüsusiyyətləri göstərə bilərik. Anlayışları küçə (və ya ümumiyyətlə, yol), bina nömrəsi (və ya ad / identifikator), qonşuluqşəhər və ya bələdiyyə kimi bəzi kadastr xarakterli anlayışlara baxmayaraq, hər tərəfdən təxminən eyni görünür blok, ünvan istinadları kimi istifadə olunur. Poçt kodları ünvanlarda da faydalıdır, çünki dünyanın hər yerində fərqli formatlara sahib olsalar da əhali tərəfindən geniş istifadə olunur. Yarımçıq, qeyri-dəqiq və ya istifadəsi çətin olan ünvanlarla əlaqələndirilə bilər dolayı istinadlarşəhər daxilində fərqli əlamətdar yerlər və ya ictimaiyyət tərəfindən geniş tanınan və tanınan nöqtələr kimi düşünülə bilər. Bu istinadlar nöqtələr, ölçüləri kiçik olduğu halda və ya adlarının geniş bir torpaq sahəsi ilə əlaqəli olduğu sahələr kimi düşünülə bilər.

                                Nəticə olaraq, ünvanları mücərrəd məlumat tipləri kimi qəbul edə biləcəyimizi müşahidə edirik, burada yerləri birmənalı olaraq təyin etmək üçün komponentlərin alt hissəsi tələb olunur. Hər bir komponentin rolu ünvanda dəyişir. Var:

                                Yalnız inteqrasiya edilmiş bir dəst kimi istifadə edildikdə yeri göstərən komponentlər, bina nömrələri öz-özlüyündə mənasızdır, həmişə bir prospekt ilə əlaqələndirilməlidir.

                                Tamamlayıcılar vəziyyətində olduğu kimi, digər komponentlər və ya bir sıra komponentlər tərəfindən verilən yer üzərində dəqiqləşdirmə edən komponentlər

                                Poçt kodları kimi yerləri iyerarxik olaraq təqrib edən komponentlər

                                Bina adları və ya məhəllələr kimi bəzi kontekst verilmiş yeri göstərən komponentlər, ayrılma üçün, olduqları şəhərin qurulmasının çox vaxt lazım olduğu.

                                Daha əvvəl göstərildiyi kimi ünvanlama sisteminin və onun komponentlərinin semantikasını nəzərə alaraq və dünyanın müxtəlif yerlərində ünvanlamanın necə işlədiyini müşahidə edərək, ünvanın coğrafi mövqeyinə ardıcıl yaxınlaşma iyerarxiyasını çıxara bilərik (Şəkil 3).

                                Konsepsiyalar iyerarxiyasına müraciət.

                                Bu məqalədə təklif olunduğu kimi modelləşdirilmiş bir verilənlər bazasından istifadə edərək və Şəkil 3-dəki hiyerarşiyi nəzərə alaraq tətbiqetmələr hazırlana bilər ki, (1) lazımi dəqiqlik dərəcəsi yerinə yetirildiyi təqdirdə coğrafi kodlama dayana bilər və ya (2) bir yer belə təmin edilə bilər. bəzi ünvanlayıcı komponentlər olmadıqda. Birinci vəziyyətə bir nümunə olaraq, yeni bir mağaza üçün ideal yeri müəyyənləşdirmək üçün hər bir qeydiyyatdan keçmiş müştərinin yaşayış şəhərini müəyyənləşdirmək üçün yetərli olan ümummilli əhatə dairəsi olan bir geomarket tətbiqini nəzərdən keçirin. İkinci halda, yoluxucu bir xəstəliyə yoluxmuş insanların yaşayış yerini mümkün qədər dəqiq müəyyən etməsi lazım olan epidemiologiya üzrə bir xalq sağlamlığı sistemini nəzərdən keçirin. Şəhərin konsolidə edilmiş ərazilərində yer, son inkişaflardakı fərdi ünvanlar vasitəsi ilə əldə edilir, bunun üçün ünvan məlumatları kifayət qədər təfərrüatlı deyildir, məhəllə hüdudlarından istifadə edilərək yer yaxınlaşdırılır.

                                Bu bölmədə göstərilənlər kimi ünvanları tanımaq və tapa bilmək üçün yer adları və yerlərini ehtiva edən verilənlər bazaları tələb olunur. Ünvan məlumat bazaları ümumiyyətlə bu cür ölkələrdə yüksək keyfiyyətli və ucuz qiymətə təqdim olunan milli informasiya infrastrukturu strategiyasının bir hissəsi kimi mövcuddur. Bu tip məlumatların ən qabaqcıl nümunəsi Topoloji Integrated Coğrafi Kodlama və İstinad (TIGER) sənədləridir [27]. Özəl sektor şirkətləri bu materialı əldə edir və onun təkmilləşdirilməsinə investisiya qoyurlar, beləliklə ünvan məlumat bazalarının dəyərli bir iqtisadi varlıq ola biləcəyini nümayiş etdirirlər. İngiltərədə Ordnance Survey, ölkə daxilindəki 1.6 milyon fərqli poçt kodu üçün koordinat siyahısı ilə birlikdə 25 milyondan çox yeri olan bir ünvan nöqtəsi bazasında lisenziyalar istehsal edir və satır [16]. Bir ünvan veritabanı mövcud olsa da, ünvanlama sisteminin Amerika və İngilis hallarından xeyli fərqli olduğu bir çox şəhər var və bu səbəbdən ticarət CBS paketləri tərəfindən təmin edilən coğrafi kodlama metodları gözlənildiyi kimi işləməyəcəkdir.

                                Braziliya və Hindistan kimi yeni inkişaf etməkdə olan ölkələrdə, ümumiyyətlə, ünvanlardan dəqiq və tez bir zamanda mövqelər yaratmaq üçün belə tam və mütəşəkkil bir ünvan məlumat bazası yoxdur. Bunun şəhər coğrafi tətbiqetmələri üçün nəticələri bir-birinə bənzəyir, çünki coğrafi əlaqələndirmə nöqtəsi məlumatları daha uzun çəkə bilər və bu da tutarlılıq və dəqiqlik problemlərindən zəif məlumat keyfiyyətinə səbəb ola bilər. Bundan əlavə, yeni çıxmaqda olan ölkələrin böyük şəhərlərində tez-tez gecəqondular, kölgəli şəhərlər və qeyri-qanuni işğal ilə xarakterizə olunan digər az gəlirli ərazilər mövcuddur və əksər hallarda bu ərazilərdə hər yaşayış evində bir lövhə belə yoxdur. Ayrıca, bir çox hallarda, məlumat çatışmazlığı və sürətli və xaotik böyümənin və nizamsız torpaq işğalının üstünlük təşkil etdiyi yerlərdə ətraflı məlumat bazası yaratmaq və saxlamaq xərcləri səbəbindən ünvanlama verilənlər bazası lazım olduğu qədər tam deyil.

                                Yenidən istinad olunan məlumat bazalarının faydası elədir ki, bir çox yerlərdə yerli idarəetmə idarələri və infrastruktur xidmət təminatçıları alfasayısal kadastrlardan və şərti kartoqrafik mənbələrdən əldə edilən məlumatlardan istifadə edərək davamlı olaraq onların yaradılması və saxlanmasına investisiya qoyurlar. Bu cür məlumat mənbələrinin yaradılması üçün tez-tez müəyyən bir standart olmadığından, xüsusən epidemiologiya və cinayətkarlıqla mübarizə kimi sahələrdə çox sayda yerdən-yerə istinad edilmiş məlumatlarla işləməli olan regional və ya milli səylər ciddi şəkildə əngəllənir [17]. İndi təklif olunan verilənlər bazası şemasına əsaslanan və müraciət konsepsiyalarının iyerarxiyasını nəzərə alan coğrafi kodlama alətləri və texnikalarının tərifinə keçirik.


                                Bölmə 46: Ünvan uyğunluğu

                                Aşağıdakı nümunələr ünvan coğrafi kodlaşdırmanın tətbiq oluna biləcəyi tipik problemlərdir. Çox vaxt sualları cavablandırmaq üçün sadəcə xəritədəki məlumatları vizuallaşdırmaq kifayətdir. Bununla birlikdə, coğrafi kodlaşdırma prosesi tez-tez məlumatların əlavə məkan təhlili üçün hazırlanmasında istifadə edilən ilkin bir addımdır.

                                Nümunə tətbiqetmələr

                                İştirak edən şirkətlər, fərdlər, həkimlər və yerli xəstəxana və diaqnostika müəssisələri barədə məlumatlar daxil olmaqla bir neçə məlumat bazasını saxlayırsınız. Bu məlumat bazalarını çeşidləyərək öyrənərək xəstələrin harada yaşadığını və ya həkimlərin və müəssisələrin yerləşdiyini təsəvvür etmək çətindir. Xoşbəxtlikdən, bütün verilənlər bazalarında ünvan məlumatlarını ehtiva edən bir sahə var.

                                Təlim nəticələri

                                Xəbərdarlıq:

                                Bacarıq:

                                Təlimin məqsədi həm əsas sənədlərin, həm də ünvan sənədlərinin düzgünlüyünü effektiv qiymətləndirmək, ünvan sənədlərini standartlaşdırmaq, uyğunsuzluqları qiymətləndirmək, yenidən görüşmə prosesini başa düşmək və ünvan sənədində verilən atribut məlumatlarını istifadə edərək əsas yenidən təsnifat analizini aparmaqdır. (Təklif olunan vaxt: bir 50 dəqiqəlik vahid)

                                Hazırlıq bölmələri:

                                Bölmə 19 Cədvəlli verilənlər bazasının planlaşdırılması

                                Təlimatçı üçün çox tövsiyə olunan fon

                                Bölmə 016 GIScience-də NCGIA Əsas Tədris Planı: Ayrı-ayrı Yerləşdirmə

                                Şüur

                                Təlim məqsədləri:

                                  • Dövlət mənbələri
                                    • CD-də, kitabxanalardan, onlayn (http://www.census.gov/geo/www/tiger)
                                    • Müvafiq proqram formatına çevrilməlidir
                                    • İlçe tərəfindən düzəldilmiş və içərisində olan xətt sənədləri

                                    Siyahıya alma statistik sərhədləri

                                      • Normalda yalnız mahalın dəstəklədiyi formatda mövcuddur
                                      • Müvafiq proqram formatına çevrilməsini tələb edir
                                      • Məlumat tədarükçüləri
                                        • Müxtəlif satıcılardan əldə etmək olar
                                        • Ətraflı TIGER sənədləri
                                        • Daha dəqiq və müasir ola bilər (yer və atribut)
                                        • Xüsusi proqram formatına çevrilmişdir

                                        (Qrafik 1: GBF yolunun nümunəsi: inset graphic1.bmp)

                                          • Ümumiyyətlə sarı səhifələrdəki girişlər vasitəsilə toplanan ünvan sənədləri əldə edilə bilər
                                            • Onlayn rejimdə CDROM-da mövcuddur (vahid 016 NCGIA Əsas Tədris Planı GeoScience, bölmə 5.1.1)
                                              • Məkanın müəyyənləşdirilməsi
                                                • Oturma obyektləri
                                                  • Nümunələrin müəyyənləşdirilməsi:
                                                    • Çatdırılma:
                                                      • Bazar təhlili
                                                        • Yer istənilən vaxt birbaşa georeferenced edilə bilməz
                                                          • Əksər masa üstü paketlərin ünvan uyğunluğu imkanları var
                                                          • Bəzi paketlərdə coğrafi əsas sənədlər var
                                                          • Proqram aşağıdakı imkanları özündə birləşdirməlidir:
                                                            • Ünvan sənədlərindəki səhvlərə dözümlü olun
                                                            • "Demək olar ki" matçların nəzərdən keçirilməsinə və nəzərdən keçirilməsinə icazə verin
                                                            • Dəyişdirilməsini təmin edin
                                                              • Həm ardıcıl partiyada, həm də tək hadisə rejimində fəaliyyət göstərin
                                                                • İstinad sənədləri (Coğrafi əsas sənədlər (GBF))
                                                                  • Ünvanlar cədvəli və digər atribut məlumatları
                                                                    • Proqram təminatı

                                                                    Səriştəlilik

                                                                    Təlim məqsədləri:

                                                                    1. Nəticədə nöqtə məlumat qatlarının vizual analizini aparın.
                                                                    2. Praktiki İş: coğrafi kodlaşdırma.

                                                                    yəni poçt kodu, hamısı bir sahədə, zip + 4

                                                                    Küçə boyunca, yəni ev nömrəsi, sıra ilə tək ev, küçənin sol və ya sağ tərəfində nə olduğu barədə məlumat yoxdur ABŞ zonaları, yəni ev, bir küçə boyunca, solda və ya sağda nə olduğu barədə məlumat. küçənin yan tərəfi (poçt kodu bazası faylı nümunəsi: ziptble.jpg linki)

                                                                      • Ünvanlar bir hadisənin və ya hadisənin yeri haqqında məlumat verir
                                                                      • Ümumiyyətlə standart format nəzərə alınmadan toplanır: xüsusiyyətləri müəyyənləşdirmək üçün standart bir metod yoxdur
                                                                        • Tez-tez səhvlər və səhvlər var
                                                                          • Fayllar ABŞ Poçt Xidməti formatı (http://www.usps.gov/ncsc/vendors) istifadə edərək ticari olaraq standartlaşdırıla bilər.
                                                                          • Ünvan faylı nə qədər tam və standartlaşdırılsa, ünvan uyğunlaşma prosesi bir o qədər uğurlu olur
                                                                            • Məlumat hazırlayın
                                                                              • Əsas və ünvan sənədlərini müəyyənləşdirin
                                                                              • Ünvan üslubunu təyin edin
                                                                                • Arayış və ünvan sənədləri üçün uyğun strategiyaları müəyyənləşdirin

                                                                                Hansı sahələr uyğun olacaq?

                                                                                  • Əsas və ünvan sənədlərini standartlaşdırın
                                                                                  • Əsas faylı hazırlayın: Məlumatları ayrı sahələrə ayırın və qısaltmaları standartlaşdırın (bu, ümumiyyətlə məlumat təminatçısı tərəfindən edilir)
                                                                                  • İndeks
                                                                                    • Veriləri ayrı-ayrı sahələrə ayıraraq və çeşidləyərək Ünvan Cədvəlini hazırlayın (bu proqram tərəfindən həyata keçirilir)
                                                                                    • Ünvan sənədini GBF ilə uyğunlaşdırın
                                                                                      • Müqayisə metodlarını təyin edərək ünvan sənədinin əsas istinad sənədinə necə keçid verəcəyini müəyyənləşdirərək uyğunluq prosesini qurun (bu, təyin etdiyiniz parametrlərə əsasən proqram tərəfindən həyata keçirilir)
                                                                                        • Ünvan sənədini sahə üzrə baza istinad faylı sahəsi ilə müqayisə edir
                                                                                          • Ünvanı simvolla müqayisə edir
                                                                                            • Uyğun hesabı hesablamaq üçün ehtimalları göstərin
                                                                                              • Qarşılaşmanı həyata keçirin
                                                                                                • Proqram bir matçın nə qədər yaxın olduğunu aşkarlayır
                                                                                                • Ünvan yerini təyin etmək üçün küçə şəbəkəsi boyunca interpolatlar
                                                                                                  • Tapılan hər ünvan üçün bir nöqtə olan yeni coğrafi məlumat qatını yaradın
                                                                                                    • Nəticədə coğrafi nöqtə məlumat qatını göstərin
                                                                                                    • Yeni məlumatları digər məlumatlarla əlaqələndirin

                                                                                                    5. Praktiki İş: coğrafi kodlaşdırma Ünvan coğrafi kodlaşdırma imkanları əksər masa üstü paketlərində mövcuddur. Bu məşq ArcView Version 3.0a istifadə edir. Məlumat dəstləri və məşq üçün bir ArcView layihəsi yüklənə bilər. Bunlar ArcView shapefile formatındadır və istifadədən əvvəl sıxılmamalıdır.

                                                                                                    Texasın San Antonio şəhərindəki İqtisadi İnkişaf Ofisində işləyirsiniz və San Antonio şəhərində neçə təyyarə istehsal müəssisəsi olduğunu və harada yerləşdiyini müəyyənləşdirmək üçün bazar araşdırması aparırsınız. Təsislərin xəritəsini yaratmaq üçün ünvan coğrafi kodlaşdırma istifadə etmək istəyirsiniz. Atacağınız üç addım bunlardır: 1) məlumatları hazırlamaq 2) ünvanları uyğunlaşdırmaq və 3) nəticələri göstərmək.

                                                                                                    Məlumat hazırlayın: İstehsal müəssisələrinin ünvanlarını elektron sarı səhifələr vasitəsilə əldə edirsiniz (http://www.bigbook.com çox baxıla bilən yerlərdən biridir.) Bu məlumatları özündə cəmləşdirən bir məlumat bazası yaradır və bir coğrafi əsas istinad sənədini alırsınız. yerli məlumat təmin edəndən. Üçüncü məlumatınız San Antonio bölgəsindəki aerodromların yerləşməsidir. GIS masa üstü proqram paketinizi açır və verilənlər bazanızı (təyyarə istehsalçıları) və iki coğrafi məlumat qatını (hava limanları və küçələr) əlavə edirsiniz. (ümumi.jpg bağlantısı)

                                                                                                    Artıq proqram təyyarə istehsalçıları ünvan cədvəlindəki məlumatları (mantable.jpg bağlantısı) coğrafi baza sənədinizlə (küçələr) müqayisə edə bilmək üçün coğrafi baza sənədini indeksləşdirməyə hazırsınız (sttable.jpg linki). 406 West Rhapsody Drive-da ofisi olan Zee Systems, Inc.-in məsələsini götürək. Proqram verilənlər bazasından ünvanı alacaq. Daha sonra coğrafi əsas sənəddəki bütün Rhapsody Drive küçə seqmentlərini axtaracaqdır (rhaptable.jpg link). Qurduğunuz matç qaydalarından istifadə edərək Şərqi Rapsodiyada olan bütün küçələri xaric edəcək, 306 ilə 598 West Rhapsody arasında gedən seqmenti müəyyənləşdirəcək və ofisin küçənin sağ tərəfindəki yolun 2/3 hissəsinə yaxın olduğunu interpolasiya edəcək. (keçid rhapsody.jpg) Matç müəyyən edildikdən sonra təyyarə istehsal edən obyektlərin nöqtə məlumat qatına yeni bir qeyd əlavə olunur və nəticələr xəritənizdə göstərilir.

                                                                                                    Proqramın coğrafi məlumat qat və ünvan cədvəli arasında bu müqayisəni aparması üçün bir neçə addımı atmalısınız. İlk addım əsas sənədinizin növünü müəyyənləşdirməkdir. Bu nümunədə ABŞ Küçələri formatlı bir sənəd istifadə edirsiniz (bağlantı ustreet.jpg). ABŞ küçə formatından istifadə edərkən verilənlər bazanızda sol ünvanı, sol ünvanı, sağ ünvanı, sağ ünvanı və küçə adını tutan sahələr olmalıdır. Könüllü sahələrdə küçə növü, prefiks və ya şəkilçi və istiqamət ola bilər. (sttable.jpg bağlantısı). Lazımi sahələrin mövcud olduğuna diqqət yetirin. Bu verilənlər bazası iki istiqamət sahəsinə (prefiks və şəkilçi) malik olması ilə mürəkkəbdir. İndeks parametrlərini qurarkən hər ikisini də təyin edə bilərsiniz. ArcView-də, məlumat qatında ABŞ Küçə məlumatlarını ehtiva etdiyini tanımaq üçün Tema Tercihlərini təyin etməlisiniz (index.jpg linki). Tercihləri təyin etdikdən sonra, proqram sənədi qurmağınızı xahiş edir. İndeksləmə prosesi proqramın coğrafi əsas qat ilə ünvan faylı arasında müqayisə aparmasına imkan verir.

                                                                                                    Ünvanları uyğunlaşdırın: Artıq istehsalçı cədvəlinizi coğrafi kodlaşdırmağa hazırsınız. Coğrafi əsas sənədlə istehsalçı cədvəlindəki ünvan sahəsi arasında əlaqəni qurdunuz. ArcView-də Görünüş, Coğrafi Kod Ünvanları (match.jpg bağlantısı) seçəcək və əlaqəni quracaqsınız (link.jpg bağlantısı). İstinad mövzunuz coğrafi əsas sənəddir (küçələr). İstifadə etdiyiniz əsas sənəd növünü ABŞ Küçələrində artıq təyin etmisiniz. Təyyarə İstehsalçısı, ünvan sahəsi olaraq ünvanı istifadə edəcəyiniz proqramı söyləməyiniz lazım olan bir cədvəldir. Hər bir istehsalçının yerləşdiyi nöqtəni ehtiva edən yeni bir fayl da yaratmalısınız. İki verilənlər bazasını uyğunlaşdırmağı seçdiyiniz zaman proqram ünvan cədvəlindəki ilk qeydləri alır və uyğun küçəni tapmağa çalışır (parsing.jpg linki). Hər bir qeyddə hərəkət edir və hansı qeydlərin uyğunlaşdığını və hansının uyğun olmadığını müəyyənləşdirir (başa çatdırmaq1.jpg). Ünvan qeydlərinin% 73-nin uyğun gəldiyinə diqqət yetirin. Bu nümunədə uyğunsuzluqlar barədə narahat olmayın.

                                                                                                    Nəticələri göstərin: Proqram artıq təyyarə istehsal edən şirkətləri ehtiva edən yeni bir nöqtə məlumat qatını yaradır (bağlantı nəticələri.jpg). İstehsalat müəssisələrinin San Antonio Beynəlxalq Hava Limanı və Kelly Hava Qüvvələri Bazası ətrafında toplandığını görə bilərsiniz.

                                                                                                    Ustalıq

                                                                                                    Təlim məqsədləri:

                                                                                                    2. Uyğun olmayan qeydlərin qiymətləndirilməsi daxil olmaqla uyğunlaşdırma prosesini tamamlayın

                                                                                                    Ünvan cədvəlinin standartlaşdırılması

                                                                                                    3. Praktik məşq: cavab görüşü prosesi.

                                                                                                    4. Praktik məşq: atribut məlumatlarını istifadə edərək xəritə yaratmaq.

                                                                                                    Mövzular:

                                                                                                      • Ümumilikdə problemlər
                                                                                                        • Geocoding fərziyyələrə əsaslanır
                                                                                                        • ünvanlar bir aralıqdadır və aralıq boyunca bərabər aralıqdadır
                                                                                                        • tək nömrələr küçənin bir tərəfində, digər tərəfdə cütlərdir
                                                                                                        • yerlərin ünvanları var
                                                                                                          • Əsas sənəd
                                                                                                            • Cari deyil: yəni küçələr sənəddə deyil
                                                                                                            • Yanlış yerlər
                                                                                                            • Səhv və ya kimliyi məlum olmayan küçələr
                                                                                                            • Yanlış və ya təyin olunmayan ünvan aralıkları
                                                                                                            • Tutarsız atribut, yəni I10 da McArthur Freewaydır
                                                                                                            • Yarımçıq
                                                                                                            • Səhv
                                                                                                            • Standartlaşdırılmamışdır
                                                                                                            • Yazı həssaslığı çox yüksək və ya aşağı səviyyədədir
                                                                                                            • Nəzərə alınacaq bal çox yüksək və ya aşağıdır
                                                                                                              • Problemi müəyyənləşdirmək üçün uyğunsuzluğu qiymətləndirin
                                                                                                              • GBF faylı
                                                                                                                • Əhatə olunan coğrafi ərazini artırın
                                                                                                                • Yeni inkişaflar əlavə edin
                                                                                                                • Standartlaşdırın
                                                                                                                • İndeks axtarışını tənzimləyin (blok qaydaları)
                                                                                                                • Uyğun ağırlıqları tənzimləyin (bir matçın nə qədər yaxın olması lazımdır)
                                                                                                                • Bir matç hesab olunmaq üçün minimum hesabı tənzimləyin

                                                                                                                Əvvəlki nümunədə, ünvan sənədinin 73% -i GBF-də bir coğrafi yerə uyğunlaşdırıldı. İlkin parametrlərə əsasən, bir qismən uyğunluq və uyğun olmayan üç ünvan var idi. Yenidən oyun prosesi qeydin niyə uyğun gəlmədiyini qiymətləndirməyə, hər hansı bir problemi həll etməyə və daha çox uyğunluq tapmağa imkan verir. Uyğun olmayan qeydlərə səbəb aşağıdakılardır: səhv və ya natamam ünvan faylı qeydləri, coğrafi baza sənədindəki səhvlər və ya səhvlər və ya uyğunlaşdırılan məlumatlar üçün seçimlərin səhv olaraq qoyulması.


                                                                                                                Proqram tələbləri:

                                                                                                                İnzibati Prosedurlar Qanunu və Tənzimləyici Elastiklik Qanunu

                                                                                                                Bu agentlik proseduru əvvəlcədən bildiriş və ictimaiyyət üçün açıqlama imkanı vermək tələbinə tabedir (bax. 5 ABŞ 553 (b) (A)). Təklif olunan qayda pozuntularına dair bir bildiriş və ictimaiyyət üçün açıqlama fürsəti Başlıq 5, Amerika Birləşmiş Ştatları Kodu (USC) 553 və ya başqa bir qanunla tələb olunmadığı üçün, bir Tənzimləyici Esneklik Analizi tələb olunmur və hazırlanmamışdır (5 USC 603 (a) ).


                                                                                                                Təhlili aktivləşdirmək üçün məlumatların normallaşdırılması

                                                                                                                Kümelenmə alqoritmləri haqqında işləyən bir məlumat əldə etmək üçün lazımlı və köməkçi bir vasitə olaraq, LinkedIn məlumatlarını normallaşdırmaqda qarşılaşa biləcəyiniz tipik vəziyyətlərdən bir neçəsini araşdıraq. Bu hissədə şirkət adlarını və iş adlarını normallaşdırmaq üçün ümumi bir nümunə tətbiq edəcəyik. Daha inkişaf etmiş bir məşq olaraq, LinkedIn profil məlumatından coğrafi istinadların ayrılması və coğrafi kodlaşdırılması problemini qısa müddətə yönəldəcək və müzakirə edəcəyik. (Başqa sözlə, "Greater Nashville Area" kimi LinkedIn profillərindəki yazıları xəritədə çəkilə bilən koordinatlara çevirməyə çalışacağıq.)

                                                                                                                Veri normallaşdırma səylərinin başlıca əsəri, məlumatların vacib xüsusiyyətlərini saya və analiz edə bilmək və klasterləşdirmə kimi inkişaf etmiş məlumat hasilatı üsullarını təmin etməkdir. LinkedIn məlumatları halında şirkətlərin iş adları və coğrafi yerləri kimi qurumları araşdıracağıq.

                                                                                                                Normallaşdırma və sayma şirkətləri

                                                                                                                Peşəkar şəbəkənizdən şirkət adlarının standartlaşdırılmasına bir zərbə vuraq. Xatırladaq ki, LinkedIn məlumatlarınıza daxil olmağın iki əsas yolu ya müvafiq sahələri proqramlı şəkildə götürmək üçün LinkedIn API istifadə etməklə ya da peşəkar şəbəkənizi ünvan kitabı məlumatları kimi ixrac etməyə imkan verən bir az daha az bilinən bir mexanizmi işə salmaqdır. ad, iş adı, şirkət və əlaqə məlumatları kimi məlumatlar.

                                                                                                                LinkedIn-dən ixrac etdiyiniz bir CSV əlaqəli sənədiniz olduğunu fərz etsək, nümunə 4-4-də göstərildiyi kimi seçilmiş şəxsləri histoqramdan normallaşdıra və göstərə bilərsiniz.

                                                                                                                Misal 4-4 kimi kod siyahılarının açılış şərhlərində gördüyünüz kimi, təlimatlara uyğun olaraq mənbə kodu ödəməsindəki müəyyən bir qovluğa ixrac etdiyiniz LinkedIn əlaqələrinizin CSV sənədini kopyalayıb yenidən adlandırmalısınız. "LinkedIn əlaqələrinin bir CSV faylı olaraq yüklənməsi" ndə verilmişdir.

                                                                                                                Nümunə 4-4. Ünvan kitabçası məlumatlarından şirkət şəkilçilərinin sadə normallaşdırılması

                                                                                                                Aşağıdakılar tezlik analizi üçün tipik nəticələri göstərir:

                                                                                                                Python bir funksiyaya arqumentlər ötürməyə imkan verir ayrılma nümunə 4-4-də göstərildiyi kimi bəzən əlverişli olan parametrlər siyahısı və lüğət. Məsələn, arq [1,7] və kw <'x': 23 olaraq təyin olunduğu müddətdə f (* args, ** kw) çağırılması f (1,7, x = 23) çağırılmasına bərabərdir. >. Daha çox Python ipucu üçün Əlavə C-yə baxın.

                                                                                                                Unutmayın ki, illər ərzində inkişaf etmiş O'Reilly Media kimi şirkət adlarının müxtəlif təzahürləri kimi daha mürəkkəb vəziyyətləri idarə etmək üçün bir az daha inkişaf etmiş olmalısınız. Məsələn, bu şirkətin adını O'Reilly & amp Associates, O'Reilly Media, O'Reilly, Inc. və ya sadəcə O'Reilly kimi təmsil edə bilərsiniz. 2

                                                                                                                İş adlarının normallaşdırılması və sayılması

                                                                                                                Gözlənildiyi kimi, şirkət adlarını normallaşdırmaqla ortaya çıxan eyni problem, iş adlarını nəzərdən keçirərkən özünü göstərir, ancaq iş adları daha çox dəyişkən olduğu üçün çox messier ala bilər. Cədvəl 4-1, müəyyən bir təbii dəyişikliyi ehtiva edən bir proqram şirkətində qarşılaşacağınız bir neçə iş adının siyahısını verir. Siyahıda göstərilən 10 fərqli başlıq üçün neçə fərqli rol görürsünüz?

                                                                                                                İcraçı direktor və icraçı direktor kimi titulları bərabərləşdirən təxəllül və ya qısaltmalar siyahısını müəyyənləşdirmək əlbəttə ki, mümkün olsa da, bütün mümkün sahələrdə ümumi mühit üçün Software Engineer və Developer kimi adları bərabərləşdirən siyahıları əl ilə müəyyənləşdirmək praktik olmaya bilər. Bununla birlikdə, ən pis ssenaridəki ən messi sahələr üçün belə, məlumatları bir mütəxəssisin nəzərdən keçirməsi və sonra yenidən bir proqrama qidalandırması üçün idarə edilə biləcəyi bir yerə qədər sıxlaşdıran bir həll tətbiq etmək çox çətin olmamalıdır. bunu mütəxəssisin etdiyi kimi tətbiq edə bilər. Xeyli dəfə olmayaraq, bu, həqiqətən, təşkilatların üstünlük verdiyi yanaşmadır, çünki insanlara keyfiyyətə nəzarət etmək üçün qısa müddətdə özlərini dövrəyə salmağa imkan verir.

                                                                                                                Xatırladaq ki, hər hansı bir məlumat dəsti ilə işləyərkən ən açıq başlanğıc nöqtələrindən biri şeyləri saymaqdır və bu vəziyyət fərqli deyil. Gəlin ümumi iş adlarını normallaşdırmaq üçün bir nümunə tətbiq etmək üçün şirkət adlarını normallaşdırmaqdan eyni konsepsiyalardan istifadə edək və sonra qruplaşma üçün ilkin əsas kimi bu başlıqlarda əsas tezlik analizi aparaq. Mümkün sayda ixrac edilmiş kontaktınız olduğunu düşünsək, qarşılaşacağınız iş adları arasındakı kiçik nüanslar əslində təəccüblü ola bilər - ancaq buna başlamazdan əvvəl qeyd məlumatlarını normallaşdırmaq üçün bəzi nümunələr yaradan və əsas məlumatları alan bəzi nümunə kodunu təqdim edək. inventar tezliyə görə sıralanır.

                                                                                                                Nümunə 4-5 iş adlarını yoxlayır və başlıqların özləri və onlarda meydana gələn fərdi ayələr üçün tezlik məlumatlarını yazdırır.

                                                                                                                Nümunə 4-5. Ümumi iş adlarının standartlaşdırılması və onların tezliklərinin hesablanması

                                                                                                                Qısacası, kod CSV qeydlərində oxuyur və irəli əyikdən istifadə edən birləşmiş başlıqları ayıraraq (“Prezident / CEO” unvanı kimi) və bilinən kısaltmaları əvəz edərək normallaşdırmaq üçün mülayim bir cəhd göstərir. Bunun xaricində, həm tam iş adlarının, həm də iş başlıqlarında olan fərdi işarələrin bir tezlik paylanmasının nəticələrini göstərir.

                                                                                                                Bu şirkət adları ilə əvvəlki məşqdən fərqlənən hər şey deyil, ancaq faydalı bir başlanğıc şablonu kimi xidmət edir və məlumatların necə parçalanması barədə sizə ağlabatan bir fikir verir.

                                                                                                                Nümunə nəticələri ilə diqqət çəkən bir məqam da tam uyğunluqlara əsaslanan ən yaygın iş adının “Prezident” və “Təsisçi” kimi digər rəhbər vəzifələrin yaxından izlədiyi “Baş icraçı direktor” olmasıdır. Beləliklə, bu peşəkar şəbəkənin eqosu sahibkarlara və müəssisə rəhbərlərinə kifayət qədər yaxşı bir giriş imkanı var. İş adları içərisindən ən çox görülən ayələr “Mühəndis” və “Rəis” dir. “Baş” nişan şirkətlərdəki yüksək səviyyəli şirkətlərlə əlaqələr barədə əvvəlki düşüncə ilə əlaqələndirilir, “Mühəndis” nişanı isə peşəkar şəbəkənin təbiətinə bir az fərqli bir ipucu verir. “Mühəndis” ən çox yayılmış iş adının tərkib hissəsi olmasa da, iş adlarının yuxarı hissəsində görünən çox sayda iş adında (“Baş Proqram Mühəndisi” və “Proqram Mühəndisi” kimi) görünür. siyahı. Buna görə də, bu şəbəkənin egounun texniki praktikantlarla da əlaqələri olduğu görünür.

                                                                                                                İş adı və ya ünvan kitabının məlumat analizində, bu, təxminən bir uyğunlaşma və ya klasterləşdirmə alqoritminə ehtiyac yaradan bir fikirdir. Növbəti hissə daha ətraflı araşdırır.

                                                                                                                Yerlərin normallaşdırılması və sayılması

                                                                                                                LinkedIn əlaqələrinizlə əlaqəli ümumi əlaqə məlumatlarını içərsə də, artıq ümumi coğrafi məlumatları ixrac edə bilməzsiniz. Bu, məlumat elmində ümumi bir problemə gətirib çıxarır, yəni itkin məlumatla əlaqədar nə etməliyik. Və əgər bir coğrafi məlumat birmənalı deyilsə və ya bir çox mümkün təqdimata sahib olarsa? Məsələn, “New York”, “New York City”, “NYC”, “Manhattan” və “New York Metropolitan Area” eyni coğrafi məkanla əlaqədardır, lakin düzgün sayılması üçün normallaşdırılması lazım ola bilər.

                                                                                                                Ümumiləşdirilmiş problem olaraq, coğrafi istinadları ayırmaq olduqca çətindir. New York şəhərinin əhalisi o qədər yüksək ola bilər ki, “New York” un New York City, New York’a aid olduğunu əsaslandıracaqsınız, bəs “Smithville” nədir? Amerika Birləşmiş Ştatlarında bir çox Smithvilles var və əksər əyalətlərdə bunlardan bir neçəsi olduğu üçün doğru qərar qəbul etmək üçün ətraf əyalət xaricində coğrafi kontekst lazımdır. “Greater Smithville Area” kimi son dərəcə qeyri-müəyyən bir yerin LinkedIn-də görəcəyiniz bir şey olması halında olmayacaq, ancaq bir coğrafi arayışın müəyyən bir dəstə ilə həll oluna bilməsi üçün ümumi problemi izah etməyə xidmət edir. koordinatlar.

                                                                                                                LinkedIn əlaqələrinin yerini ayırmaq və coğrafi kodlaşdırmaq problemin ən ümumiləşdirilmiş formasından bir qədər asandır, çünki əksər mütəxəssislər əlaqələndirdikləri daha böyük metropol ərazisini müəyyənləşdirməyə meyllidirlər və bu bölgələrin nisbətən sonlu sayı var. Hər zaman belə olmasa da, ümumiyyətlə bir LinkedIn profilində bəhs edilən yerin nisbətən tanınmış bir yer olduğu və bu adla "ən populyar" metropol bölgəsi olacağı ehtimalı ilə ümumi bir fərziyyə tətbiq edə bilərsiniz.

                                                                                                                Dəqiq məlumatların itkin olduğu hallarda ağlabatan təxminlər etmək mümkündürmü? İndi LinkedIn əlaqələrinizin yerlərini ixrac etmir, bəlkə də əlaqələrinizin yaşadığı və işlədiyi yerdən nəticə çıxarmaq üçün başqa bir yol varmı?

                                                                                                                Belə çıxır ki, çalışdıqları şirkəti qeyd edərək şirkətin ünvanında coğrafi axtarış apararaq istənilən əlaqə üçün savadlı təxminlər edə bilərik. Bu yanaşma bir ünvanı açıq şəkildə göstərməyən şirkətlər üçün uğursuz ola bilər. Başqa bir uğursuzluq rejimi, əlaqəmizin işəgötürəninin bir çox şəhərdə ofisi olduqda və coğrafi axtarışımız səhv ünvanı qaytardıqda mövcuddur. Buna baxmayaraq, ilk yanaşma olaraq, əlaqələrimizin coğrafi yerlərini bu şəkildə öyrənməyə başlaya bilərik.

                                                                                                                Vasitəsilə geopy adlı bir Python paketi qura bilərsiniz pip quraşdırma geopy yerlər üçün yazıların ötürülməsi və uyğun gələ biləcək koordinat siyahılarının geri alınması üçün ümumiləşdirilmiş bir mexanizm təqdim edir. Geopy paketi özü, coğrafi kodlaşdırmanı həyata keçirən Bing və Google kimi bir çox veb xidmət təminatçıları üçün bir vəkildir və istifadəsinin bir üstünlüyü, müxtəlif coğrafi kodlaşdırma xidmətləri ilə əlaqələndirmək üçün standart bir API təmin etməsidir ki, əl ilə ehtiyacınız olmasın. sənətkarlıq istəkləri və cavabları təhlil etmək. Geopy GitHub kod deposu, onlayn mövcud sənədləri oxumaq üçün yaxşı bir başlanğıc nöqtəsidir.

                                                                                                                Nümunə 4-6, Google Maps coğrafi kodlaşdırma API ilə geopiyanın necə istifadə ediləcəyini göstərir. Ssenarini çalışdırmaq üçün Google Developers Console-dan API açarı tələb etməlisiniz.

                                                                                                                Nümunə 4-6. Google Maps API ilə coğrafi kodlama yerləri

                                                                                                                Sonra bütün əlaqələrimizdən keçərik və CSV sənədindəki “Şirkət” sütununda adın coğrafi axtarışını həyata keçiririk, nümunə 4-7-də göstərildiyi kimi. Bu ssenaridən götürülmüş nümunə nəticələri bir sıra koordinatların həlli üçün “Nashville” kimi birmənalı olmayan etiketi istifadə etmənin xüsusiyyətini izləyir və göstərir.

                                                                                                                Nümunə 4-7. Geocoding şirkət adları

                                                                                                                Nümunə 4-7-ni işləyən bir nümunə belə görünür:

                                                                                                                Bu fəsildə daha sonra, coğrafi kodlaşdırmadan geri qaytarılan yerləri peşəkar şəbəkənizi təhlil etmək üçün yaxşı bir yol ola biləcək bir klaster alqoritminin bir hissəsi olaraq istifadə edəcəyik. Əvvəlcə a adlı başqa bir faydalı vizualizasiyaya baxacağıq kartoqram maraq ola bilər.

                                                                                                                İşlənilməsi lazım olan API zənglərinin sayından asılı olaraq, nümunə 4-7-də kodu işlətmək biraz vaxt almış ola bilər. İndi bu işlənmiş məlumatları saxlamaq üçün yaxşı bir zamandır. JSON bunu etmək üçün faydalı bir universal formadır və Nümunə 4-8-dəki kod bunu necə göstərdiyini göstərir.

                                                                                                                Nümunə 4-8. İşlənmiş məlumatların JSON olaraq saxlanılması

                                                                                                                "K-mənası kümelenme" də bu qeyd edilmiş məlumatları oxumağa başlayacağıq.

                                                                                                                Kartoqramlarla yerləri vizuallaşdırmaq

                                                                                                                Kartoqram, əsas dəyişənə görə coğrafi sərhədləri ölçərək bir coğrafiyanı göstərən bir vizualizasiyadır. Məsələn, Amerika Birləşmiş Ştatlarının xəritəsi, hər bir ştatın ölçüsünü, obezlik dərəcəsi, yoxsulluq səviyyəsi, milyoner sayı və ya digər hər hansı bir dəyişən kimi dəyişkənliyə əsaslanmalı olduğundan daha böyük və ya daha kiçik ölçüdə bilər. Nəticədə görselləşdirmə mütləq coğrafiyaya tam inteqrasiya edilmiş bir baxış təqdim etməyəcəkdir, çünki ayrı-ayrı dövlətlər miqyaslandırmaları səbəbindən artıq bir araya sığmayacaqlar. Yenə də hər bir dövlət üçün miqyaslanmağa səbəb olan dəyişənin ümumi vəziyyəti barədə bir fikiriniz var.

                                                                                                                A adlanan bir kartoqramın xüsusi bir dəyişikliyi Dəhşətli kartoqram xəritədəki hər bir sahə vahidi üçün bir dairə kimi bir formanı təxmini yerində əvəz edir və formanın ölçüsünü əsas dəyişənin dəyərinə görə ölçür. Bir Dorling kartoqramını təsvir etməyin başqa bir yolu da “coğrafi cəhətdən çoxluqlu balon qrafikidir”. Mükəmməl bir vizuallaşdırma vasitəsidir, çünki 2D Xəritəçəkmə səthində məlumatın harada görünməsi ilə bağlı instinktlərinizi istifadə etməyə imkan verir və ərazi və rəng kimi formaların intuitiv xüsusiyyətlərindən istifadə edərək parametrləri kodlaya bilir.

                                                                                                                Google Maps coğrafi kodlama xidmətinin coğrafi kodlaşdırılan hər bir şəhər üçün vəziyyəti əhatə edən nəticələr verdiyini nəzərə alsaq, gəlin bu məlumatlardan faydalanaq və hər bir ştatın ölçüsünü sayına görə tərtib edəcəyimiz peşəkar şəbəkənizin Dorling kartoqramını quraq. orada olan əlaqələriniz. D3 qabaqcıl vizual alət dəsti, Dorling kartoqramının aparatlarının əksəriyyətini özündə cəmləşdirir və istəsəniz vizualın digər dəyişənləri daxil etməsi üçün genişləndirilmiş bir vasitədir. D3, işləyən məlumatlara asanlıqla uyğunlaşdırıla bilən istilik xəritələri, simvol xəritələri və choropleth xəritələri kimi coğrafi məlumatları çatdıran bir neçə başqa görselləşdirməni də əhatə edir.

                                                                                                                Kontaktlarınızı əyalətə görə vizuallaşdırmaq üçün yerinə yetirilməsi lazım olan yalnız bir məlumat silmə tapşırığı var və bu vəziyyətləri coğrafi kodlayıcı cavablarından ayırmaqdır. Google Maps geocoder, hər bir nəticədən dövlət adını çıxarmaq üçün imkan verən strukturlaşdırılmış çıxışı qaytarır.

                                                                                                                Nümunə 4-9, geokoder cavabını necə təhlil edəcəyini və D3 ilə işləyən Dorling kartoqram vizualı ilə yüklənə bilən bir JSON sənədinin necə yazılacağını göstərir. Hazırladığımız məlumatların vizualizasiyası yalnız ABŞ əyalətlərinə yönəldildiyi üçün digər ölkələrdən olan yerləri süzgəcdən keçirməliyik. Bunu etmək üçün, yer Amerika Birləşmiş Ştatlarındadırsa, Boolean True qaytaran bir köməkçi funksiyası checkIfUSA yazdıq.

                                                                                                                Nümunə 4-9. Google Maps coğrafi kodlaşdırıcısından normal bir ifadə istifadə edərək vəziyyətləri təhlil etmək

                                                                                                                Nümunə nəticələr bu texnikanın effektivliyini izləyir və göstərir:

                                                                                                                LinkedIn əlaqələrinizdən etibarlı vəziyyət qısaltmalarını distillə etmək qabiliyyəti ilə, indi hər vəziyyətin görünmə tezliyini hesablaya bilərsiniz, bu da D3 ilə açar teslim Dorling kartoqram vizualizasiyası üçün lazım olan hər şeydir. Peşəkar bir şəbəkə üçün nümunə görselleştirme Şəkil 4-3-də göstərilir. Vizual bir xəritədə diqqətlə göstərilən bir çox dairə olmasına baxmayaraq, hansı dairələrin hansı dövlətlərə uyğun olduğu nisbətən aydındır (qeyd edin ki, bir çox kartoqramda vizuallaşdırmanın sol alt küncündə göstərildiyi kimi Alaska və Hawaii) onları mozaika şəklində göstərən bir çox xəritəyə aid vəziyyət). Dairələr üzərində gəzmək, dövlətin adını standart olaraq göstərən alət tövsiyələrini yaradır və əlavə DX standart təcrübələrini müşahidə etməklə həyata keçirmək çətin olmayacaqdır. D3 tərəfindən istehlak üçün son məhsulun istehsalı prosesi, vəziyyətə görə bir tezlik paylanması yaratmaq və onu JSON olaraq seriyalaşdırmaqdan daha çox şey əhatə edir.

                                                                                                                Şəkil 4-3. Bir LinkedIn peşəkar şəbəkəsindən həll edilmiş Dorling Kartogramı - alət tövsiyələri dairələrin üzərinə əyildikdə hər bir ştatın adını göstərir (bu rəqəmdə, Massachusetts əyaləti siçan ilə vurulur)

                                                                                                                LinkedIn əlaqələrinizdən Dorling kartoqrafiyası yaratmaq üçün bəzi kodlar qısa olması üçün bu bölmədən çıxarılmışdır, lakin bu bölmə üçün Jupyter Notebook ilə tamamilə açar teslim nümunəsi kimi daxil edilmişdir.


                                                                                                                Yaşlı Yetkinlərdə Qonşuluq Sosial-İqtisadi Sərvətlər və Cinayətlə əlaqəli Psixososial Təhlükələr, İnme riski və İdrak

                                                                                                                67 illik% 40 Latino ağlığı olmayan Framingham Stroke Risk Profile istifadə 10 illik insult riski (FSRP-10) istifadə edilən ürək-damar sağlamlığı problemləri. Test edilmiş bilişsel sahələr yaddaş, icraedici iş və diqqət / məlumat emalını əhatə edirdi. Məhəllənin sosial-iqtisadi mənbələri siyahıyaalma sistemi səviyyəsində (gəlir, təhsil və peşə) cinayətlə əlaqəli psixososial təhlükələr nöqtə səviyyəsində təyin edilmişdir. Struktur tənlik modelləşdirməsi (SEM) FSRP-10-un qonşuluq xüsusiyyətləri və domenə məxsus idrak arasındakı əlaqəyə vasitəçilik etdiyini göstərmədi. SEM nəticələri, daha yüksək cinayət nisbətlərinin daha yüksək bir FSRP-10 (β (105) = 2.38, p = 0.03) ilə əlaqəli olduğunu və daha yüksək FSRP-10'un diqqət / məlumat işləmə performansının azalması ilə əlaqəli olduğunu göstərdi (β (105) = −0.04, p = 0.02) qonşuluq sosial-iqtisadi mənbələrinin uçotundan sonra. Klinisyenler idrak məsələlərini nəzərdən keçirərkən yalnız fərdi deyil, həm də qonşuluq səviyyəsində bir sağlamlıq soruşmaq istəyə bilərlər.


                                                                                                                CartoDB beynəlxalq coğrafi kodlaşdırmanı necə edir? - Coğrafi İnformasiya Sistemləri

                                                                                                                Gözəl bir şəkildə təyin olunmuş konfrans otağında qurduq və bir neçəsini vurğulayan bir videonu yaymağa başladıq SağlamlıqNəhəng bir LED monitorda mənzərə alətləri. Təqdimatımız tamaşaçıların diqqətini cəlb etdi.

                                                                                                                Niyə? Bu interaktiv xəritələr bu qədər cəlbedici idi?

                                                                                                                Otağa girən demək olar ki, hər kəsin gördükləri ilə eyni üç yolla məşğul olduğunu gördük:

                                                                                                                Dərhal bir istinad çərçivəsinə sahib oldular.

                                                                                                                Əvvəlcə nə axtardılar? Onların qonşuluq. Onların icma. Onların əlamətdar yerlər. Mənsub olduqları yeri tez tapdılar və diqqətlərini təqdim etdiyimiz məlumatlara yönəltdilər. Konteksti qurmaq üçün vaxt sərf etmək lazım deyildi. Onsuz da var idi.

                                                                                                                Dərhal naxış axtarmağa başladılar.

                                                                                                                İnsanlar suallar verməyə və müşahidələr aparmağa başladılar: Niyə bu ərazidə bu qədər çox adam var? Bu kölgə nəyi təmsil edir? Orada gözlədiyim şey bu deyildi. Bu rəqəmin daha çox olmadığına təəccübləndim. İnsanlar tez bir zamanda kompleks məlumatları anlamağa çalışdılar. Verilənlərin coğrafi baxımdan enerjili olduğunu və onları məşğul etdiyini görmək.

                                                                                                                Dərhal məlumatları daha da artırmaq istədilər.
                                                                                                                İlkin müşahidələr aparıldıqdan sonra tamaşaçılar daha dərindən araşdırmaq istədi. Verilərdə məna tapmaq istəyirdilər. Yalnız bir nümunəni müşahidə etmək deyil, həm də niyə bu nümunənin meydana gəldiyini anlamaq istəyirdilər. O ərazidə işsizlik yüksəkdirmi? Bəs yoxsulluq? Şiddətli ürək xəstəliyi olan insanlar qrupunun xəstəxanaya girişi varmı? Çünki SağlamlıqLandşaftın interaktiv dizaynı və icma məlumatlarının tam kitabxanası, müəyyən edilmiş ehtiyacları qarşılamaq üçün yollar təsəvvür etməyə başlayarkən, zehni çarxları dönərkən suallarına cavab verilə bilər.
                                                                                                                Ağlımız vizual məlumatı mətn məlumatından daha tez emal edir. Bir yazıçı bunu dairənin tərifini verən bir mətn bəndinin yanında bir dairənin rəsmini qoyaraq nümayiş etdirir. Anlamaq üçün hansını daha çox çalışmalısan: görüntü yoxsa tərif? Bəs hansını xatırlayacaqsan?

                                                                                                                Hansı daha tez başa düşürsən - xəritə və ya cədvəl? Hər ikisi də eyni məlumatları göstərir.


                                                                                                                Hər hansı bir vizuallaşdırmanın "yapışqan" olma potensialına sahib olmasına baxmayaraq, GIS vizualizasiyaları bir addım daha irəli gedir, çünki izləyicilər məlumatlarla şəxsi əlaqə qurma potensialına malikdirlər. İzləyiciləriniz, istər qayğı təminatçıları, siyasətçilər, maliyyələşdirənlər və ya xidmət etdiyiniz insanlar birliyi olsun, məlumatlarla əlaqəli olduqları yerləri axtarır və "Bu mənə necə təsir edir?"

                                                                                                                Haqqında daha ətraflı məlumat üçün SağlamlıqLandşaftın interaktiv CİS məlumatlarının vizual görüntüləri, müntəzəm olaraq planlaşdırılan veb seminarlarımızdan birində iştirak edin:


                                                                                                                Videoya baxın: CartoDB tutorial (Oktyabr 2021).