Daha çox

Masaüstü üçün ArcGIS -də Şəbəkə Çekirdeği Yoğunluğu Tahlili Analizi necə aparılır?


Yol qəzaları ilə bağlı bəzi təhlillərə baxıram. Aydındır ki, toqquşmalar yollarda baş verir və bunun şəbəkə elementini nəzərə almaq üçün ən yaxşı metodologiyanı araşdırırdım. Adi qaynar nöqtələr (Kernel Sıxlığı) hər şeyi çox yumşaldır və evklid məsafələrini deyil, şəbəkə vasitəsi ilə hadisələr arasındakı məsafəni hesabladığı üçün daha çox təmsilçi olduğu düşünülən Şəbəkə Nüvəsi Yoğunluğu Hesablamasında bir neçə məqalə tapdım. Hal -hazırda ArcGIS Basic/Standard 10 istifadə edirik. Məkan Analisti lisenziyamız yoxdur, ancaq Cinayət Analitiki və Şəbəkə Analitikimiz var.

Bunu daha əvvəl ArcGIS -də edən kimsə var? Mən googled etdim ki, heç bir hazır alət tapa bilmirəm - buna görə də kiminsə istifadə edə biləcəyim bir skriptin olub -olmadığını düşünürdüm? Yoxsa bunu bir modeldə necə edə biləcəyim barədə hər hansı bir fikir varmı?


Burada professor Okabe tərəfindən hazırlanan şəbəkə kernel sıxlığı texnikalarından istifadə edərək bir sıra ArcGIS Desktop alətləri (9-10.2 versiyaları) mövcuddur. http://sanet.csis.u-tokyo.ac.jp/.

Ancaq onlar yalnız akademik istifadə üçün lisenziyaya malikdirlər. Onları magistrlik dissertasiyamda istifadə etdim və həqiqətən də yaxşı işlədilər. Kommersiya tətbiqləri ilə maraqlana biləcəyinizi düşünürəm.

Sənədlərə görə, GRASS -da (v.kernel) açıq mənbə tətbiqi mövcuddur.


Türkiyənin Rize şəhərində baş verən yol qəzalarının məkan statistikasını müəyyən etmək üçün şəbəkə məkan çəkilərinə əsaslanan qaynar nöqtə analizi

Bu gün dünyada yollardan istifadə edən nəqliyyat vasitələrinin sayının artması nəqliyyatla əlaqədar problemlərə səbəb olur və bu baxımdan yol qəzaları əhalinin sağlamlığı ilə bağlı vacib bir mövzudur. Xüsusilə iki sərhəd əyalətini birləşdirən yolda nəqliyyat vasitələrinin sayına paralel olaraq yol qəzaları əhəmiyyətli dərəcədə artır. Yol qəzalarının ölüm və ya yaralanma ilə nəticələndiyi sahələri təyin edərək, qəzaların qarşısının alınması strategiyaları hazırlana bilər. Bu araşdırma, Türkiyənin Rize əyalətində 45 km əsas marşrutlardan çox olan yol qəzalarının (qaynar nöqtələr bölgələri) intensivliyini təyin etmək üçün Coğrafi İnformasiya Sistemlərindən (CİS) istifadə edərək məkan statistikası metodlarını tətbiq edir. 5 il ərzində məlumatlarda qeydə alınan yol qəzaları, qaynar nöqtə statistik təhlili istifadə edərək qiymətləndirmək üçün coğrafi məlumat bazası ilə birləşdirilir. Digər tədqiqatlardan fərqli olaraq, bu işdə trafik təhlükəsizliyi üçün qara ləkələri müəyyən etmək üçün şəbəkə məkan çəkilərinə əsaslanan qaynar nöqtə təhlili (yol qəzasının qaynar nöqtələrini təyin etmək üsullarına yeni bir baxış: "GIScience -in yeni tətbiqi") istifadə edilmişdir. Hot Spot Analizindən istifadə edərək təhlili aparmaq üçün: Getis-Ord Gi*, yaradılan bir şəbəkə məlumatları və yol məlumatlarının məkan çəkiləri şəbəkə məkan çəkilərini yaratmaq üçün istifadə olunur. Daha sonra, yol qəzası qara nöqtələrini təyin etmək üçün Kernel Density metodundan istifadə olunur. Nəhayət, bu iki üsul bir -biri ilə vizual olaraq müqayisə olunur.

Bu, abunə məzmununun, müəssisəniz vasitəsi ilə girişin bir ön görünüşüdür.


Şəbəkə Çekirdeği Yoğunluğu qiymətləndirmə təcrübəsi olan varmı?

Arcgis mühitində NKDE təhlili aparmaq istəyirik. İndiyə qədər yalnız bu alət qutusuna rast gəlmişəm: http://sanet.csis.u-tokyo.ac.jp/ yalnız 10.2 versiyalarına qədər işləyir. Bu akademik məqsədlər üçündür və təəssüf ki, yalnız 10.6 və Pro -ya daxil ola bilərəm. Burada kiminsə fikri varmı?

Bunun nə olduğunu və ya necə işlədiyini izah edərsinizmi?

Əlbəttə ki, mövzunu öyrənərkən hələ də əlimdən gələni edəcəyəm. Əslində Şəbəkə Çekirdeği Yoğunluğu (NKDE), şəbəkədəki nöqtələr arasındakı evklid məsafəsini hesablayır və məlumatlarda qaynar nöqtələri göstərən bir səthi qaytarır. Ənənəvi KDE -dən fərqli olaraq, NKDE, ləpə mərkəzindən şəbəkə məsafəsini istifadə edərək nüvəni bir şəbəkəyə sıxışdırır.

Veri dəstiniz kiçikdirsə və bir çox xətti xüsusiyyət sinfi olaraq şəbəkəniz varsa (şəbəkə məlumatlarından hesablanmış marşrutları çıxara bilərsiniz), şəbəkəni rasterləşdirə və yolları olmayan ərazilərin keçilməz olduğu bir sürtünmə xəritəsi hazırlaya bilərsiniz. Daha sonra rasterləşdirilmiş nöqtələrdən aldığınız hər qovşaqdan və ya trafik fasiləsindən bu sürtünmə xəritəsinə Qiymət Məsafəsini tətbiq edin.

Yerli yollara daha çox sürtünmə və magistral yollara daha az sürtünmə təmin edə biləcəyiniz üçün bu yanaşma yol keyfiyyətinə görə də fərdiləşdirilə bilər.

Python bilirsinizsə, networkx kimi bir kitabxananı ArcGIS mühitinə idxal edərək daha yaxşı nəticələr əldə etməlisiniz.

Bu ehtiyacınız olan həll qədər müstəqil ola bilməz, amma sınamağa dəyər ola bilər.


Qəzaların və Yol Dizaynının Təhlili üçün GIS Alətləri: Baxış ☆

Nəqliyyat sistemlərinin gözlənilməz nəticəsi xəsarət alan və həyatını itirən yol qəzalarıdır. Son illərdə qəzaların təhlili və yol dizaynı vasitələri ilə bağlı tədqiqatların sayı xeyli artmışdır. Bu vasitələr arasında Coğrafi İnformasiya Sistemləri (CİS) kompleks məkan analizləri aparmaq qabiliyyətləri ilə seçilir. Ancaq bəzən GIS, qəzalar və yol xüsusiyyətləri haqqında məlumatları saxlamaq və təqdim etmək üçün yalnız coğrafi bir verilənlər bazası olaraq istifadə edilmişdir. Qəzaların statistik tədqiqatlarının nəticələrini əks etdirmək üçün də istifadə edilmişdir, lakin bu statistik tədqiqatlar GIS ilə aparılmamışdır. İnteqrasiya edilmiş statistik analiz qabiliyyəti sayəsində GIS bir sıra üstünlüklər təqdim edir. Birincisi, məlumatların daha diqqətli və dəqiq seçilməsinə, taranmasına və azaldılmasına imkan verir. Ayrıca, əvvəlcədən və sonrakı emaldakı nəticələrin məkan analizinə imkan verir. İkincisi, GIS coğrafi istinad məlumatlarına əsaslanan məkan statistikasının inkişafına imkan verir. Bu yazıda qəzaları modelləşdirmək üçün istifadə olunan bir neçə GIS vasitəsi araşdırılmışdır. Bu vasitələrin anlaşılması analitikə hər bir xüsusi şəraitdə və kontekstdə hansı vasitənin tətbiq oluna biləcəyi barədə daha yaxşı qərar verməyə kömək edəcək.


Məzmun

Qoy (x1, x2, …, xn) naməlum sıxlığa malik bəzi dəyişməz paylamalardan götürülmüş müstəqil və eyni paylanmış nümunələr olmalıdır ƒ hər hansı bir nöqtədə x. Bu funksiyanın formasını təxmin etməkdə maraqlıyıq ƒ. Onun kernel sıxlığı qiymətləndiricisi edir

harada K nüvəsidir-mənfi olmayan bir funksiya-və h & gt 0, adlandırılan hamarlaşdırıcı bir parametrdir bant. Alt kodu olan bir nüvə h adlanır ölçülü çekirdek və olaraq təyin olunur Kh(x) = 1/h K.(x/h). Sezgisel olaraq insan seçmək istəyir h məlumatların imkan verəcəyi qədər kiçik olsa da, həmişə qiymətləndiricinin qərəzliliyi ilə onun fərqliliyi arasında bir fərq var. Bant genişliyi seçimi aşağıda daha ətraflı müzakirə olunur.

Ümumiyyətlə bir sıra nüvə funksiyaları istifadə olunur: vahid, üçbucaqlı, iki çəkili, üçqatlı, Epanechnikov, normal və s. Epanechnikov nüvəsi orta kvadrat səhv baxımından optimaldır [5], baxmayaraq ki, əvvəllər sadalanan ləpələr üçün səmərəliliyin itkisi azdır. [6] Rahat riyazi xüsusiyyətlərinə görə normal kernel tez -tez istifadə olunur, yəni K(x) = φ(x), harada φ standart normal sıxlıq funksiyasıdır.

Bir nüvə sıxlığı təxmininin qurulması, sıxlıq təxminindən kənar sahələrdə şərhlər tapır. [7] Məsələn, termodinamikada bu, hər bir məlumat nöqtəsi yerində istilik ləpələri (istilik tənliyinin əsas həlli) yerləşdirildikdə yaranan istilik miqdarına bərabərdir. xi. Oxşar metodlar, çoxlu öyrənmə üçün nöqtəli buludlarda diskret Laplace operatorları qurmaq üçün istifadə olunur (məsələn, diffuziya xəritəsi).

Kernel sıxlığı təxminləri histogramlarla yaxından əlaqəlidir, lakin uyğun bir ləpə istifadə edərək hamarlıq və ya davamlılıq kimi xüsusiyyətlərə sahib ola bilər. Bu 6 məlumat nöqtəsinə əsaslanan aşağıdakı diaqram bu əlaqəni göstərir:

Nümunə 1 2 3 4 5 6
Dəyər -2.1 -1.3 -0.4 1.9 5.1 6.2

Histogram üçün əvvəlcə üfüqi ox məlumat aralığını əhatə edən alt-aralıqlara və ya zolaqlara bölünür: Bu vəziyyətdə hər biri 2 genişlikdə olan altı zolaq 2 Bu intervalın içərisinə bir məlumat nöqtəsi düşdükdə 1 hündürlükdə bir qutu/ 12 orada yerləşdirilib. Eyni qutunun içərisinə birdən çox məlumat nöqtəsi düşərsə, qutular üst -üstə yığılır.

Nüvə sıxlığının hesablanması üçün hər bir məlumat nöqtəsinə standart sapma 2.25 olan (qırmızı kəsikli xətlərlə işarələnmiş) normal nüvələr yerləşdirilir. xi. Çekirdekler, çekirdek sıxlığı təxminini (qatı mavi əyri) etmək üçün toplanır. Nüvə sıxlığı təxmininin hamarlığı (histogramın diskretliyi ilə müqayisədə), nüvə sıxlığı təxminlərinin davamlı təsadüfi dəyişənlər üçün əsl əsas sıxlığa necə daha tez yaxınlaşdığını göstərir. [8]

Nüvənin bant genişliyi, ortaya çıxan təxminlərə güclü təsir göstərən sərbəst bir parametrdir. Təsirini göstərmək üçün standart normal paylamadan simulyasiya edilmiş təsadüfi bir nümunə götürürük (üfüqi oxda olan xalça sahəsindəki mavi sünbüllərdə). Boz əyri əsl sıxlıqdır (ortalama sıxlığı 0 və varyans 1 olan normal sıxlıq). Müqayisə üçün qırmızı əyridir düzəldilmiş bant genişliyindən istifadə nəticəsində yaranan çox sayda saxta məlumat artefaktını ehtiva etdiyi üçün h = 0.05, bu çox kiçikdir. Yaşıl əyri həddindən artıq hamarlaşdırılmışdır bant genişliyi istifadə edildiyindən h = 2, əsas quruluşun çox hissəsini gizlədir. Bant genişliyi olan qara əyri h = 0.337 optimal sıxılmış hesab olunur, çünki onun sıxlıq təxmini əsl sıxlığa yaxındır. H → 0 < displaystyle h to 0> həddində həddindən artıq vəziyyətə rast gəlinir (hamarlaşma yoxdur), burada qiymətləndirmənin cəmi n analiz edilən nümunələrin koordinatlarına mərkəzləşdirilmiş delta funksiyaları. Digər hədd həddində h → ∞ < displaystyle h to infty>, qiymətləndirmə, nümunələrin ortasında mərkəzləşdirilmiş istifadə olunan nüvənin formasını saxlayır (tamamilə hamar).

Bu parametri seçmək üçün ən çox istifadə edilən optimallıq meyarı gözləniləndir L2 risk inteqrasiya edilmiş kvadrat səhv hesab olunur:

MISE ⁡ (h) = E [∫ (f ^ h (x) - f (x)) 2 d x]. < displaystyle operator adı (h) = operator adı ! sol [, int (< şapka >_(x) -f (x))^<2> , dx sağ].>

Zəif fərziyyələr altında ƒK, (ƒ ümumiyyətlə bilinməyən həqiqi sıxlıq funksiyasıdır), [1] [2] MISE (h) = AMISE (h) + o (1/(nh) + sa 4) harada o kiçik işarəsidir və n nümunə ölçüsü (yuxarıda göstərildiyi kimi). AMISE, iki aparıcı termindən ibarət olan Asimptotik MISE -dir

Nə AMISE, nə də hAMISE Formulalar f < displaystyle f> və ya onun ikinci törəməsi f ″ < displaystyle f ''> bilinməyən sıxlıq funksiyasını ehtiva etdikləri üçün birbaşa istifadə edilə bilər, buna görə də seçim üçün müxtəlif avtomatik məlumatlara əsaslanan üsullar hazırlanmışdır. bant. Effektlərini [9] [10] [11] [12] [13] [14] [15], plug-in seçicilərinin [7] [16] [ümumi fikir birliyi ilə müqayisə etmək üçün bir çox araşdırma işləri aparılmışdır. 17] və çarpaz doğrulama seçiciləri [18] [19] [20] geniş bir məlumat dəsti içərisində ən faydalıdır.

İstənilən bant genişliyini əvəz etmək h eyni asimptotik nizama malikdir n −1/5 kimi hAMISE AMISE daxilində bu AMISE (h) = O(n −4/5), harada O böyük işarəsidir. Zəif fərziyyələr altında, kernel qiymətləndiricisindən daha sürətli bir sürətlə yaxınlaşan parametrik olmayan bir qiymətləndiricinin mövcud ola bilməyəcəyini göstərmək olar. [21] Qeyd edək ki n −4/5 dərəcəsi tipikdən daha yavaşdır n Parametrik metodların -1 konvergensiya dərəcəsi.

Bant genişliyi sabit saxlanılmasa da, ya qiymətləndirmənin (balon qiymətləndiricisi) və ya nümunələrin (nöqtəli qiymətləndirici) yerləşdiyi yerə görə dəyişirsə, bu, adaptiv və ya dəyişkən bant genişliyi kernel sıxlığı qiymətləndirilməsi adlanan xüsusilə güclü bir üsul istehsal edir.

Ağır quyruqlu paylamaların kernel sıxlığının qiymətləndirilməsi üçün bant genişliyi seçimi nisbətən çətindir. [22]

Bir qayda olaraq bant genişliyi qiymətləndiricisi Edit

Gauss əsas funksiyaları birmənalı olmayan məlumatları təxmin etmək üçün istifadə olunarsa və əsas sıxlığı təxmin edilən Gaussya olarsa, ən uyğun seçimdir. h (yəni ortalama inteqrasiya edilmiş kvadrat səhvini minimuma endirən bant genişliyi): [23]

Həm uzun quyruqlu, həm də əyri paylama və bimodal qarışıq paylamasına uyğunlaşmaq üçün h dəyərini daha möhkəm etmək üçün σ ^ < displaystyle < hat < sigma >>> ilə əvəz etmək daha yaxşıdır. tərəfindən verilən başqa bir parametr A:

A = min (standart sapma, kvartalararası aralıq/1.34).

Modeli təkmilləşdirəcək digər modifikasiya faktoru 1.06 -dan 0.9 -a endirməkdir. Sonra son formula belə olacaq:

burada σ ^ < displaystyle < hat < sigma >>> nümunələrin standart sapmasıdır, n nümunə ölçüsüdür. IQR, kvartalararası bir diapazondur.

Bu təxmini adlanır normal paylanma yaxınlaşması, Gauss yaxınlaşması və ya Silverman'ın əsas qaydası. [23] Bu əsas qaydanı hesablamaq asan olsa da, sıxlıq normal olmağa yaxın olmadıqda çox qeyri -dəqiq təxminlər verə biləcəyi üçün ehtiyatla istifadə edilməlidir. Məsələn, bimodal Gauss qarışığı modelini qiymətləndirərkən

200 bal nümunəsindən. Sağdakı rəqəm, əsl sıxlığı və iki nüvə sıxlığı təxminini göstərir-biri baş barmağının bant genişliyindən, digəri isə tənliyin həll bant genişliyindən istifadə edir. [7] [17] Baş barmaq bant genişliyinə əsaslanan təxmin əhəmiyyətli dərəcədə düzəldilmişdir.

Nümunə nəzərə alınmaqla (x1, x2, …, xn), xarakterik funksiyanı qiymətləndirmək təbiidir φ(t) = E [e itX ] kimi

Funksiya üçün ən çox yayılmış seçimdir ψ ya vahid funksiyadır ψ(t) = 1<−1 ≤ t ≤ 1>, bu təsirli olaraq inversiya düsturunda inteqrasiya aralığının [-1/h, 1/h] və ya Gauss funksiyası ψ(t) = e - π t 2 Bir dəfə funksiya ψ seçildi, inversiya düsturu tətbiq oluna bilər və sıxlıq qiymətləndiricisi olacaq

harada K söndürmə funksiyasının Fourier çevrilməsidir ψ. Beləliklə, kernel sıxlığı qiymətləndiricisi xarakterik funksiya sıxlığı qiymətləndiricisi ilə üst -üstə düşür.

(Qlobal) rejimin tərifini yerli mənada genişləndirə və yerli rejimləri təyin edə bilərik:

Kernel sıxlığı qiymətləndiricilərinin proqram tətbiqlərinin tam olmayan siyahısına aşağıdakılar daxildir:


Mücərrəd

Proqnozlaşdırılan qaynar nöqtələrin xəritələndirilməsi, qaynar nöqtələrdə polis işində mühüm rol oynayır. Populyar kernel sıxlığı qiymətləndirilməsi (KDE) kimi mövcud üsullar cinayətin müvəqqəti ölçüsünü nəzərə almır. Əlaqədar sahələrdəki son işlərə əsaslanaraq, bu məqalə, proqnozlaşdırılan qaynar nöqtələrin xəritələndirilməsi və qiymətləndirilməsi üçün məkan-zaman çərçivəsini təklif edir. Bu çərçivədəki mövcud işlərlə müqayisədə, təklif olunan çərçivənin dörd əsas xüsusiyyəti var: (1) müvəqqəti komponenti proqnozlaşdırılan qaynar nöqtə xəritəsinə daxil etmək üçün məkan-zamansal kernel sıxlığı qiymətləndirilməsi (STKDE) metodu tətbiq olunur, (2) məlumatlara əsaslanan optimallaşdırma ən uyğun bant genişliklərini seçmək üçün istifadə olunan texnika, (3) sıxlıq təxminlərindəki yanlış pozitivləri süzmək üçün statistik əhəmiyyətlilik testi və (4) yeni bir metrik, proqnozlaşdırılan dəqiqlik indeksi (PAI) ) əyrisi, birdən çox sahə miqyasında proqnozlaşdırılan qaynar nöqtələri qiymətləndirmək üçün təklif olunur. Çərçivə, 2011 -ci ildə Luiziana ştatının Baton Rouge qəsəbəsindəki ev oğurluqları ilə bağlı bir araşdırmada göstərilmişdir və nəticələr onun faydasını təsdiq edir.


4. METODOLOGİYA

Bu işdə FPIR-də yüksək riskli qəza yerlərini müəyyən etmək üçün iki metoddan istifadə edilmişdir: NetKDE və Getis-Ord Gi*(d) statistikası. Şəkil ( 3 ), statistik olaraq əhəmiyyətli qəza qaynar nöqtələrini təyin etmək üçün izlənilən metodologiyanın axın cədvəlini göstərir. Bu araşdırma, qəza modelini qiymətləndirmək üçün müvəqqəti təhlil də aparır. Aşağıdakı abzaslarda metodların nəzəri əsasları və tətbiqi müzakirə olunur.

4.1. Kernel Sıxlığı Qiymətləndirilməsi (KDE)

KDE qəza nöqtələrinin təhlili üçün geniş istifadə edilmişdir [12]. Bu üsul, iki ölçülü Evklid fəzalarında müşahidə olunan nöqtə-hadisə paylanmasının sıxlığını hesablayır. Başqa sözlə, KDE yanaşması, müəyyən bir nöqtə ətrafında dairəvi məsafədə qonşu nöqtə xüsusiyyətlərinin sıxlığını hesablayır. Üç ölçüdə təmsil edildikdə, KDE məhəllə bant genişliyi, mərkəzi nöqtə xüsusiyyətinin ətrafında simmetrik olaraq, zəng şəkilli bir əyriyə bənzəyir. Kernel (və ya K) funksiyası əyrinin dikliyini təyin edir. Daha kəskin bir əyri, daha düz bir əyrinin daha hamar bir sıxlıq qradiyenti əldə etdiyi daha ətraflı bir nəticə verir. Bitişik xüsusiyyətlər, mərkəzi nöqtəyə olan məsafələrinə görə bir sıxlıq balı ilə təmin edilir. Buna görə də, məsafə artdıqca sıxlıq skoru azalır. Bu proses, verilənlər bazasının hər bir nöqtəsi üçün təkrarlanır. Hər nöqtəni əhatə edən bütün sıxlıq məhəllələri hesablandıqdan sonra, fərqli zirvələr və vadilər yaratmaq üçün üst -üstə düşən məhəllələrin sıxlıq puanları əlavə olunur [20]. İki ölçüdə görselleştirilen nəticə, qaynar nöqtələr olaraq bilinən yüksək və aşağı sıxlıq dəyərləri ilə hamar bir gradient təmin edir. Kernel funksiyası Tənlik 1 -də təqdim olunur.

(Bərabərlik 1)

Burada, λ (s) - s yerindəki sıxlıq, r - KDE -nin axtarış radiusu (bant genişliyi) və k - i məsafədəki bir nöqtənin çəkisi.edir yerə s. k ümumiyyətlə d arasındakı nisbətin bir funksiyası (kernel funksiyası adlanır) olaraq modelləşdiriliredir və r.

4.2. Şəbəkə Çekirdeği Yoğunluğu Tahmini (NetKDE)

Konseptual olaraq Şəbəkə Çekirdeği Yoğunluğu Tahmini (NetKDE), KDE prosesinin bir uzantısıdır. Planar KDE metodologiyası, nöqtə hadisələrinin Evklid məkanında təsadüfi paylandığını nəzərə alaraq, sıxlığı hesablayır. Bununla birlikdə, yol qəzaları trafikin hərəkət etdiyi yol şəbəkələrində deyil, açıq bir yerdə baş verir. Buna görə də, hər bir hadisə, sabit bir axtarış radiusu olan 2-D təyyarədən çox, şəbəkədəki qonşularına daha güclü təsir göstərir. Bu uyğunsuzluq, şəbəkə kontekstində istifadə edildikdə, planar KDE nəticələrində 20% -ə qədər həddindən artıq qiymətləndirmə meylinə gətirib çıxarır [11]. Bu problemi həll etmək üçün son araşdırmalar, məhəllənin bant genişliyinin Öklid məkanı üzərində deyil, bir şəbəkə vasitəsi ilə hesablandığı bir KDE -nin inkişafı və istifadəsinə yönəlmişdir. Bu vasitə NetKDE olaraq bilinir. Bir sahə vahidi üzərində sıxlığı hesablamaq əvəzinə, tənlik xətti bir vahidin sıxlığını təxmin edir. İlk dəfə Okabe tərəfindən hazırlanmışdır və s. 2006-cı ildə [21] və bir çox hallarda planar KDE məhdudiyyətini həll etmək və şəbəkəyə bağlı nöqtə hadisələrinin paylanmasının daha doğru şərhini vermək üçün istifadə edilmişdir [12]. Şəkil ( 4 ) iki KDE metodu arasındakı fərqi təqdim edir.

Şəkil (1). FPIR -in yeri, Montana.

Şəkil (2). FPIR -də qəza yerləri.

Şəkil (3). Metodik addımlar.

4.3. SANET- Şəbəkələr və NetKDE Analizi boyunca Məkan Təhlili

Yapon tədqiqatçı Dr. Atsuyuki Okabe və qrupu, məkan hadisələrini şəbəkə məkanı ilə birlikdə analiz etmək üçün ArcGIS alətlər qutusu uzantıları olan Şəbəkələr boyunca Məkan Analizi (SANET) hazırladılar [21]. Bu işdə, bu alət qutusu uzantısının NetKDE təhlili, yol şəbəkəsi verilənlər bazasını şəbəkə təbəqəsi olaraq istifadə edərək FPIR qəza məlumat qatında həyata keçirildi. Xüsusilə kompleks bir şəbəkədə tətbiq edildikdə bu kernel funksiyası hesablama müddətini minimuma endirdiyi üçün bərabər bölünmüş davamlı nüvə funksiyası yerinə yetirildi [12]. Axtarış bant genişliyi, sıxlığın nəticələrinin hamarlığını təyin edən kritik bir parametrdir [12]. NetKDE -də optimal axtarış bant genişliyi həm tədqiqat sahəsinin paylanma xüsusiyyətlərini, həm də yol şəbəkəsini nəzərə almalıdır. Bu işdə sıxlıq nəticələri 500 m, 200 m, 100 m, 50 m, 20 m və 10 m olan altı fərqli bant genişliyi ilə hesablanmışdır. Nəticədə sıxlıq dəyərləri maksimum 500 bant genişliyində idi. Yoğunluqlar fərqli yollarda əhəmiyyətli dərəcədə dəyişir və eyni yolda qeyri -bərabər paylanır, bu da bütün tədqiqat sahəsində balanssız bir paylanma yaradır. Artan bant genişliyi ilə, "r" məxrəci artdıqca ortaya çıxan sıxlıq dəyərləri azalır. Nəticədə, sıxlıqlar həm fərqli yollarda, həm də eyni yolda daha yumşaq şəkildə dəyişir və ümumi sıxlıq nəticələri daha hamar olur. Bununla birlikdə, NetKDE -də arzuolunmaz olan 200m, 100m, 50m, 20m bant genişliyi ilə sıxlıq dəyərləri çox az dəyişir. Buna görə də, həm fərqli yollarda, həm də eyni yolda sıxlıq paylanmasının dəyişməsini əks etdirmək və eyni zamanda balanslı bir paylama saxlamaq üçün, tədqiqat sahəsi daxilində 10 m bant genişliyi uzunluğu optimal hesab olunur. 10m bant genişliyi seçimi, Xie & amp Yan tərəfindən də dəstəkləndi (2008) [11], araşdırmalarında dar bant genişliklərinin qəza nöqtələrini daha kiçik miqyasda təqdim etmək üçün uyğun ola biləcəyini bildirdilər. Hüceyrə genişliyi, SANET qrupunun [21] tövsiyə etdiyi kimi 1 m olaraq təyin edildi.

4.4. Qəza şiddətinin təhlili

Qəza zədəsinin şiddət səviyyələrinə Kritik zədə, Ciddi zədə və yalnız Əmlak zədəsi (PDO) daxildir. Kritik zədə ölümcül və qabiliyyətsiz yaralanmalardan, ciddi zədələnmə qabiliyyətini itirməyən və aşkar yaralanmalardan ibarətdir. Qəza şiddətinin təhlili aparmaq üçün hər qəzaya PDO qəzalarına nisbətən fərqli zədə dərəcəsi qəza xərclərinin nisbətlərinə əsaslanan bir ağırlıq verildi. Otoyol Təhlükəsizliyi Təlimatından (HSM) [22] toplanan qəza xərcləri hər zədə səviyyəsinin ağırlığını təyin etmək üçün istifadə edilmişdir. Cədvəl 1 qəza xərci əsasında hər bir şiddət səviyyəsinə təyin edilmiş ağırlığı təqdim edir.

Cədvələ uyğun olaraq hər qəzaya çəkilər verdikdən sonra 1 , qəza şəkli faylı 1 m hüceyrə ölçülü bir raster faylına çevrildi. Daha sonra, çoxbucaqlı şəkil və yol şəkli sənədləri, qəza şiddəti ilə yol seqmentlərini əldə etmək üçün məkan birləşmə vasitələrindən istifadə etməklə birləşdirildi. Daha sonra yol hissələri üç sinfə bölündü. Birinci kateqoriya digər yollara nisbətən aşağı riskli yolları əhatə edirdi, çünki bu yollarda heç bir zədə və ölüm hadisəsi baş verməmişdi. İkinci kateqoriyada, orta riskli yol seqmentləri, birinci kateqoriyadan daha ağır yaralanmalar və ağır olmayan yaralanmalarla daha çox qəzadan ibarət idi. Son qrupa digər qəzalarla əlaqəli ölümcül xəsarət alan yol seqmentləri daxil idi.

Yol təhlükəsizliyinin yaxşılaşdırılması üçün küçə seqmentlərini və yüksək prioritet sahələri müəyyən etmək üçün NetKDE qəza yeri təhlili və qəzanın şiddət xəritəsinin nəticələri müqayisə edildi. Təcrübədə, bu üsul əvvəlcə qəza şiddəti xəritəsi kimi NetKDE xəritəsindəki küçə seqmentlərini təhlil nəticəsində yaranan dəyərlərə nisbətlə yüksək, orta və aşağı təyinatlara bölməklə həyata keçirildi. Bu təsnifat başa çatdıqdan sonra hər bir təyinat sinfi (yüksək, orta, aşağı) ArcGIS -də öz təbəqəsi olaraq seçilmiş və ixrac edilmişdir. Altı yeni təbəqə yaradıldıqdan sonra, üst-üstə düşən seqmentlər bitişik yüksək dəyərli seqmentləri daxil etmək üçün 250ft axtarış buferi ilə "məkana görə seçin" istifadə edərək vurğulandı. Bu vurğulanan hissələr yüksək qəza dərəcəsi və şiddəti ilə yüksək riskli küçə seqmentlərinin son xəritəsini yaratmaq üçün istifadə edilmişdir. Bu seçim prosesi Beckstromun istifadə etdiyi üsula bənzəyir və s. [ 13 ].

4.5. Getis – Ord Gi * (d) Məkan Statistikası

Gi*(d) məkan statistikası metodu Getis və Ord [23] tərəfindən yüksək və aşağı məkan birləşmələrinin yerlərini ayırmaq üçün tətbiq edilmişdir. Bu vasitə hər bir xüsusiyyətə qonşu xüsusiyyətlər kontekstində baxaraq işləyir [24]. Yüksək dəyəri olan bir xüsusiyyət, aşağı atribut xüsusiyyətləri ilə əhatə olunarsa, statistik olaraq əhəmiyyətli ola bilməz. Statistik olaraq əhəmiyyətli bir qaynar nöqtə olmaq üçün bir xüsusiyyət yüksək dəyərə sahib olacaq və yüksək dəyərlərə malik digər xüsusiyyətlərlə əhatə olunacaq [9].

(Bərabərlik 2)

Burada Xj, j xüsusiyyəti üçün atribut dəyəridir, Wij i və j xüsusiyyəti arasındakı məkan çəkisidir, n ümumi xüsusiyyətlərin sayına bərabərdir və:

(Bərabərlik 3)
(Bərabərlik 4)

Tənlik 2 -də, hər bir xüsusiyyətin atribut dəyərləri məkan çəkisi matrisi ilə vurulur, Wij hansı yerlərin təhlilə və müvafiq çəkiyə daxil olduğunu təyin edir. Bu müşahidə olunan dəyərlərin cəmi, gözlənilən dəyərdən, nümunə ortalamasından çıxıldı. Daha sonra, bu fərq, hər bir sayt üçün standartlaşdırılmış bir z-skoru əldə etmək üçün standart sapmaya bölünür. Gi* (d) statistikası, verilənlər bazasındakı hər bir xüsusiyyət üçün z-balı qaytarır. Statistik olaraq əhəmiyyətli müsbət z-skorları üçün, z bal nə qədər böyükdürsə, yüksək dəyərlərin (qaynar nöqtə) qruplaşması bir o qədər sıx olur. Statistik olaraq əhəmiyyətli mənfi z-skorları üçün, z-bal nə qədər kiçik olsa, aşağı dəyərlərin (soyuq nöqtə) qruplaşması daha sıx olar [9]. Bu araşdırma, hər qəzanın zədə şiddəti növü kimi atribut dəyərlərindən istifadə etdi.

4.6. Məkan Birliyinin Konseptualizasiyası

Məkan ağırlığı matrisinin qurulması və ya xüsusiyyətlər arasında məkan birliyinin konseptualizasiyası, məkan avtokorrelyasiyasının ən vacib cəhətlərindən biridir. Nəticələrin dəqiqliyi əsasən xüsusiyyətlər arasındakı qarşılıqlı əlaqə yollarından asılıdır. Tərs məsafə, tərs məsafə kvadratı, sabit məsafə zolağı, laqeydlik zonası kimi məkan əlaqələrinin konseptualizasiyasının fərqli üsulları, fayl, məsafə zolağı və ya eşik məsafəsindən fəza çəkiləri alır, fərqli nəticələr verir [5]. Bu analiz üçün nöqtə xüsusiyyətlərinə malik olduğu üçün sabit bir məsafə bandı metodu seçildi. Maksimum məkan korrelyasiyası ilə əlaqəli bir məsafə həddini təyin etmək də vacibdir, çünki hər bir xüsusiyyət qonşu xüsusiyyətlərinə görə təhlil ediləcəkdir. Bu işdə, maksimum Z skoru ilə əlaqəli məsafəni təyin etmək üçün artımlı məkan avtokorrelyasiya vasitəsi istifadə edilmişdir. 25.000 m məsafə zolağı seçildi, çünki bütün qəzaların ən azı bir qonşusu olduğu minimum məsafə 24.405 m, maksimum Z dəyəri 10.83 idi. Ondan daha böyük bir məsafə daha çox qonşu ilə nəticələnəcək. Bu səbəbdən 25.000 m məsafə bandı mümkün olan ən yaxşı seçim olardı.

4.7. Crash Hotspots xəritəsi

Nəhayət, Məkan birləşmə vasitəsi, NetKDE və digər CİS alətləri vasitəsi ilə yaradılan yüksək riskli yol seqmenti xəritəsinə və Getis-Ord Gi* (d) statistikasından FPIR-də statistik olaraq əhəmiyyətli qəza nöqtələrini təyin etmək üçün istifadə edildi.

4.8. Müvəqqəti analiz, Hörümçək sahəsi

Müvəqqəti analiz, zamanın qəza hadisələrinə təsir edib -etmədiyini araşdırmağa imkan verir. Qəzaların baş vermə vaxtı qəzaların modelini təhlil etmək və infrastrukturu və təcili yardım tədbirlərini artırmaq üçün çox vacibdir. Hörümçək qrafiki zamanla çökmə modelini təsvir etmək üçün geniş istifadə edilmişdir. Hörümçək süjetinin dairəvi təbiətinə görə nə başlanğıcı, nə də sonu olmadığı üçün, çubuq qrafikində fasiləsiz olaraq göstərilən vaxt aralığını qiymətləndirmək daha asandır (məs. Səhər 9 -dan axşam 5 -ə qədər). Ayrıca, qrafikin saata bənzədiyi üçün gün ərzində qəza modelini anlamaq üçün yalnız bir baxış lazımdır.

Bu yazıda iki növ müvəqqəti təhlil aparılmışdır. Birincisi, gün ərzində qəza modelinin araşdırılması və Hindistan Rezerv Yolları, Şəhər və İlçe Karayolları və Ştat magistral yolları da daxil olmaqla üç yol sistemi arasındakı qəzaların müvəqqəti paylanmasının müqayisəsidir. İkincisi, həftənin günlərinə görə qəza tezliyinin müvəqqəti paylanmasını təhlil edir.


5. NƏTİCƏLƏR

Bu bölmədə müzakirə olunan metodların nəticələri təsvir ediləcəkdir.

5.1. NetKDE

NetKDE təhlili nəticəsində qəzaya məruz qala biləcək bir neçə qrup ortaya çıxdı. Nəticə, şəbəkəyə əsaslanan hesablama səbəbindən daha yüksək xətti xətti göstərir. Kiçik bant genişliyi səbəbindən yüksək qəza sahələri daha dik yamac yaratdı. Qəza dərəcəsi xəritəsini Şəkildə tapa bilərsiniz. ( 4 ).

5.2. Qəza Şiddət Xəritəsi

Cədvələ görə, hər qəzaya çəkilər verdikdən sonra 1 , yol seqmentləri Şəkildə göstərildiyi kimi sırasıyla mavi, sarı və qırmızı rənglərlə göstərilən aşağı riskli yol seqmentləri, orta riskli yol seqmentləri və yüksək riskli yol seqmentləri olaraq üç kateqoriyaya bölündü. ( 5 ).

NetKDE xəritəsinin və qəzanın şiddət xəritəsinin nəticələri (Şəkil 2). 6 ) yüksək qəza dərəcəsi və daha ağır qəzalarla yüksək riskli yolların müəyyən edilməsi üçün yüksək prioritetli bir xəritə yaratmaq üçün üst -üstə qoyulmuşdur. Şəkildə təsvir olunan yüksək riskli yol seqmentinin xəritəsi. ( 7 ) yüksək riskli yol seqmentlərinin nəticələrini təqdim edir. Qırmızı rəng yüksək riskli yol hissələrini, sarı və yaşıl rənglər isə orta və aşağı riskli yol seqmentlərini təmsil edir. ABŞ karayolunun 13, BİA marşrutu 1 və ABŞ magistralının 2 hissələri, bu analizdə yüksək riskli yol seqmentləri olaraq təyin olunan bir çox seqmentlər arasındadır. Ayrıca, bəzi yaşayış yollarında PDO qəzaları olsa da, yüksək qəza səbəbiylə yüksək prioritet sahələr olaraq təsbit edildi.

5.3. Getis - Ord G.i*(d) Statistika

Getis – Ord Gi* (d) qəzalarının 10 illik dövr (2005-2014) üçün şiddət səviyyəsinə əsaslanan statistik təhlilinin nəticələri Şəkildə təqdim edilmişdir. ( 8 ). Gi* (d) statistikası yüksək və aşağı atribut dəyərlərinin qruplaşması kimi mənfi məkan korrelyasiyasını təmin edir. Hər bir qəza, Gi*(d) statistikası ilə hesablandığı kimi beş kateqoriyada standartlaşdırılmış z-dəyəri ilə təmsil olunur. 1.96-dan yuxarı və aşağıdakı z-hesab dəyərləri, nisbətən yüksək və aşağı ağırlıqlı dəyərlər qrupu ilə əhatə olunmuş qəzaları göstərir ki, bu da statistik olaraq təxminən 95% güvən səviyyəsindədir. Digər tərəfdən, + 1.96 ilə −1.96 arasında z bal ilə çökmələr, yüksək və ya aşağı çəkili dəyərə malik ola bilən, lakin 95% güvən səviyyəsində statistik olaraq əhəmiyyətli bir məkan modelinin və ya qrupunun bir hissəsi olmayan yerləri təmsil edir. Şəkil ( 8 ) qaynar nöqtə analizinin nəticəsini göstərir: qırmızı nöqtələr yüksək çəkili dəyərlərə malik qəzaların bir yerə toplandığı yerləri, mavi nöqtələr isə aşağı ağırlıqlı qəzaların bir araya toplandığı yerləri göstərir. Bu araşdırmada, GiZScore qəzaları -10.73 ilə -10.75 arasında dəyişir, GiP dəyərləri 0 ilə 0.99 arasındadır. Nəticələr, dəyişənlərin normal paylanmasının qəza sayı üçün doğru olmayacağını nəzərə alaraq şərh edildi [24].

5.4. Crash Hotspots xəritəsi

Nəhayət, qəzanın şiddəti ilə NetKDE statistik olaraq əhəmiyyətli yol seqmentlərini göstərmədiyindən və Getis-Ord Gi* (d) statistikası statistik cəhətdən əhəmiyyətli nöqtə xüsusiyyətlərini əks etdirdiyindən, bu üsullarla yaradılan xəritələr, statistik olaraq əhəmiyyətli qəza yerlərini müəyyən etmək üçün məkanla birləşdirildi. Şəkil ( 9 ) əvvəlki üsullarla yaradılan son xəritəni göstərir. Məhdud bir büdcə ilə, qırmızı rəngli /yüksək riskli yol seqmentlərinə üstünlük verilməlidir, çünki yüksək şiddətli qəzaların əksəriyyəti bu yol seqmentlərində baş vermişdir.

5.5. Müvəqqəti Analiz

Hörümçək sahələri istifadə edərək müvəqqəti analizlər aparılır. Bütün qəzaların ümumi müvəqqəti paylanmasını araşdırmaq üçün, qəzaların zamanla dəyişməsini daha yaxşı başa düşmək üçün hörümçək sahələri yaradılmışdır.

5.6. Ümumi müvəqqəti paylanma

Şəkil ( 10a b ) 2005 -ci ildən 2014 -cü ilə qədər FPIR -də qəzaların sayının gün ərzində necə dəyişdiyini göstərin. Qəzaların səhər saat 9.00, 13.00 və 16.00 -da çox olduğu aydındır ki, bu da qəzaların əksəriyyətinin nəqliyyatın pik saatlarında baş verdiyini göstərir. Şəkil ( 10b ) üç növ yol üçün qəza paylanmasını göstərir: Hindistan Rezerv Yolları, Şəhər və İlçe Karayolları və Dövlət Karayolları. Əyalət Karayolları, qəza yollarına və yollara nisbətən daha yüksək qəza tezliyinə sahib idi. Dövlət karayolunun tezlik zirvələri səhər 9 -da və 16 -dan 18 -ə qədər (pik saatlardakı trafik zamanı) olarkən, ilçe və rezervasyon yollarında qəzalar ən yüksək tezliklə səhər 9, 13 və 18 -də paylanır. Bu yollarda trafik az olduqda gecə yarısı (səhər 12 -dən 3 -ə qədər) qəzalar baş verdi. Sürücülük qabiliyyətinin pozulması Hindistan rezervasyonlarında qəzaların baş verməsinin əsas səbəblərindən biridir və gecə saatlarında baş verdiyi üçün bu yüksək qəza hadisələrinə səbəb ola bilər.

Cədvəl 1. Qəza xərclərinə əsaslanan hər bir zədə səviyyəsinin çəkisi
Yaralanma dərəcəsi Hərtərəfli qəza dəyəri Ağırlıq
Ölüm (K) $ 4,008,900 542
Yaralanmanı deaktiv edin (A) $ 216,000 29
Aşkar Yaralanma (B) $ 79,000 11
Mümkün Yaralanma (C) $ 44,900 6
Yalnız əmlaka ziyan $ 7,400 1
Fig. (4). Planar KDE vs. NetKDE (14).

Fig. (5). Crash Rate map of the FPIR.

Fig. (6). Crash severity map of the FPIR.

Fig. (7). High-Risk Road Segments in the FPIR.

Fig. (8). Crash hotpots.

5.7. Days of the Week

The temporal distribution of crash frequency can also be analyzed by comparing variation according to days of the week, as shown in Fig ( 11a b ). The figure reveals that the crash distribution over the time of the day exhibits a different pattern on weekdays and weekends. During the week, crashes appear to be more frequent in the morning and evening (11 am-noon and 3 pm – 5 pm), while many weekend crashes occur late in the afternoon (3 pm -5 pm) and early in the morning (12 am to 2 am). There is a large temporal variation from Monday to Thursday. Although crash frequency increases towards the end of the week, crashes are particularly less frequent on Friday, with the highest frequency at 11:00 am. Interestingly, more crashes occurred on Saturday than Sunday. Saturday crashes occurred in the early morning from 12 am to 2 am and afternoon (3 pm -5 pm), which might be explained by the findings of alcohol-related night-time crashes.

Fig. (9). Temporal distribution of crashes (a), the temporal distribution of crashes on different roadways(b).

Fig. (10). Temporal distribution of crashes (a), the temporal distribution of crashes on different roadways(b).

Fig. (11). Temporal distribution of crashes on Weekdays (a), Temporal distribution of crashes on weekends (b).


Network Density and the Delimitation of Urban Areas

This paper examines network analysis for urban areas. The research is focused on the problem of definition and visualisation of network geography and network spaces at different scales. The urban scale of analysis is examined and different spatial indices are considered. The built environment of the city is considered as a reference environment for a road network density index. The latter is implemented in order to study the spatial interactions between network phenomena and spaces and to provide further elements for the analysis of urban shape. The study is focused in particular on understanding spatial patterns drawn by networks and in helping with the delimitation of city centres. Different approaches are used to obtain the two indices: a grid–based analysis and a spatial density estimator based on Kernel Density Estimation. The two methodologies are analysed and compared using point data for the urban road network junctions and street numbers as house location identifiers in the Trieste (Italy) Municipality area. The density analysis is also used on road network junctions’ data for the city of Swindon (UK) in order to test the methodology on a different urban area.


Literature review

Hotspots, which are defined as relatively high-risk locations, are commonly identified on the basis of some specific selection criteria. Many different methodologies and criteria have been developed for improving the accuracy of the hotspot identification process, thus the cost-effectiveness of a safety improvement program [6]. One of the most commonly used selection criteria is defined by the expected collision frequencies at the sites of interest. This particular criterion emphasizes on maximizing the system-wide benefits of safety intervention targeted to the hotspots, whereas another commonly implemented criterion is considering the expected collision rate (i.e., expected collision frequency normalized by traffic exposure) which emphasizes on individual road user’s equity perspective [7].

The expected collision frequency at a site is commonly estimated using a collision model-based approach, in which collision frequency is statistically modeled as a function of some relevant features such as road characteristics, traffic exposure, and weather factors [1–5]. Roads are normally divided into homogenous sections of equal length and intersections as spatial analysis units. Various count models, with negative binomial (NB) being the most popular, are used to estimate the expected number of crashes over the road network in a study area, and the estimates are subsequently compared with a pre-specified threshold value for determining if a site belongs to a hotspot. Note that the NB models are normally used in empirical Bayes (EB) framework to better capture the local experience of safety levels [1, 6]. One of the most critical parts of this modeling approach is the assumption of a probability distribution for crash count and the functional specification of the model parameters. If these components are incorrectly specified, applying such count models could lead to incorrect hotspots. In addition, this approach is data intensive and requires significant effort in collecting and processing the related data and calibrating the corresponding models [8].

The expected crash frequency could also be estimated using a geostatistical technique by considering the effects of unmeasured confounding variables through the concept of spatial autocorrelation between the crash events over a geographical space [9–13]. KDE is an example which has been used in road safety to study the spatial pattern of crash and identify the hotspots [8–12]. Similarly, there are other geostatisical methods such as clustering methods that evaluate relative risk based on their degree of association with its surroundings. Examples of these methods used in road safety studies are K-mean clustering [14, 15], nearest neighborhood hierarchical (NNH) clustering [16–18], Moran’s I Index, and Getis-Ord Gi statistics [19–21].

Anderson və s. [11] applied KDE method in the City of Afyonkarahisar, Turkey. In this study, the authors were able to detect highly crash risk sections which were highly concentrated in road intersections. Similarly, Keskin et al. [13] and Blazquez and Celis [12] used KDE and Moran’s Index method to observe temporal variation of hotspots across the road network. Khan et al. [21] used Getis-Ord Gi statistics to explore the spatial pattern of weather-related crashes, specifically crashes related to rain, fog, and snow conditions. A special pattern was revealed for each category of weather conditions which further suggested the need of prioritizing the treatments based on different weather conditions and locations. Pulgurtha et al. [9], Pulugurtha and Vanapalli [22], and Ha and Thill [23] employed KDE method to investigate the spatial variation of pedestrian crashes and hazardous bus stops. These studies have shown the potential to effectively and economically address pedestrian and passenger safety issues. Another study by Levine [17] and Kundakci and Tuydes-Yaman [18] used NNH clustering method to detect crash hotspots across the road network.

A noticeable difference in aforementioned geostatistical methods is how spatial correlations are considered. For example, in the KDE method, a symmetrical kernel function, which is a function of bandwidth, is placed on each crash point generating a smooth intensity surface. Then, for a given point of interest, the crash intensity is a summation of the entire overlapping surface due to the crashes. In contrary, in the clustering technique such as NNH, a threshold value, which determines the extent of clustering in the neighborhood, is pre-specified. If the distance between crash data point pairs is smaller than the threshold value, then these crashes are grouped into the same cluster. Additional criteria such as minimum number of points to be in a cluster can also be specified. This variation in allocating different weights to the crashes occurring in its neighborhood (e.g., KDE method) or simply grouping crashes into certain clusters clearly indicates that these techniques are likely to have different results in terms of size, shape, and location of hotspots. One of the attractive parts of the KDE method as compared to other variants of clustering methods is that it takes into consideration of spatial autocorrelation of crashes (see Sect. 4.1 for more detailed explanations). Moreover, this method is simple and easy to implement. This could be one of the reasons that KDE method is being widely used in road safety.

In the past efforts on geostatistical based methods, another popular technique called kriging has been rarely explored in road safety analysis. As one of the most advanced interpolation methods, kriging has been utilized widely across many different fields of studies in necessity of spatial prediction. With little prior information, this technique is able to provide a best linear unbiased estimator (BLUE) for variables that have tendency to vary over space [24, 25].