Daha çox

Python'dan GRASS üçün bir vektor atribut cədvəlindən bir dəyişən təyin etmək üçün necə istifadə olunur


GRASS v.transects.py üçün piton skriptinə əlavə edirəm. Hər cərgədə dövr etmək üçün for döngəsindən istifadə edərək vektorun atribut cədvəlindəki bir sahədən bir dəyərə bərabər bir dəyişən təyin etmək istəyirəm. Bu, mənim ilk GRASS skriptlərimdən biridir, qövs ilə daha rahatyam. Arcpy üçün bir axtarış imleci və getValue istifadə edərdim:

vektor = "river.shp" xətləri = arcpy.SearchCursor (vektor) sətir sətri üçün: attributeValue = str (line.getValue ("FIELD"))

Mövcud skript onsuz da döngə hüququ var (vektordakı sətir üçün), sonuncu sətri müəyyənləşdirmək, hal-hazırda velosiped sürdüyü sətir hissəsinin atribut cədvəlindəki sahəni necə oxumaq lazımdır.


Biri təmiz Pythonda, digəri isə daha klassik olan GRASS GIS əmrlərini təhlil edən iki seçiminiz var.

1) təmiz Pythonda

GRASS Programmer's Manual-a baxsam: Python (versiya 6.4.3 ilə) hələ Python-dan GRASS vektorlarına məlumat (atribut) yazmağın bir yolunu tapmadım.

Ancaq 7 versiyası ilə mümkündür və daha asandır: GRASS 7 Programmer's Manual və PyGRASS

2) daha klassik: GRASS GIS əmrlərini təhlil etmək

Standart GRASS vektor əmrlərini çalıştırmak üçün Python istifadə edə bilərsiniz (db.execute,v.db,v.db. yeniləməvə s., məsələn, Programatione və GIS-də Antonio Alliegro-nun Python skriptlərinə baxın: Python (italyan dilində), GRASS GIS üçün Python Scripts və ya gVect () sinifli pgis

SQL (GRASS GIS-də SQL dəstəyi) istifadə edirlər, ancaq dbf sürücüsündən istifadə edirsinizsə, məhdudiyyətlərinə görə bəzi əmrlərv.to.db.yenilənmədəstəklənmir (SQLite sürücüsünü istifadə edirsinizsə problem olmaz).

Dbf sürücüsü ilə prosesin nümunəsi kimi:

  1. iki atribut dəyərinin cəmi ilə yeni bir sütunun yaradılması

  2. atribut dəyərini dəyişdirin

Cədvəl:

# ilk sütun ZN = grass.read_command ("v.db.select", flags = "c", map = "geochimcal", col = "ZN") ZN = (ZN.split (" n")) ZN = ZN [0: (len (ZN) -1)] ZN ['40', '55', '65', '158', '44', '282', '62', '83', '84 ',' 97 ',' 61 ',' 58 ',' 40 ',' 54 ',' 75 ',' 129 ',' 77 ',' 87 ',' 74 ',' 47 ',' 58 ', '73', '64', '46', '63'] # ikinci sütun PB = grass.read_command ("v.db.select", flags = "c", map = "geochimcal", col = "PB" ) PB = (PB.split (" n")) PB = PB [0: (len (PB) -1)] yazdır PB ['17', '9', '16', '40', '16 ',' 166 ',' 18 ',' 22 ',' 37 ',' 69 ',' 62 ',' 19 ',' 17 ',' 23 ',' 33 ',' 72 ',' 19 ', '19', '39', '21', '30', '8', '37', '21', '20'] # masaya bir sütun əlavə et: grass.read_command ("v.db.addcol ", map =" geochimcal ", col =" SOMME int ") # cəmi hesablanması SOMME = üçündür (len (PB)) üçün i aralığında (len (PB)): SOMME [i] = int (ZN [i]) + int (PB [i]) yazdır SOMME [57, 64, 81, 198, 60, 448, 80, 105, 121, 166, 123, 77, 57, 77, 108, 201, 96, 106, 113, 68 , 88, 81, 101, 67, 83] # aralığında i üçün yeni sütunu doldurun (len (ZN)): sorğu = "GÜÇLƏNİN geochimcal SET SOMME =" + str (SOMME [i]) + "WHERE cat =" + str (i + 1) grass.write_command ("db.execute", stdin = sorğu)

Dəyəri dəyişdirin:

sorğu = "geochimcal SET SOMME =" + str (0) + "WHERE PH =" + str (6.9) grass.write_command ("db.execute", stdin = query)

GRASS GIS 7 və PyGRASS (vektor atributları) və ya atelye piqrası ilə daha asandır


Ümumi bir kernel üçün SVM ağırlıqlarını şərh etmək çətindir, lakin doğrusal SVM üçün həqiqətən faydalı bir şərh var:

1) Xətti SVM-də nəticəni sinifləri mümkün qədər yaxşı ayıran hiperplane olduğunu xatırladın. Ağırlıqlar sizə hiperplane ortogonal olan bir vektorun koordinatlarını verərək bu hiperplanı təmsil edir - bunlar svm.coef_ tərəfindən verilən əmsallardır. Bu vektoru w adlandıraq.

2) Bu vektorla nə edə bilərik? İstiqamət bizə proqnozlaşdırılan sinfi verir, buna görə hər hansı bir nöqtənin nöqtə məhsulunu vektorla götürsəniz, bunun hansı tərəfdən olduğunu deyə bilərsiniz: nöqtə məhsulu müsbətdirsə, müsbət sinfə aiddir, mənfi olarsa mənfi sinfə aiddir.

3) Nəhayət, hər bir xüsusiyyətin əhəmiyyəti haqqında bir şey öyrənə bilərsiniz. Bu mənim öz şərhimdir, buna görə əvvəlcə özünüzü inandırın. Deyək ki, svm məlumatları ayırmaq üçün yalnız bir xüsusiyyət faydalı olardı, onda hiperplane bu oxa dikbucaqlı olardı. Beləliklə, deyə bilərik ki, digərinə nisbətən əmsalın mütləq ölçüsü bu xüsusiyyətin ayrılma üçün nə qədər vacib olduğunu göstərir. Məsələn, ayrılmaq üçün yalnız ilk koordinat istifadə olunarsa, w (x, 0) şəklində olacaq, burada x bəzi sıfır saydır və sonra | x |> 0.


Addım 1: Giriş məlumatlarını araşdırmaq

1.1 Vizual və statistik məlumatların yoxlanılması

Kataloqda, nümunə nöqtələri ilə nöqtə xəritəsini seçin. Siçanın sağ düyməsini basın və kontekstə həssas menyudan Xüsusiyyətlər seçin. Nöqtə xəritəsi - Xüsusiyyətlər informasiya qutusu açılır.

Kataloqdakı nöqtə xəritəsini iki dəfə vurun. Ekran Seçimləri - Nöqtə Xəritəsi informasiya qutusu təqdim olunur. Tamam düyməsini basaraq standartları qəbul edin. Nöqtə xəritəsi açıldı. Yoxlayın paylama nümunə vizual olaraq. Ballarınızın təsadüfi olaraq paylandığını və ya qrup halında, müntəzəm və ya cütləşdiyini və s. Görünməsini araşdırmağın başqa bir yolu bir Nümunə Analizi etməkdir.

Mümkün olan nümunə nöqtələrinin olduğuna və bal bölgüsünün Kriging interpolasiyası üçün kifayət qədər yaxşı olduğuna qərar verərsinizsə, ölçü ən qısa və ən uzun məsafə nöqtə xəritəsindəki iki nümunə nöqtəsi arasında.

Həm ən qısa, həm də ən uzun nöqtə cütlüyünün uzunluğunu Xəritə pəncərəsinin alətlər panelindən Ölçmə məsafəsi düyməsiylə (kompas cütü) ölçmək olar. Tərifini təyin etmək üçün daha sonra bu məsafə məlumatlarına ehtiyacınız var gecikmələrin sayıgecikmə aralığı Variogram Səthi əməliyyatında (addım 1.2), Mekansal Korrelyasiya və ya Çapraz Variogram əməliyyatında (addım 2.1).

Müvafiq bir Kriging interpolasiyası etmək üçün kifayət qədər nümunə nöqtələriniz varsa, məlumat dəstinizi iki hissəyə bölün. Bir hissəsini interpolasiya üçün, digər hissəsini interpolasiya edilmiş xəritənin yoxlanılması üçün istifadə edin.

Sonra hesablayın dispersiya nümunə məlumat dəstinin.

  • İnterpolasiya etmək istədiyiniz dəyər məlumatları xəritənin atribut cədvəlinin sütununda saxlanıldıqda: atribut cədvəlini açın. Dəyərlər nöqtə xəritəsinin özündə saxlanıldıqda, kontekstə həssas menyu vasitəsilə cədvəl kimi nöqtə xəritəsini açın. Cədvəl pəncərəsindəki Sütunlar menyusundan Statistika əmrini seçin. Sütun Statistikası informasiya qutusunda:
    • Varyans funksiyasını seçin və
    • varyansı hesablamaq istədiyiniz giriş dəyişənini seçin.
    • OK düyməsini basın. Bu hesablanmış dispersiyanı variogramı modelləşdirərkən eşik üçün bir göstərici kimi istifadə edə bilərsiniz (addım 3.1).

    Tədqiq olunan dəyişənin dəyişməsi bütün istiqamətlərdə eyni olmadıqda, anizotropiya mövcuddur. Şübhəli anizotropiya halında, Variogram Səthi əməliyyatı ilə Variogram Səthini hesablayın.

    • Kataloqdakı nöqtə xəritəsini seçin. Siçanın sağ düyməsini basın və kontekstə həssas menyudan Statistika, Variogram Səthi seçin.
    • Variogram Səthi informasiya qutusu açılmışdır. Nöqtə xəritəsinin bir atribut cədvəlinə bağlı olması halında, nümunə məlumatları ilə atribut sütununu seçin. Gecikmə aralığını, gecikmə sayını və çıxış xəritəsi üçün bir ad daxil edin.
    • Göstər onay qutusunu seçin və OK düyməsini basın. Variogram səthi xəritəsi hesablanır.

    Çıxış xəritəsini, bir histoqram hesablanarkən, Pseudo təsvirini istifadə edərək bir xəritə pəncərəsində ən yaxşı şəkildə görmək olar. Çıxış raster xəritəsindəki koordinatları və mənşə mövqeyini görmək üçün, şəbəkə məsafəsinin göstərilən gecikmə aralığına bərabər olduğu ızgara xətləri əlavə edə bilərsiniz. Sahənin / çıxış xəritəsinin mənşəyini tanımaq vacibdir.

    • Çıxış xəritəsinin mənşəyinə yaxın yarı-variogram dəyərlərinin bir-birinə çox yaxın məsafələrdə nöqtələrin dəyərlərinin bənzər olması səbəbindən kiçik olması (Pseudo təmsilində mavi) olması gözlənilir. Anizotropiya olmadıqda, yarı variogram dəyərləri tədricən mənşədən bütün istiqamətlərə doğru artacaqdır. Beləliklə, mənşədən çölə bənzər formalar tapacaqsınız, burada rəngin başlanğıcda mavi rəngdən yaşıl və mənşədən daha qırmızıya doğru tədricən dəyişir.
    • Giriş məlumatlarınız olmalıdır anizotrop mənşədən keçən müəyyən bir istiqamətdə aşağı yarı variogram dəyərlərinin ellipsə bənzər bir formasını tapdığınızda (Pseudo təmsilində mavi). Bu istiqamətdə yarı variogram dəyərləri çox artmır. Bununla birlikdə, dik istiqamətdə, yarı variogram dəyərlərinin açıq bir artımını tapırsınız: başlanğıcdakı mavi ilə yaşıl və mənşədən daha qırmızı olan qırmızıya qədər. Anizotropiya varsa, Anisotropic Kriging istifadə etməlisiniz.

    Anizotropiyanın istiqamətini xəritə pəncərəsinin alətlər panelindəki məsafəni ölç düyməsini ölçə bilərsiniz, məs. süjetin mənşəyindən keçən mavi piksellərin bir "xəttini" izləməklə. Bu bucağa daha sonra addım 2.1-də (Mekansal Korrelyasiya ikitərəfli metod) və addım 4.3-də (Anizotropik Kriging) ehtiyacınız var.

    • Çıxış xəritəsindəki yarı variogram dəyərləri giriş məlumatlarınızın ümumi fərqliliyi ilə müqayisə edilə bilər (addım 1.1-də hesablanmışdır)
    • Müəyyən bir istiqamət məsafəsi sinifində heç bir nöqtə ilə qarşılaşmadıqda, bu səthdəki hüceyrənin / pikselin yarı variogram dəyəri təyin olunmayacaqdır.
    • Çox az yarı variogram dəyərləri arasında bir çox təyin olunmamış yarı variogram səth dəyəri tapdığınız zaman, gecikmə aralığını artırmağı düşünməlisiniz. Fərdi istiqamət məsafəsi siniflərində 30 baldan çox cüt olduqda nəticələrin daha etibarlı olacağını düşünün.
    • Əsasən səthin xarici hissələrində çox sayda təyin olunmamış yarı variogram dəyərinə rast gəldikdə, gecikmə aralığını azaltmağı düşünməlisiniz.
    • Çox nöqtəli bir giriş nöqtəsi xəritəsini istifadə edərkən, böyük bir səthin hesablanması olduqca uzun ola bilər. Əməliyyatdan daha az gecikmə və / və ya kiçik bir gecikmə aralığı ilə istifadəyə başlamaq tövsiyə olunur.

    A nəzərə alaraq bir Kriging əməliyyatı (yəni Universal Kriging) həyata keçirilə bilər yerli sürüşmə və ya trend interpolyasiya ediləcək hər piksel ətrafında müəyyən edilmiş məhdud məsafədə mövcud olması lazım olan. Çox vaxt tendensiyanı onsuz da bilirsiniz:

    • Kriging interpolasiya metodundan istifadə etmək istədiyinizə qərar vermədən əvvəl, hərəkətli səth və ya bir Trend səthi kimi başqa bir interpolasiya texnikası tətbiq etdikdə və ya
    • dəyişənin təbii davranışını bildiyiniz zaman (məsələn, çay kənarının yaxınlığındakı torpaq toxumaları əksər hallarda arxa bataqlıq ərazisindən daha həddlidir).

    Əgər qlobal trend nümunə dəstində mövcuddur, TabCalc ifadəsi ilə giriş məlumatlarının meylini çıxarın. Ən populyar məlumat dəstində Adi Kriging həyata keçirin və hər iki çıxış xəritəsini yenidən əlavə etmək üçün MapCalc istifadə edin. Bu metod Universal Kriging üçün alternativdir. Ancaq bu alternativin böyük bir dezavantajı, səhv xəritəsinin səhv olmasıdır.

    Əgər qərar verirsinizsə Tədqiq olunan dəyişən seyrək seçilmişdir, olub olmadığını öyrən daha yaxşı nümunə götürülən başqa bir dəyişən və bir çox uyğun nümunə nöqtəsinə (eyni XY koordinatları) malikdir.

    Nöqtə xəritəsinə bağlanan atribut cədvəlini açın. Dəyər etki alanlarına və müvafiq XY koordinatlarına sahib iki sütun olub olmadığını öyrənin. İkinci bir dəyişən varsa, hər iki dəyişənin varyansını ayrı-ayrılıqda və iki sütun arasındakı əlaqəni hesablayın.

    İki dəyişən bir-biri ilə çox əlaqəli olduqda, daha yaxşı seçilmiş dəyişəndən və iki dəyişən arasındakı əlaqədən istifadə edərək, seyrək seçilmiş olanı CoKriging ilə interpolasiya etməyə kömək edə bilərsiniz.

    İki dəyişən arasındakı korrelyasiya zəifdirsə, başqa bir interpolasiya texnikasından istifadə etməyiniz və ya ümumiyyətlə interpolyasiya etməməyiniz məsləhət görülür.

    • İki dəyişən arasındakı korrelyasiya mənalı olmalıdır. Başqa sözlə, fiziki münasibətlərə / qanunlara (məsələn, temperatur və nisbi rütubət, temperatur və hündürlük) əsaslanmalıdır.
    • Dəyişən zəif seçilmişsə və seyrək götürülmüş olanı interpolyasiya etməyə kömək edəcək başqa bir dəyişən yoxdursa, nəticələrin çox məna vermədiyi üçün interpolasiya etmək ağıllı deyil. Nümunə dəyərlərinin ortalamasını götürmək interpolasiya etmək qədər yaxşıdır.
    • Dəyişən nadir bir nümunə götürülürsə, sahəyə qayıtmaq və daha çox ölçmə aparmaq barədə düşünə bilərsiniz.

    Python-da Kategorik Dəyişənləri Bivariate Analysis istifadə edərək görüntüləyin

    İki dəyişkənlik təhlili iki dəyişən arasındakı əlaqəni tapır. Burada əvvəlcədən təyin olunmuş əhəmiyyət səviyyəsində dəyişənlər arasındakı əlaqə və ayrılma axtarırıq.

    Kategorik və amp davamlı: Kategorik və davamlı dəyişənlər arasındakı əlaqəni tapmaq üçün Boxplots istifadə edə bilərik

    Boxplots, ədədi məlumatların bölüşdürülməsini qrafik olaraq ümumiləşdirmək üçün başqa bir dəyişkən süjet növüdür. Pd.boxplot () funksiyasından istifadə edərək bir karat qutusu hazırlayaq:

    Yeşik qutusunun mərkəzi qutusu müşahidələrin orta 50% -ni təmsil edir, mərkəzi çubuq orta hissədir və nöqtəli xətlərin (bığlar) ucundakı çubuqlar müşahidələrin böyük əksəriyyətini əhatə edir. Bığların ucundan kənarda olan dairələr, daha yüksək ola biləcək məlumat nöqtələridir.

    Yuxarıdakı qutu maraqlıdır: biz daha yaxşı aydınlığa sahib olan almazların daha yüksək qiymətlər alacağını gözləyirik və bununla birlikdə aydınlıq spektrinin ən yüksək ucundakı almazları (IF = daxili qüsursuz) əslində aşağı aydınlıqlı almazlardan daha aşağı orta qiymətlərə sahibik!


    Həqiqi zamanlı trafik və POI istifadə edərək Trafik Tıxaclarına Torpaqdan İstifadənin Təsir Analizi

    Bu sənəd, onlayn xəritə məlumatlarını istifadə edərək Çinin Pekin şəhərində tıxac nöqtələrini təsvir etmək, müqayisə etmək və təsnif etmək üçün yeni bir metod təklif etdi və tıxacla torpaq istifadəsi arasındakı əlaqəni daha da ortaya qoydu. Maraqlı nöqtə (POI) və real vaxt trafiğinin məlumatları Pekinin dördüncü dairəvi yolundakı ərazinin elektron xəritəsindən çıxarıldı. POI-lər ərazi istifadəsinin memarlıq sahəsinə əsasən kəmiyyət göstərilib tıxac nöqtələri real vaxt trafikinə əsasən müəyyənləşdirilib. Sonra əsas tıxac bölgələrini müəyyənləşdirmək üçün tıxac vaxtının atributlarından istifadə edilən klaster analizi aparıldı. Tıxac vaxtı və ərazi istifadəsi arasındakı xətti reqressiya analizinin nəticəsi ticarət ərazi istifadəsinin yüksək nisbətinin trafik sıxlığına təsirinin əhəmiyyətli olduğunu göstərdi. Tıxac vaxtı ilə dörd növ torpaq istifadəsi nisbəti arasında xətti bir regresiya təhlili aparmaqla beş növ torpaq istifadəsini nəzərdən keçirdik. Nəticələr göstərdi ki, torpaq istifadəsi növlərinin məqbul nisbəti tıxac vaxtını səmərəli şəkildə azalda bilər. Bu iş şəhər ərazilərindən istifadə siyasətinin hazırlanmasına öz töhfələrini verir.

    1. Giriş

    Çinin şəhərləşməsi sürətləndikcə, şəhər ərazilərinin xərcləri ictimai trafikin həddindən artıq cəmləşməsinə gətirib çıxarır və şəhər trafikində artan tıxacların yaranmasına səbəb olur. Torpaq istifadəsi cəmi cəlb olunan istiqaməti, nəqliyyat axınının nisbətini və səyahət trafikini təsir edir ki, bu da ictimai nəqliyyat tələbi ilə əlaqəli amillərdir. Şəhər ərazilərinin əsaslı şəkildə planlaşdırılması şəhər trafiki səmərəli fəaliyyətini təmin etmək üçün vacibdir. Bu səbəbdən, ərazi istifadəsi ilə tıxaclar arasındakı əlaqəni başa düşmək, şəhər trafikini optimallaşdırmağa kömək edə bilər.

    Tıxaclardakı trafik məlumatları geniş miqyaslı və mürəkkəb yer-zaman məlumatlarını əhatə edir və trafik məlumatlarının çıxarılmasını çətinləşdirir. Bundan əlavə, trafik məlumatlarının mənbəyi asanlıqla mövcud deyil. Əvvəlki tədqiqatlar [1-6] coğrafi məlumatları (uzunluq və enlik koordinatları, kateqoriyalar və xüsusi yer məlumatları) nəzərə almadan ənənəvi metodlarla (şərti dörd addımlıq səyahət tələbi modeli) trafik axınına yönəlmişdir. Ənənəvi dörd addımlıq səyahət tələbi modeli, adətən, yüksək qiymət, aşağı dəqiqlik və aşağı effektivliyə malik fərdi tədqiqat məlumatları üzərində işləyir. Beləliklə, şərti dörd pilləli modellərə sürətli, dəqiq alternativ kimi xidmət edən coğrafi informasiya sistemlərindən (CİS) istifadə edərək tıxac nöqtəsini qiymətləndirmə metodunu inkişaf etdirmək lazımdır.

    Ədəbiyyatda, trafik sıxlığı ilə şəhər ərazilərinin istifadəsi arasındakı əlaqəni araşdırmaq üçün trafik sıxlığı ilə bağlı məhdud modellər təklif edilmişdir. Məsələn, Wingo Lowdon nəqliyyatın, yerləşmənin və şəhər ərazilərinin istifadəsinin istehlakçıların yaşayış yerlərindən iş yerlərinə səyahətini necə təsir etdiyinə dair iqtisadi modeli qurdu [7]. Alonso [8] bu modeli şəhər ərazilərinin dəyərini nəzərə alaraq təkmilləşdirdi və fərqli şəhər sahələrinin dəyərinin şəhər mərkəzinə nəqliyyat xərcləri ilə mənfi əlaqəli olduğunu tapdı. İzraeli və McCarthy [9] (1985) yaşayış sahələrinin tıxacları təsir etdiyini, əhali sıxlığı və gediş-gəliş vaxtı arasında əhəmiyyətli dərəcədə müsbət bir əlaqə olduğunu tapdılar. Handy [10] torpaq istifadəsinin səyahət xüsusiyyətlərinə təsirini təhlil etdi və torpaq istifadəsinin sıxlığı artdıqca səyahət tezliyinin azaldığını və səyahət sürəti azaldıqca səyahət məsafəsinin artdığını aşkar etdi. Gordon et al. [11] (1989), 1980-ci ildə ABŞ-ın 82 metropol sahəsinin peyk məlumatlarını təhlil edərək, müxtəlif ərazi istifadə növlərinin (sakinlərin tipi, sənaye və ticarət) sıxlıqlarına dair məlumatları çıxardı. O dövrdə məşğulluq nisbətini nəzərdən keçirərkən sənaye sıxlığının artmasının avtomobilin gediş-gəliş müddətini, yaşayış və ticarət sıxlığını aşağı salacağı təsbit edildi. Ewing və s. [12] (2003), 1990 və 2000-ci illərdəki 83 metropoliten bölgəsinin kəsikli məlumatları istifadə edərək torpaq istifadəsinin gediş-gəliş vaxtına və piyadaların gecikməsinə təsirini araşdırdı. Nəticələr bu iki il ərzində gediş-gəliş müddətinin mənfi əlaqəli olduğunu göstərdi. qarışıq torpaq istifadəsi indeksi ilə və küçə əlçatanlığı ilə müsbət əlaqələndirildi.

    Təhlil və təsnifat üçün mürəkkəb olan şəhər ərazi atributu məlumatlarından fərqli olaraq, şəhər ərazi atributları və şəhərsalma rəhbərliyi ilə sıx əlaqəli maraq nöqtəsi (POI) məlumatları asanlıqla kəmiyyət və analiz edilə bilər. Yu və Ai [13] şəhər POI məlumatlarının məkan bölgüsünün xüsusiyyətlərini müzakirə etdilər və ərazi planlaşdırmasına rəhbərlik vermək üçün şəbəkə nüvəsinin sıxlığını qiymətləndirmək üçün bir model təklif etdilər. Ma et al. [14] nəqliyyat xərclərini azaltmağa kömək etmək üçün magistral nəqliyyatın POI-ləri üçün vizual axtarış modeli təklif etdi. Liu və s. [15] POI-lərin cəlbediciliyini taksilərin POI-lərin yaxınlığında dayanma sayına görə hesabladı.

    Heç bir ədəbiyyat real vaxt trafik məlumatlarını POI məlumatlarına inteqrasiya etməyib. Şəhər yolu şəbəkəsi məlumatları, real vaxt trafik məlumatları və POI məlumatlarını istifadə edərək, bu iş trafik sıxlığı ilə şəhər ərazilərindən istifadənin fərqli atributları arasındakı əlaqəni araşdırdı və şəhər trafik sıxlığı coğrafi modelinin təkamülünü qurdu. Bu tədqiqatın nəticələri şəhər ərazilərindən istifadənin planlaşdırılmasında siyasət hazırlanmasına kömək edəcəkdir.

    2. POI-nin tətbiqi və çıxarılması

    2.1. POI-nin tətbiqi

    Coğrafi İnformasiya Sistemində POI-lərə evlər, mənzərəli yerlər, mağazalar və poçt qutusu daxildir. POI-lərdən alınan məlumatlar uzunluq və enliyin koordinatlarını, kateqoriyalarını, xüsusi yer məlumatlarını və İstifadəçi identifikasiyasını (UID) ehtiva edir. Bu işdə şəhər yerləri haqqında çox sayda məlumat qeydə alındığı üçün Pekin POI-lərinin elektron xəritəsi istifadə edilmişdir.

    2.2. POI-nin təsnifatı və çıxarılması

    Pekin POI-lərinin standart təsnifatı, birinci sinif kimi 16 kateqoriyadır və ikinci sinif kimi 96 kateqoriyadır, bunların əksəriyyəti sakinlərin səyahət etməsi ilə əlaqəli deyil. Bu iş, sakinlərin səyahət məqsədlərini yaxşı təmsil edən Pekin POI-lərinin daha yaxşı bir təsnifatını əldə etmək üçün ətraflı bir sorğu keçirdi. Nəticə göstərir ki, "iş", "məktəb", "alış-veriş", "istirahət" və "evə qayıtmaq" Pekin sakinlərinin əsas səyahət məqsədləridir və Cədvəl 1-də göstərildiyi kimi ümumi səyahətlərin təxminən 85% -ni təşkil edir. Beləliklə, Cədvəl 2-də göstərildiyi kimi, təhsil, iş, alış-veriş, yaşayış və istirahət daxil olmaqla təsnifat üçün yeni POI kateqoriyaları yaradıldı.


    $ U: mathbb R ^ n to mathbb R $, $ x mapsto u (x) = x ^ Tx $ olsun. $ X $ -da $ x $ olan qradiyent deyilən $ ell_x: mathbb R ^ n to mathbb R $ xətti tətbiqi mövcuddur.

    $ z to0 $ olduqda. $ Ell_x $ -ı hesablamaq üçün $ u (x + z) = (x + z) ^ T (x + z) = x ^ Tx + z ^ Tx + x ^ Tz + z ^ Tz = u (x) + 2x ^ Tz + o ( | z |), $ buna görə $ ell_x (z) = 2x ^ Tz. $ Mathbb R ^ n $ hər bir xətti forma $ ell: z mapsto w ^ Tz $ for $ mathbb R ^ n $ for $ mathbb R ^ n $, buna görə də tez-tez $ ell $ ilə $ w $ (texniki olaraq bu ikili $ mathbb R ^ n $ ilə $ mathbb R ^ n $). İndiki halda, $ 2x $ (element) ilə $ el $ x $ gradientini ($ mathbb R ^ n $ ilə mathbb R $ arasındakı xətti tətbiq) müəyyən edə bilərsiniz. of mathbb R ^ n $) və həqiqətən, biri tez-tez $ ( text) düsturunu oxuyur u) (x) = 2x. $


    Nəticələr və gələcək iş

    Bu sənəd həm maşın öyrənmə alqoritmlərindən, həm də əvvəlki kiber cinayət hadisələrinin məlumatlarını istifadə edərək kiber hücumları proqnozlaşdıran və aşkarlayan bir metod təklif edir. Modeldə, hücuma məruz qala biləcək insanların xüsusiyyətləri və hansı hücum metodlarına məruz qala biləcəyi proqnozlaşdırılır. Maşın öyrənmə metodlarının kifayət qədər uğurlu olduğu müşahidə edilmişdir. SVMs xətti metodu bu metodlardan ən uğurludur. Modeldə kiber hücum edəcək təcavüzkarın proqnozlaşdırılmasının müvəffəqiyyət nisbəti% 60 civarındadır. Digər süni zəka metodları bu nisbəti artırmağa çalışa bilər. Yanaşmamızda xüsusilə zərərli proqram və sosial mühəndislik hücumlarına diqqət çəkmək lazım olduğu qənaətinə gəlinir. Qurbanın təhsili və gəlirinin səviyyəsi nə qədər yüksəkdirsə, kiber hücum ehtimalı o qədər az olduğu məlum olub. Bu tədqiqatın əsas məqsədi hüquq mühafizə orqanlarına kiber cinayətkarlıqla mübarizə aparılması və cinayət və cinayətkarların aşkarlanmasında daha sürətli və təsirli həll yolları təqdim etməkdir. Analiz işimizdə ortaya çıxan hücum qurbanlarının xüsusiyyətlərinin qiymətləndirilməsi ilə oxşar xüsusiyyətlərə sahib insanlar üçün yeni təlim və xəbərdarlıq sistemləri yaradıla bilər.

    Gələcək işlər üçün cinayət, cinayət, qurban profilinin və kiber hücumların dərin öyrənmə alqoritmləri istifadə edilərək proqnozlaşdırıla bilər və nəticələr müqayisə edilə bilər. Cinayət məlumat bazalarına sahib olan digər səlahiyyətli bölmələrlə aparılan danışıqlara əsasən, digər vilayətlərin kiber cinayət məlumatları da bu araşdırma ilə müqayisə üçün istifadə edilə bilər. Digər vilayətlərin məlumatları oxşar tədqiqatlarla müqayisə edilə bilər. Cinayət və cinayətkarlarla mübarizədə hüquq mühafizə orqanlarına faydalı ola biləcək ağıllı cinayət qurbanlarının aşkarlanması sistemləri cinayət nisbətlərini azaltmaq üçün yaradıla bilər.


    SDC metodlarının təsnifatı

    SDC metodları aşağıdakı kimi təsnif edilə bilər narahat olmayannarahat (bax HDFG12).

    • Qarışıq olmayan metodlar məlumatların strukturunu təhrif etmədən müəyyən dəyərlərin ümumiləşdirilməsi və ya basdırılması (yəni maskalanma) ilə məlumatdakı detalı azaltmaq.
    • Perturbativ metodlar verilənlər bazasındakı dəyərləri basmayın, həqiqi dəyərlər ətrafında qeyri-müəyyənlik yaradaraq açıqlama riskini məhdudlaşdırmaq üçün dəyərləri pozun (yəni dəyişdirin).

    Həm təsirləndirməyən həm də perturbativ metodlar kategorik və davamlı dəyişənlər üçün istifadə edilə bilər.

    Bunları da ayırırıq ehtimaldeterministik SDC metodları.

    • Ehtimal metodları bir ehtimal mexanizmindən və ya təsadüfi say yaradan mexanizmdən asılıdır. Hər ehtimal metodundan istifadə edildikdə fərqli bir nəticə əldə edilir. Bu üsullar üçün çox vaxt təkrarlana bilən nəticələr əldə etmək istəyirsinizsə, təsadüfi ədədi yaradan üçün bir toxumun qoyulması tövsiyə olunur.
    • Deterministik metodlar eyni parametrlər dəsti ilə eyni məlumatlara təkrarən tətbiq edildikdə müəyyən bir alqoritmi izləyin və eyni nəticələr əldə edin.

    Mikro məlumat üçün SDC metodları şəxsiyyət və atributun açıqlanmasının qarşısını almaq niyyətindədir. Hər bir açıqlama nəzarəti növü üçün fərqli SDC metodlarından istifadə olunur. Yenidənqurma və yatırma kimi metodlar şəxsiyyətin açıqlanmasının qarşısını almaq üçün yarı identifikatorlara tətbiq olunur, üstəlik kvazi identifikatorunu (məsələn, gəlir) kodlaşdırmaq və ya həssas dəyişəni narahat etmək atributun açıqlanmasının qarşısını alır.

    Bu təcrübə təlimatı istifadəsi ətrafında yazıldığı üçün sdcMicro paketdə tətbiq olunan yalnız SDC metodlarını müzakirə edirik sdcMicro paket və ya asanlıqla həyata keçirilə bilər R. Bunlar ədəbiyyatdan ən çox tətbiq olunan və bu metodlardan istifadə təcrübəli əksər qurumlarda istifadə olunan metodlardır. Cədvəl 6 bu təlimatda müzakirə olunan SDC metodları, onların təsnifatı, tətbiq oluna bildikləri məlumat növləri və funksiya adları barədə ümumi məlumat verir. sdcMicro paket.

    Cədvəl 6 SDC metodları və müvafiq funksiyalar sdcMicro
    Metod SDC metodunun təsnifatı Məlumat növü SdcMicro-dakı funksiya
    Qlobal kodlaşdırma narahat olmayan, determinitik davamlı və qəti qlobalRecode, groupVars
    Üst və alt kodlaşdırma narahat olmayan, determinitik davamlı və qəti topBotCoding
    Yerli yatırma narahat olmayan, determinitik qəti localSupressiya, localSupp
    PRAM narahat, ehtimal qəti uşaq arabası
    Mikro aqreqasiya narahat, ehtimal davamlı mikroaqregasiya
    Səs əlavə narahat, ehtimal davamlı addNoise
    Qarışdırmaq narahat, ehtimal davamlı qarışdırmaq
    Rütbə dəyişdirmə narahat, ehtimal davamlı dərəcə dəyişdirmə


    Ağırlıq vektorunda l-1 cəzası istifadə edirsinizsə, əhəmiyyətsiz atributlara uyğun çəkilər avtomatik olaraq sıfıra ayarlandığından avtomatik xüsusiyyət seçimi edir. Bu kağıza baxın. Hər sıfır olmayan çəkilərin (mütləq) böyüklüyü müvafiq atributun əhəmiyyəti barədə bir fikir verə bilər.

    Atribut seçiminə rəhbərlik etmək üçün SVM-lərdən alınan meyarlardan istifadə edən bu məqaləyə də baxın.

    Isabelle Guyon, André Elisseeff, "Dəyişən və Xüsusiyyət Seçiminə Giriş", JMLR, 3 (Mart): 1157-1182, 2003. http://jmlr.csail.mit.edu/papers/v3/guyon03a.html

    oxumağa dəyər, yanaşmalara və məsələlərə yaxşı bir baxış verəcəkdir. Əlavə edəcəyim bir şey budur ki, xüsusiyyət seçimi mütləq proqnozlaşdırıcı performansı artırmır və asanlıqla daha da pisləşdirə bilər (xüsusiyyət seçmə kriteriyasına çox uyğunlaşmaq asandır). (Xüsusilə də xətti) SVM-lərin üstünlüklərindən biri çox sayda xüsusiyyətlə yaxşı işləmələridir (qanunauyğunluq parametrlərini düzgün tənzimləməyinizi təmin edir), buna görə yalnız proqnozlaşdırma ilə maraqlansanız tez-tez ehtiyac qalmır.

    R istifadə edirsinizsə, dəyişən əhəmiyyəti rminer paketindəki Əhəmiyyət metodu ilə hesablamaq olar. Bu mənim nümunə kodumdur:


    Miras ümumiyyətlə "var-a" münasibəti kimi təsvir olunur. Beləliklə, bir Heyvandan bir Köpək çıxardıqda, bir İtin Heyvan olduğunu söyləyə bilərik. Ancaq bir iti bir pişik çıxardığınız zaman, başqa bir planet olmadığı təqdirdə, bir pişikin bir köpək olduğunu doğru deyə bilmərik. Bundan əlavə, səhvsiz Tina.woof'u ('vahşi') "Tina yalnız vəhşi bir toxuma etdi" deyə çağırırıq. İndiyə qədər gördüyüm heç bir fars pişiyinin vəhşicəsinə "toxunduğu" ya da olmadığına görə bu, həyəcan verici və təəccüblü bir nəticədir.

    Həm Köpək, həm də Pişik növlərini Heyvandan əldə etmək daha yaxşı olardı. Əgər adları, cinsləri və cinsləri olmayan başqa heyvanlarınız varsa, Heyvan kimi əlavə detalları əks etdirən Pet kimi bəzi orta siniflərə sahib ola bilərsiniz. Əks təqdirdə, bu atributları Heyvana əlavə edin.

    Nəhayət, danışıq metodunu əsas Animal sinfinə qoya bilərik. Bir sadə illüstrasiya belədir:

    İnkişaf etdirilə bilən daha çox şey var, amma ümid edirəm ki, başqaları sualınızı qiymətləndirib daha geniş cavablar verənə qədər kömək edəcəkdir.


    Videoya baxın: VEKTOR-5BUCAQ (Oktyabr 2021).