Daha çox

Nəzarət olunan təsnifat üçün ROI-lərin seçilməsi üçün əsas qayda


Yarı Avtomatik Təsnifat Plugini və maksimum ehtimal təsnifatı alqoritmini istifadə edərək nəzarətli bir təsnifat aparmaq istərdim. "Əgər təlim məlumatları n zolaqdan çıxarılırsa, hər sinif üçün minimum> 10n piksel təhsil məlumatı toplanır" deyən bir qayda haqqında oxudum (Jensen). Altı bantlı bir Landsat görüntüsünü istifadə edirəm, buna görə hər sinif üçün ən azı 60 məşq pikseli seçməliyəm. Birtəhər qarışıq qaldım, çünki insanların da dərslər keçdiyinə görə 10 dəfə təhsil pikselinə ehtiyac olduğunu söylədiklərini eşitdim.

ROI seçmək üçün ümumi bir qayda varmı? Təlim piksellərini ətraflarına çoxbucaqlar çəkərək sayırsınız?


Bu, həqiqətən istifadə etdiyiniz təsnifçidən asılıdır. Veri paylanması və ya fərqli optimallaşdırma strategiyaları ilə bağlı fərqli fərziyyələr az və ya çox təlim məlumatları tələb edə bilər. Çox doğrudur ki, giriş sahəsinin artan ölçülü olması üçün boşluğu doldurmaq üçün daha çox təlim nümunəsi tələb olunur ("ölçülülüyün lənəti"). Bu, xüsusən məsafəyə əsaslanan funksiyalar üçün doğrudur, çünki Öklid məsafəsi işarələnməmiş yüksək ölçülü fəzalarda mənasını itirir. Qeyd edək ki, Gauss dağılımı Öklid / Mahalanobis məsafələrinə güvənir, buna görə də bu vəziyyətdə yaxşı nəticə göstərə bilməzlər. Mən deyərdim ki, bir qayda olaraq, nə qədər çox olsa, o qədər yaxşıdır. Hansı növ təsnifləndiricidən istifadə etməyi planlaşdırırsınız?

Bununla birlikdə, hər şeyi nümunə sayına yönəltmək əvəzinə, təlim məlumatlarınızla semantik sinifiniz üçün əhatə etdiyiniz dəyişkənlik miqdarına da diqqət yetirməlisiniz. Məsələn, siqnalın çox miqyaslı dəyişkənliyinə sahib olan bir meşə sinfini təsnif etmək istəyirsinizsə, bu dəyişiklikləri həqiqətən yaxşı təmsil edən ROI seçmək, bir növ ümumiləşdirməni yaxşılaşdırmaq və təmin etmək istəyə bilərsiniz. Bir sinif "su" üçün kosmosdakı siqnal dəyişkənliyi ümumiyyətlə azdır və bir sinifləndirici az təlim nümunələri ilə də yaxşı ümumiləşdirə bilər.