Daha çox

QGIS-də çoxbucaqlar üçün əyri etiketlər düzəldirsiniz?


Bunun necə ediləcəyinə dair cavabları QGIS-in köhnə versiyalarında tapa bildim, amma görünən ən son hissə ilə əlaqəli bir şeyə rast gələ bilmirəm.

Etiketləri düzensiz formalı çoxbucaqlara əyri etmək üçün bir yola ehtiyacım var; bu vəziyyətdə çaylar.

Bu seçimin "Etiketlər" seçimlərində "Yerləşdirmə" altında veriləcəyini düşünürdüm, lakin heç bir yerdə tapa bilmədim.

QGIS 2.2-ə qədər mövcud olduğunu bilirəm və 2.6.1-ə daxil edilməli olduğunu düşünürəm. Mən bunu görmürəm.

Asan xüsusi etiketləmə plagininin əyri seçimindən xəbərdaram, amma lazım olduğu kimi görünmür.


Hal-hazırda əyri bir çoxbucaqlı etiket yoxdur.

Dassouki'nin təklif etdiyi kimi, daha sonra əyri etiketlərlə etiketlənə bilən xətlər yaratmaq üçün müxtəlif yanaşmalardan istifadə edə bilərsiniz. Bəzi etiket xəttlərini əl ilə çəkmək ən asan ola bilər - söz mövzusu xüsusiyyətlərin sayı çox deyilsə.


QGIS-də çoxbucaqlar üçün əyri etiketlər düzəldirsiniz? - Coğrafi İnformasiya Sistemləri

Geocachers, müxtəlif torpaq istifadəsi üçün apriori üstünlüklərini göstərmədilər.

Göstərilən üstünlükləri təqdirə məruz qaldı montado digər meşələrin üstündə.

Açıq və su mənzərələri üçün üstünlüklər də məruz qaldı.

Geocaching mədəni ekosistem xidmətləri üçün yaxşı bir göstəricidir.

Tanıtım Montado ziyarət, təminat xidmətlərinin asılılığını azalda bilər.


Giriş

Panqolinlər (Pholidota: Manidae) Afrika və Asiyanın bəzi bölgələrində tapılan böcəkverən məməlilərdir (Hua et al., 2015). Tərəzilərinə və ətlərinə olan istehlakçıların ciddi tələbatına görə dünyanın ən çox satılan vəhşi məməli heyvanları sayılırlar (Challender, Harrop & amp MacMillan, 2015 Cheng, Xing & amp Bonebrake, 2017). Tarixən həm Afrika, həm də Asiya növləri yerli olaraq istehlak üçün satılmışdır, lakin Asiyanın bəzi bölgələrində yerli populyasiya səviyyəsi azaldığına görə (Irshad et al., 2015 Challender, Nash & amp Waterman, 2020 Wu et al., 2004), tədqiqatçılar sənədləşdirmişlər Afrika pangolin populyasiyalarında azalmanın əsas səbəbi olduğu düşünülən Afrika pangolinlərinə (Challender, Harrop & amp MacMillan, 2015 Heinrich et al., 2016) Asiyadan tələbin dəyişməsi (IUCN, 2020). Əlavə olaraq, yaşayış mühitinin məhv edilməsi və yavaş reproduktiv dərəcələr, pangolinlərin həddindən artıq istismardan bərpa olunma sürətini məhdudlaşdırır (Heinrich və digərləri, 2016) və xəstəliklərə nəzarət və pəhriz ilə bağlı problemlər əsirlikdə yetişdirmə proqramlarının müvəffəqiyyətini məhdudlaşdırır (Hua və digərləri, 2015) ). Səkkiz növün hamısı, Beynəlxalq Təbiəti Qoruma Birliyi tərəfindən (Zərif, Təhlükəli və ya Kritik olaraq təhlükədə olanlar) siyahısına salındığı üçün (IUCN IUCN, 2020 Heinrich et al., 2016 Cheng et al., 2017), təhdidləri daha yaxşı başa düşmək və pangolinlərin qorunma vəziyyəti, onları qorumaq üçün hər şeydən üstündür.

2016-cı ildən bəri nəsli kəsilməkdə olan növlərin beynəlxalq ticarəti haqqında Konvensiyanın (CITES) Əlavəsi I-də yer alan səkkiz pangolin növünün siyahısına baxmayaraq, pangolin ticarəti ümumiyyətlə zəif sənədləşdirilmiş və ümumiyyətlə aşkar edildiyi təqdirdə təsirli bir şəkildə izlənilməmişdir (Heinrich et al., 2016), buna görə qlobal qanunsuz ticarətin pangolin populyasiyaları və paylanmaları üzərində faktiki təsiri bilinmir. Bundan əlavə, pangolinin mövcudluğuna dair müasir qeydlərin olmaması coğrafi dəyişiklikləri araşdırmağı və nəticədə onların tükənmə risklərini proqnozlaşdırmağı çətinləşdirir. Effektiv növlər üçün təhlükə qiymətləndirməsi zamanla növlərin coğrafi bölgüsündə baş verən dəyişikliklərə əsaslanır (meyar B, IUCN Qırmızı Siyahısı Kategoriyaları və Kriterlər IUCN, 2020). Beləliklə, pangolin paylamalarının son onilliklərdə necə dəyişdiyini anlamaq, onların populyasiyanın azalması barədə daha çox məlumat verəcək və nəticədə elmi əsaslı qoruma tədbirlərini məlumatlandıracaqdır.

Panqolinlərin qorunma vəziyyətini daha yaxşı başa düşmək üçün mümkün həll yollarından biri, əvvəllər insan alverçiləri tərəfindən hədəf alına biləcək bölgələri, yəni açıq bir şəkildə meydana gələn antropogen dəyişikliklər olmadan bölgələrin daha kiçik olduğu bölgələri vurğulamaq üçün keçmiş və mövcud paylamaları müqayisə etməkdir. Muzey nümunələri qeydləri, paylanma meyllərini təhlil etmək üçün lazım olan həm müvəqqəti, həm də məkan məlumatlarını təmin edə bilər (Boakes et al., 2010 Pyke & amp Ehrlich, 2010 Lister et al., 2011 McLean et al., 2016 Meineke et al., 2018). bahalı, vaxt aparan, uzunmüddətli anketlərdə (Newbold, 2010, baxmayaraq ki, muzey qeydlərinin Müzakirədə vurğuladığımız digər məhdudiyyətləri var). Nəticədə, tarixi məlumatların qeydləri müasir məlumatların azlığı nəzərə alınmaqla pangolinlər üçün mövcud təhdid qiymətləndirmələrini yaxşılaşdırmaq üçün asanlıqla istifadə edilə bilər.

IUCN SSC Pangolin Specialist Group (IUCN, 2020) tərəfindən coğrafi mənzərə xəritələri və yaşayış təsnifatları ilə Qlobal Biomüxtəliflik Məlumat Qurumundan (GBIF GBIF, 2019 və London, Təbii Tarix Muzeyi) pangolin muzeyi nümunəsi qeydlərindən istifadə edərək ərazi istehsal etdik. Tarixi nümunə yerləri ilə AOH-un bugünkü aralıkları arasındakı üst-üstə düşmələri araşdıraraq son 150 ildə pangolinlər arasındakı coğrafi sıra daralmalarını araşdıran yaşayış yeri (AOH) xəritələrinin siyahısı və arazi istifadəsinin təsirlərini də araşdırdıq. yaşayış itkisi üçün bir vəkil olaraq dəyişir və artan istismar üçün bir vəkil olaraq insan populyasiyası dəyişir (Woodroffe, 2000).


Bir Limon Myrtle əkin sahəsindəki Myrtle Rust (Austropuccinia psidii) üçün çox spektral, hava xəstəliyinin aşkarlanması

180 sm), göstərilən parametrlər piksel başına təxminən 2.8 sm bir torpaq nümunəsi məsafəsi əldə etdi. Əkində, mirq pasına nəzarətdə təsirli olduğu göstərilən funqisiddən istifadə edərək funqisidin təsirinin mirst pasından təsirlənmiş limon mirst ağaclarına (Lancaster və digərləri) hazırlandığı mövcud bir təcrübədən istifadə etdik [23]. . Aktiv xəstəliklərdən azad olan, onlara funqisid tətbiq etdikləri (“müalicə olunmuş”) və aktiv mersin pas infeksiyası simptomları göstərən ağacların (“müalicə olunmamış”) hava multispektral şəkillərini qeyd etdik. Müalicə olunan ağacların yarpaqlarında əksərən A. psidii infeksiyası əlamətləri göstərilməyib, baxmayaraq ki, bəzilərində funqisid tətbiq olunmadan əvvəl meydana gələn infeksiya səbəbi ilə kiçik bənövşəyi ləkələr var idi. A. psidii’dən əvvəl limon mirası üzərində başqa bir ciddi zərərvericinin və ya patojenin bilinmədiyi üçün digər biotik maddələrin təsirini istisna edirik (Müdir Gary Mazzorana, Avstraliya Rainforest Məhsulları, Lismore, Avstraliya, şəxsi əlaqə). Təcrübə dizaynı, təmizlənməməsi nəzərdə tutulan ağacların təsadüfən işlənməməsi üçün “tampon” ağacları kimi təyin edilmiş ağac cərgələri ilə ayrılmış iki işlənmiş və iki təmizlənməmiş ağac cərgəsindən ibarət idi (şəkil 1).


2 Təklif olunan alqoritm

Başlanğıc mərhələsi İnteraktiv dövrə Şəkil 2: Təklif olunan yanaşmanın yüksək səviyyəli icmalı: istifadəçi tərəfindən verilən məlumatlar effektiv qarşılıqlı fəaliyyətə imkan verən şəbəkənin girişini dəyişdirir - şəbəkənin özü deyil

İndi hava şəkillərinin interaktiv çox sinifli bölünməsi üçün təklif olunan yanaşmanı ətraflı şəkildə təsvir edirik. Xüsusilə, məqsədimiz iki məqsədlə bir sinir şəbəkəsi yetişdirməkdir:

heç bir xarici yardım olmadan səhnənin ilkin yüksək keyfiyyətli seqmentləşdirmə xəritəsinin hazırlanması

ilkin proqnozunu tez bir zamanda artırmaq üçün bir operator tərəfindən verilən şərhlərdən istifadə etmək.

Buna nail olmaq üçün orijinal quruluşunu qoruyan, lakin klassik girişlərin (məsələn, RGB) və şərhlərin (N kanallar, sinif başına bir) birləşməsini qəbul edən bir sinir şəbəkəsi təklif edirik. Bu şərhlər nöqtələrə vurulur. Diqqət yetirin ki, yalnız şəbəkənin girişləri dəyişdirilib, onun çəkiləri deyil: bu yanaşmanın sürətli olmasını təmin edir. Şəkil 2 yanaşmamızın yüksək səviyyədə icmalını təqdim edir.

Əvvəlcə təlim strategiyamızı müəyyənləşdiririk və daha sonra şərhlərin özləri üzərində işimizi təqdim edirik.

2.1 Təlim strategiyası

Aşağıda N siniflərindən ibarət bir seqmentasiya referansımız olduğunu düşünürük. Torpaq həqiqəti xəritələri təlim strategiyamızın əsasını təşkil edir. Bir tərəfdən, zərərləri hesablamaq və geri yaymaq üçün klassik olaraq istifadə olunur. Digər tərəfdən, onlar da şərhlər götürmək üçün təsadüfi şəkildə bölünürlər. Başqa sözlə, əsas həqiqətdən yalnız bir neçə piksel izahat kimi istifadə oluna bilər. Siniflərinə görə bu şərhlər alqoritmə giriş olaraq verilən N izahat kanallarında kodlanır. Müxtəlif annotasiya planları altında məşq etmək üçün, hər bir təlim nümunəsində seçilmiş izahatların sayı təsadüfi olur. Şəbəkə onsuz dəqiq bir seqment xəritəsi yarada bilməli olduğundan, izahat çatışmazlığı ehtimalı da seçilmişdir. Konkret olaraq bu vəziyyət, izahat kanallarının sıfırla doldurulması deməkdir.

Şərhlər siniflərindən asılı olmayaraq seçilirsə, aşağıdakı problem yarana bilər. Qiymətləndirmə mərhələsində, sub-təmsil olunan siniflərdəki şərhlər şəbəkə tərəfindən laqeyd edilə bilər, çünki təlim zamanı bu siniflərin şərh nöqtələrini çətinliklə görmüşdür. Buna görə proqnozlarını artırmaq üçün bunlardan necə istifadə edəcəyini öyrənməmişdir. Bu problemi aradan qaldırmaq üçün, sinif paylamalarına əsaslanan şərhləri seçmək üçün bir tezlik tarazlığı strategiyasından istifadə edirik. Təlim zamanı şəbəkənin hər sinifdən eyni zamanda qeydləri bərabər şəkildə görməsinə və buna görə də təlim bitdikdən sonra səmərəli şəkildə rəhbər olmasına imkan verir.

2.2 İzahat təqdimatı

Annotasiya təqdimatının iki aspektini araşdırırıq: ən faydalı məlumatları seçmək üçün kliklərin necə yerləşdirilməsi və ən yaxşı fayda əldə etmək üçün kliklərin necə kodlaşdırılması.

Mövqeyi vurun.

Səhv bir seqmentin düzəldilməsi sistemə doğru bölgü haqqında əlavə məlumat təqdim etməyi nəzərdə tutur. Tıklamalarla verilən yeni nümunələr ya bir nümunənin içini, ya da haşiyəsini təmsil edə bilər.

İlk vəziyyət ən intuitiv görünür. Tıklanan piksellər nümunələrin içərisindədir və şərh nöqtələri bu nümunələrlə əlaqəli sinfi təmsil edir. [41] -in əksinə olaraq, sərhədlərdən minimal məsafədə nümunə götürmürük, çünki proqnozu dəqiq tənzimləmək üçün bir şərhçinin kənarın yaxınlığına basa biləcəyini düşünürük. Annotasiyaların nümunələrin sərhədlərini təmsil etdiyi ikinci hal üçün bir kliklə əlaqəli kanal, kliklənmiş haşiyəyə bitişik olanlar arasında təsadüfi seçilmiş bir sinifə uyğundur.

Son istifadəçilərin yükünü yüngülləşdirməyi hədəfləyərək, şərhlərdə daha yumşaq məhdudiyyətləri də araşdırdıq. Həqiqətən, N izahat kanallarını istifadə etmək əvəzinə, onları bir izahat kanalına xülasə etdik. Sərhəd strategiyası üçün bu tək kanal yalnız bir sərhəd varlığını göstərir. Daxili nöqtə strategiyası üçün yalnız şəbəkənin əvvəlcə harada səhv etdiyini göstərir. Bu son strategiyanı həyata keçirmək üçün təlim prosesini bir az dəyişdirməli olduq. Şəbəkə səhv etiketlənmiş bölgələri tapmaq üçün istifadə olunan seqmentasiya xəritəsi yaratmaq üçün ilk nəticəni həyata keçirir. Daha sonra bu ərazilərdə qeydlər götürülür və ikinci nəticə çıxarılır. Yalnız bu ikinci nəticə qradiyentlərin geri yayılması üçün istifadə olunur. Bununla birlikdə, Bölmə 4.4-də göstərildiyi kimi, bu sadələşdirilmiş şərhlərdən heç biri seqmentləşdirmə tapşırığına səmərəli rəhbərlik etmək üçün ümidverici görünmür.

Kodlamaya vurun.

İstifadəçi klikləri müxtəlif yollarla kodlana bilər və bu, Şəkil 3-də göstərildiyi kimi sistemə az və ya çox miqyaslı məlumat verə bilər. Xüsusilə, hesab edirik:

Şərh nöqtələrinin ətrafında kiçik ikili sahə

Öklid məsafəsi bu nöqtələrin ətrafındakı xəritələri dəyişdirir

Şəkil 3: İkili (solda) və məsafəyə çevrilmə (sağda) vurun.

Bölmə 4-də göstərildiyi kimi, məsafəyə çevrilmə kodlaşdırması ilə daxili nöqtə strategiyası ən uğurlu birləşməyimiz kimi görünür.


QGIS-də çoxbucaqlar üçün əyri etiketlər düzəldirsiniz? - Coğrafi İnformasiya Sistemləri

Verilənlər bazalarından seçilmiş məzmunun maşın tərcüməsini istəmisiniz. Bu funksionallıq yalnız sizin rahatlığınız üçün təmin edilir və heç bir şəkildə insan tərcüməsini əvəz etmək üçün nəzərdə tutulmayıb. Nə BioOne, nə də məzmunun sahibləri və yayımçıları açıq şəkildə və ya hər hansı bir ifadə və ya zəmanətdən, o cümlədən tərcümə xüsusiyyətinin funksionallığı və ya dəqiqliyi və ya tamlığı ilə bağlı məhdudiyyət olmadan təqdimatlar və zəmanətlərdən açıq şəkildə imtina edirlər. tərcümələr.

Tərcümələr sistemimizdə saxlanılmır. Bu xüsusiyyətdən və tərcümələrdən istifadəniz BioOne veb saytının İstifadə Qaydaları və Şərtlərindəki bütün istifadə məhdudiyyətlərinə tabedir.

Qeydlər Medinilla İki yeni növ daxil olmaqla Filippin Palawan (Melastomataceae): M. simplicymosaM. ultramaficola

J. Peter Quakenbush, 1, * Pastor L. Malabrigo Jr, 2,3 Arthur Glenn A. Umali, 2 Adriane B. Tobias, 4 Lea Magarce-Camangeg, 5 Yu Pin Ang, 6 Rene Alfred Anton Bustamante 6

1 Bioloji Elmlər Bölümü, Western Michigan Universiteti, Kalamazoo, Michigan 49008-5200, ABŞ
2 Filippin Universiteti Meşə və Təbii Sərvətlər Kolleci, Meşə Bioloji Elmləri Bölümü, Los Ba & # 241os, Laguna, Filippinlər
3 Təbiət Tarixi Muzeyi, Filippin Universiteti Los Ba & # 241os, Laguna, Filippinlər
4 Lisansüstü Məktəb, Filippin Universiteti Los Ba & # 241os, Laguna, Filippinlər
5 Elmlər Kolleci, Palawan Dövlət Universiteti, Tiniguiban Heights, Puerto Princesa City, Palawan, 5300 Filippin
6 Filippin Taksonomik Təşəbbüsü, Inc, Botanika Binası, El Nido, Palawan, 5313 Filippin


QGIS-də çoxbucaqlar üçün əyri etiketlər düzəldirsiniz? - Coğrafi İnformasiya Sistemləri

Verilənlər bazalarından seçilmiş məzmunun maşın tərcüməsini istəmisiniz. Bu funksionallıq yalnız sizin rahatlığınız üçün təmin edilir və heç bir şəkildə insan tərcüməsini əvəz etmək üçün nəzərdə tutulmayıb. Nə BioOne, nə də məzmunun sahibləri və yayımçıları açıq şəkildə və ya hər hansı bir ifadə və ya zəmanətdən, o cümlədən tərcümə xüsusiyyətinin funksionallığı və ya dəqiqliyi və ya tamlığı ilə bağlı məhdudiyyət olmadan təqdimatlar və zəmanətlərdən açıq şəkildə imtina edirlər. tərcümələr.

Tərcümələr sistemimizdə saxlanılmır. Bu xüsusiyyətdən və tərcümələrdən istifadəniz BioOne veb saytının İstifadə Qaydaları və Şərtlərindəki bütün istifadə məhdudiyyətlərinə tabedir.

Hyptidendron pulcherrimum Antar & amp; Harley, sp. nov (Hyptidinae, Lamiaceae), Braziliyanın Minas Gerais’dən yeni ensiz bir endemik növüdür.

Guilherme Medeiros Antar, 1, * Raymond Mervyn Harley, 2 José Floriano Barêa Pastore, 3 Paulo Minatel Gonella, 4 Paulo Takeo Sano 5

1 Universidade de S & # 227o Paulo, Instituto de Bioci & # 234ncias, Departamento de Bot & # 226nica, Rua do Mat & # 227o 277, 05508-090, S & # 227o Paulo, SP (Braziliya)
2 Royal Botanic Gardens, Kew, Richmond, Surrey TW9 3AB, İngiltərə (Birləşmiş Krallıq) [email protected]
3 Santa Catarina Federal Universiteti, Campit de Curitibanos, Rod. Ulysses Gaboardi, km 3, 89520-000, Curitibanos, SC (Braziliya) [email protected]
4 Universidade Federal de S & # 227o Jo & # 227o del-Rei, Kampüs Sete Lagoas, Rodovia MG-424, km 47, 35701-970, Sete Lagoas, MG (Braziliya) [email protected]
5 Universidade de S & # 227o Paulo, Instituto de Bioci & # 234ncias, Departamento de Bot & # 226nica, Rua do Mat & # 227o 277, 05508-090, S & # 227o Paulo, SP (Brazil) [email protected]

* [email protected] (müvafiq müəllif)

Mümkün olduqda PDF və HTML daxildir

Bu məqalə yalnız mövcuddur abunəçilər.
Fərdi satış üçün mövcud deyil.

Hiptidendron Hyptidinae alt qəbiləsi ilə tanınan 19 cinsdən biri olan Harley, bəzi növlərini dar campos rupestres (Braziliya bitki örtüyü forması) yayılması, çox vaxt tək bir dağ silsiləsi ilə məhdudlaşır. Yeni bir növü bildiririk, Hyptidendron pulcherrimum Antar & amp; Harley, sp. Nov., Serra do Padre Ângelo'daki tək bir dağın endemik bölgəsi, ayrı bir bölgə campos rupestres yaxınlarda bəzi yeni angiosperm növlərinin təsvir olunduğu yer. Yeni növ, əyri, sərt, geniş əsaslı tüklərdən ibarət olan indumentum, dikasiyal kimya şəklində düzülmüş çiçəklərin morfoloji birləşməsi, unikaldır, petiolate yarpaqları, cilalı və boğa, corolla tomentose, borusu əyri, 7.5-10 mm uzunluğunda və meyvə calyx başına bir az qanadlı qoz-fındıq. Yeni növ ilə müqayisə olunur Hyptidendron vauthieri (Briq.) Harley morfoloji baxımından ən oxşar növlərdir. Yeni növ və bir-biri ilə sıx əlaqəli növlərlə birlikdə tam təsvir, diaqnoz, illüstrasiya, yayılma xəritəsini, fotoşəkil lövhəsini və qoruma vəziyyətinin qiymətləndirilməsini təmin edirik.

© Elmi nəşrlər du Muséum national d'Histoire naturelle, Paris.

Guilherme Medeiros Antar, Raymond Mervyn Harley, Jos & # 233 Floriano Bar & # 234a Pastore, Paulo Minatel Gonella, and Paulo Takeo Sano " Hyptidendron pulcherrimum Antar & amp; Harley, sp. nov (Hyptidinae, Lamiaceae), Braziliyanın Minas Gerais şəhərindən gələn yeni dar bir endemik növ, "Adansonia 43 (1), 1-8, (18 yanvar 2021). Https://doi.org/10.5252/adansonia2021v43a1

Qəbul olundu: 12 Mart 2020 Qəbul edildi: 16 İyun 2020 Nəşr olundu: 18 Yanvar 2021


Materiallar və metodlar

Tədqiqat yeri və növ təsviri

Tədqiqat Puerto Rikonun şimal-şərqindəki El Yunque Milli Meşəsində (EYNF) aparılmışdır (şəkil 1). EYNF, Puerto Rikoda (Lugo 1994) ən böyük qorunan ərazidir (115 km 2) və 1074 m a.s.l yüksəkliyə yüksələn bir sıra dağ zəncirlərindən ibarətdir. Bu yüksəklik gradyanı temperatur, yağış, rütubət və bitki və heyvanların yayılmasına güclü təsir göstərir (Garcia-martino) və s. 1996 Wang və s. 2003 González və s. 2007 Gould və s. 2008 Willig və s. 2011 Brokaw və s. 2012). EYNF-də yüksəklik dərəcəsi boyunca dörd əsas meşə növü mövcuddur: üstünlük təşkil edən Tabonuco meşəsi Dacryodes excelsa və 150 ​​ilə 600 m arasında baş verir, hakim olan Palo Colorado meşəsi Cyrilla racemiflora, və 600 ilə 950 m a.s.l arasında, Elfin meşəsi üstünlük təşkil edir Tabebuia rigidaEugenia boriquensis və 950 m a.s.l.-dən və üstünlük təşkil etdiyi Sierra Palm meşəsindən baş verir Prestoea montana və yüksəklik dərəcəsi boyunca hər yerdə baş verə bilər. Dörd əsas meşə növünə əlavə olaraq, EYNF köhnə orta meşədə (& 40 yaş) əsasən qoruğun sərhədinə yaxın alçaq yüksəkliklərdə baş verən əhəmiyyətli bir sahəyə malikdir.

Setophaga angelae ana Puerto Riko adasına endemik olan kiçik bir passerine quşudur (Kepler & Parkes 1972). Hal-hazırda paylanması 150 km məsafədə ayrılmış iki qorunan ərazi ilə məhdudlaşır: EYNF və Maricao Commonwealth Forest (MCF). Təxmini əhali sayı IUCN Qırmızı Siyahısına (BirdLife International 2012) görə 1800 yetkin fərddir. Kiçik bir əhali sayına və məhdud coğrafi bölgüyə sahib olmaqdan başqa, S. angelae nadir və sirli olaraq xarakterizə olunur və bu, son kəşfini izah edə bilər (Kepler & Parkes 1972). Təsviri anında, S. angelae fərdlərin 250 m a.s.l.-ə qədər az olmasına baxmayaraq, Elfin meşəsi içərisindəki yüksəklik sahələri ilə məhdudlaşdırıldığı (950 m a.s.-dən yuxarı) və Palo Colorado meşəsi də daxil olmaqla müxtəlif yaşayış yerlərində, Podocarpus coriaceus meşə, ikinci dərəcəli meşə, qəhvə əkinləri və otlaqlar (González 2008). Bantlama işləri onu göstərir S. angelae il boyu monoqam və ərazidir (Delannoy-Juliá 2009). Ərazinin ölçüsü cüt başına təxminən bir hektar olduğu təxmin edildi (Kepler & Parkes 1972). Səsləndirmələrə ərazi mahnısı (ümumi mahnı), həyəcan siqnalı və duet mahnısı (https://arbimon.sieve-analytics.com/project/elevation) daxildir.

Nümunə dizaynı və avtonom qeydlər

Yüksəklik yaşayış növü, temperatur və heyvan və bitki icmaları üçün məşhur bir vəkildir (Brokaw) və s. 2012 Kéry, Gardner & Monnerat 2010), üç yüksəklik keçidi boyunca (95–1074 m a.s.l) EYNF-də 60 ərazidə akustik məlumat topladıq.

27 mart - 6 may 2015-ci il tarixləri arasında bir yüksəklik keçidi başına 20 seçmə sahəsi). Yüksək yol keçidləri yollardan və yollardan istifadə etdi, lakin bütün qeyd edənlər istənilən yoldan 200 m-dən çox məsafədə yerləşdirildi. Hər bir yüksəklik keçidi boyunca 100 m yüksəklik aralığında (95 ilə 1074 m a.s. arasında) 200 m ayrılmış iki qeyd cihazı yerləşdirilmişdir. Qeyd cihazları, təxminən 1 həftə boyunca bir transeksiya içərisində hər ərazidə məlumat topladı və sonra başqa bir yüksəlmə keçidinə köçürüldü. Tədqiqat mahnı nisbətinin ən yüksək olduğu çoxalma mövsümündə baş verdi (Arroyo-Vasquez 1992). Kiçik ev aralığına görə S. angelae (

1 ha, Kepler & Parkes 1972), inanırıq ki, bir ərazidən gələn quşların birdən çox yazıcı tərəfindən qeydə alınması ehtimalı azdır.

Qeyd cihazları, Monoprice mikrofonuna bağlı xarici konnektoru olan suya davamlı korpusa daxil edilmiş bir LG smartfonundan ibarətdir. ARBIMON Touch tətbiqi (https://play.google.com/store/apps/details?id=touch.arbimon.com.arbimontouch&hl=en) qeyd hadisələrini planlaşdırmaq üçün istifadə edilmişdir. Yazıcılar 1 · 5 m hündürlükdə olan ağaclara qoyulmuş və gündə 144 - 1 dəqiqəlik qeydlər üçün hər 10 dəqiqədə 1 dəq səs yazmaq üçün proqramlaşdırılmışdır. Çalışdığımız ərazidə sahə testləri apardıq və bunu tapdıq S. angelae səsləri səsyazma cihazlarımız qədər aşkar edə bilər

50 m. Buna görə burada bir sahə qeyd cihazının ətrafındakı radiusu təxminən 50 m olan üç ölçülü bir yarımkürə sahəsi olaraq təyin edilir.

Bioakustika məlumatların işlənməsi və idarə olunması

Bütün qeydlərin spektrogramları (n = 38 255) vizual olaraq yoxlanıldı və növlərin mövcud olduğu görünürsə, son qərarı vermək üçün yazıları dinlədik. Bu, daha sonra mükəmməl olmayan aşkarlığı hesab edən dolğunluq modellərinə uyğunlaşdırılmaq üçün istifadə edilən bir aşkarlama / aşkarlama matrisi ilə nəticələndi (şəkil 2). Bu analizlərin nəticələri ARBIMON analitik platformasında yaradılan bir növ identifikasiya modelindən (https://arbimon.sieve-analytics.com) istifadə olunan üç fərqli yanaşmaya əsaslanan nəticələri müqayisə etmək üçün ‘qızıl standart’ olaraq istifadə edildi. Aşağıda, növ müəyyənləşdirmə modelinin yaradılmasında istifadə olunan altı addımı ümumiləşdiririk:

  1. Vokalizasiya şablonu yaradın və bir sıra qeydləri təsdiqləyin: Model üçün ərazi mahnısından istifadə etdik, çünki ən fərqli və ən çox səslənən səsdir. Şablonu yaratmaq üçün ərazi mahnısından on beş nümunə seçildi və doğrulama məlumat dəsti üçün 208 səsyazma istifadə edildi (yəni mahnı mahnı mövcud və ya yox idi).
  2. Mahnı şablonu və spektroqram arasında bir korrelyasiya vektoru yaradın. Mahnı şablonu təsdiqlənmiş qeydlərin hər birinə tətbiq edildi. Bu addımda şablon hər spektroqramı keçər və hər qeyd üçün oxşarlıqlar vektoru istehsal edər (yəni şablon və spektrogramın bölmələri arasındakı əlaqələr). Korrelyasiya OpenCV funksiyası MatchTemplate (Bradski & Kaehler 2008) tərəfindən yaradıldı.
  3. 208 təsdiqlənmiş qeydlərdən vektorların xüsusiyyətlərini çıxarın. Bu addımda korrelyasiya vektorunun 12 xüsusiyyəti çıxarılır: orta, orta, minimum, maksimum, standart sapma, maksimum-minimum, əyilmə, kurtoz, hiper-əyilmə, hiper-kurtoz, histoqram və məcmu tezlik histoqramı.
  4. RandomForest (RF) təsnifatçısı yaradın: təsdiqlənmiş qeydlərin xüsusiyyətləri (yəni mövcud və ya yox) bir RandomForest təsnifatçısına daxil edilir (Breiman 2001). Məqsəd, xüsusiyyət modellərinə əsaslanan bir qeyddə ərazi mahnısının varlığı və ya olmaması ikili qərarı üçün RF modelini öyrətmək idi. Qarışıqlıq matrisi verilir (Cədvəl S1). Model yanlış pozitivləri azaltmaq üçün düzəldildi.
  5. Eşik yanaşması tətbiq edin: bu, qeydin pozitiv bir algılama olaraq təyin edilməsi üçün lazım olan vektorların maksimum oxşarlıq korrelyasiya səviyyəsini əl ilə təyin etməyə əsaslanan alternativ bir yanaşmadır. Qarışıqlıq matrisi verilir (Cədvəl S1). Model yanlış pozitivləri azaltmaq üçün düzəldildi.
  6. Bütün qeydləri təsnifləşdirin: RF modeli və Eşik modeli bütün qeydlərə tətbiq edildi. Bu, 38 255 qeydinin hər biri üçün RF modeli və Eşik modelinə əsaslanan varlıq və yoxluq təsnifatı ilə bir məlumat dəsti ilə nəticələndi.

Daha sonra əl ilə təsdiqləmə prosesinin nəticələri ilə RF və Eşik yanaşmalarının nəticələri ilə müqayisə etdik. Bu prosedur dörd məlumat dəsti ilə nəticələndi: əl ilə təsdiqləmə, Eşik, RandomForest və Kombinə (Cədvəl 1). Eşik, RandomForest və Kombinə edilmiş məlumat dəstləri, avtomatlaşdırılmış növ identifikasiya modellərindən əldə edilən bütün müsbət aşkarlamaları əl ilə yoxlamaq və yalan pozitiv aşkarlamaları həqiqi mənfiliklərə çevirməklə qurulmuşdur. Yanlış mənfi aşkarlamalar həqiqi mənfi aşkarlamalar olduğu qəbul edildi. Yanlış mənfi aşkarlamaları dəyişdirməməyi seçdik, çünki dolma modelləri bu tip səhvləri hesaba gətirə bilər. Kombinə edilmiş məlumat dəsti yalnız RandomForest və Threshold modellərində pozitiv aşkarlama ilə qeydləri əhatə edirdi. Bananaquitin səsləndirmələrini qarışdırmaq mümkün olsa da Coereba flaveola və Elfin Woods Warbler, sahədəki məlumat dəstlərimizdə heç bir yalnış pozitiv olmadığına əminik, çünki spektrogram analizləri səsləri səsləndirməyə və müqayisə etməyə imkan verərək növləri ayırd etməyi asanlaşdırdı.

Məlumat dəsti Qeydlər Təsnifat mövcudluğu Əl ilə təsdiqlənmiş mövcudluq
Tam 38 255 888
RandomForest 38 255 1603 194
Eşik 38 255 437 62
Kombinə 38 255 67 51
  • 38 255 qeydin hamısı Tam məlumat dəsti üçün əl ilə yoxlanıldı. RandomForest və Threshold məlumat dəstləri üçün bütün qeydlər növ modeli istifadə edilərək təsnif edildi və indiki kimi təsnif edilən qeydlər əl ilə yoxlanıldı. Kombinə edilmiş məlumat dəstinə yalnız RandomForest və Threshold modellərinin razılaşdırıldığı qeydlər daxil idi və bu qeydlər də əl ilə yoxlanıldı.

Analizlər saat 05: 00-19: 00 arasındakı qeydlərə əsaslanıb, lakin aşkarlama matrisini sadələşdirmək üçün iki saatlıq fasilələrlə aşkarlamaları ümumiləşdiririk. Bu sadələşdirmə gündə yeddi seçmə hadisəsi ilə nəticələndi, burada hər seçmə münasibətilə hər iki saatlıq fasilədə 12 qeyd daxil edildi. Buna görə ən əsas nümunə vahidimiz burada 1 dəqiqəlik 12 qeyd ilə bir aralıq olaraq təyin olunur.

İşğal modelləşdirmə

Təsnif edilmiş məlumatların təsdiqlənməsindən sonra yaradılan aşkarlama / aşkarlanmamaq matrisindən r-də işarələnməmiş paketi istifadə edərək bir mövsümlük modellərə uyğunlaşdırmaq üçün istifadə etdik (Fiske & Chandler 2011). Hər bir seçmə sahəsinin dolma ehtimalı, standart maksimum ehtimal hiyerarşik yanaşmadan sonra mükəmməl olmayan aşkarlama nəzərə alınaraq qiymətləndirilmişdir (MacKenzie və s. 2002). Modellərimizə dolğunluqla şərtlənən aşkarlanma ehtimalını təsvir edən seçmə səviyyəsi (p) və ərazinin tutulma ehtimalını (ψ) təsvir edən bioloji səviyyə daxildir. Həm p, həm də habit yaşayış mühitinin xüsusiyyətlərinə görə dəyişməyə icazə verilir. Çünki həm yüksəkliyin, həm də meşə tipinin təsir edəcəyi gözlənilir S. angelae meydana gəlmə (Kepler & Parkes 1972 Anadón-Irizarry 2006 Arendt, Qian & Mineard 2013), bu dəyişənləri doluluk modellərimizə daxil etməyi seçdik. Hündürlüyün həm yaşayış, həm də aşkarlama parametrləri üzərində təsirini əks etdirən üç davamlı və standartlaşdırılmış dəyişəni daxil etdik: 'Elevation', 'Elevation 2' and 'Elevation 3', which the birinci, ikinci və üçüncü dərəcəli polinomial function of the height. müvafiq olaraq məlumatlar (Kéry və s. 2010). Əlavə olaraq, beş meşə növünün (Tabonuco meşəsi, İkincil meşə, Palo Colorado meşəsi, Sierra Palm meşəsi, Elfin meşəsi və Riparian meşəsi) yüzdəlik örtüyünün təsirini və doldurma və aşkarlama parametrlərinə daxil etdik. Hər meşə növünün yüzdə örtüyü, hər bir qeyd cihazının yerləşdiyi mərkəzdə 100 m radiusda olan bir bufer daxilində qiymətləndirilmişdir. Meşə tipi təsnifatı USDA Meşə Xidməti (Gould) tərəfindən hazırlanmış bitki təsnifatı xəritələrinə əsaslanır və s. 2008). Nəhayət, 7 saatlıq seçmə dövrünün hər biri üçün 1-7 kimi kodlanan ‘Saat’ dəyişənini daxil etdik. Bu dəyişən, aşkarlama parametrinə daxil edilmişdir, çünki quş səs fəaliyyətinin yaxşı bir proqnozlaşdırıcısıdır (Catchpole & Slater 2003). Saat məlumatlarının ikinci (‘Saat 2’) - və üçüncü sıra (‘Saat 3’) polinom funksiyasını da daxil etdik.

EYNF-də növlər üçün paylama xəritəsi yaratmaq üçün, EYNF xəritəsinin üstünə 4032 - 3 · 1 ha altıbucaqlı çoxbucaqlı bir barmaqlıq əlavə etdik və hər meşə növünün bitki örtüyünün yüzdə bir hissəsini çıxardıq. Hər altıbucaqlı çoxbucaqlının yerləşmə ehtimalını qiymətləndirmək üçün İşarəsiz paketdəki ‘proqnozlaşdırma’ funksiyasından istifadə etdik. EYNF daxilində gözlənilən dolma ehtimalını qrafika etmək üçün qgis (QGIS Development Team 2015) istifadə etdik.


Materiallar və metodlar

Sahə işləri

Tarixi kolleksiyalara əlavə olaraq Elafoglossum Madagaskarda 200 ildən çox müddətdə, xüsusilə cinsə yönəldilmiş səylər toplama, 2004-cü ildən bəri adada, əsasən qorunan ərazilərdə aparıldı, çünki qalan nəm təbii meşələrin hamısı olmasa da Milli Parklar və digər təbii qoruqlara daxil edildi. Toplama icazələri Madaqaskar Milli Parkları və Nazirliklər tərəfindən verilmişdir Ətraf Mühit, və davamlı Développement (layihə nömrələri: 70/19 / MEDD / SG / DGF / DSAP / SCB.Re ve 207/15 / MEEMF / SG / DGF / DAPT / SCBT ve 199/15 / MEEMF / SG / DGF / DAPT / SCBT ve 241/11 / MEF / SG / DGF / DCB.SAP / SCB).

Bitkilər sistematik olaraq müasir kolleksiyalar kimi, yəni herbarium nümunələri, silisium ilə qurudulmuş yarpaq nümunəsi və fotoşəkillər də götürülmüşdür (Gaudeul & amp Rouhan, 2013). Bu ekskursiyalar zamanı hazırlanan bütün kolleksiyaların komplektləri TAN və ya TEF-də saxlanılır və P dublikatlarında bir neçə istisna olmaqla, mümkün olduqda başqa yerlərə göndərilir (və ya dərc edildikdən dərhal sonra göndəriləcəkdir), xüsusən K, MO, NBG , NY (herbarium kodları Thiers’i izləyir, 2018).

Herbarium əsaslı işlər

Taksonların müəyyənləşdirilməsinə və yeni identifikasiya açarlarının yaradılmasına gətirib çıxaran taksonomik reviziya, P-də yerləşdirilmiş 2.186 toplantını təmsil edən 2.600-dən çox herbarium nümunəsinin araşdırılmasına və əksər yerlərdə aparılan müşahidələrə əsaslanır. Elafoglossum növlər. Bütün nümunələr verilənlər bazasına daxil edilmiş və https://science.mnhn.fr/institution/mnhn/collection/p/item/search?lang=en_US adresindəki Paris Herbarium verilənlər bazasında sərbəst şəkildə mövcuddur. Digər herbaridən alınan əlavə nümunələr əllə şərh edildi (BM, G, K, MO, NY, P, PR, TAN, TEF, ABŞ) və ya onlayn şəkillər kimi araşdırıldı (B, BR, PRE). Təsvirlərə daxil edilmiş bütün ölçmələr, rənglər və digər detallar herbarium nümunələrinə və sahə qeydlərindən alınan məlumatlara əsaslanır. Hər növün dəyişkənliyini qiymətləndirərkən bu sahədə yaşayış və ekologiya qeyd edildi, lakin bu xüsusiyyətlər haqqında məlumatlar digər herbarium etiketlərindən də götürüldü.

Təsvirlər və morfoloji xarakterlər

Herbarium nümunələri diseksiya mikroskopu Leica MZ6 altında araşdırıldı və Leica DFC425 kamerası vasitəsi ilə əldə edilən yaxın görüntülər, hər takson tərəzisi üçün illüstrasiyalar slayd və sürüşmə örtüyü arasında qliserin jelatində quraşdırıldı və bu qalıcı slaydlar bir slayt skanerdən istifadə edilərək təsvir edildi. CoolScan V ED. Bitkiləri təsvir etmək üçün istifadə olunan terminologiya Lellinger (2002) -ə əsaslanır.

Dağıtım xəritələri

Distribution maps of new taxa were based on all cited specimens and generated with QGIS 2.14 (QGIS Geographic Information System. Open Source Geospatial Foundation Project. http://qgis.osgeo.org). A background map included five altitudinal ranges corresponding globally to those generally recognized in Madagascar (Humbert, 1955 Faramalala, 1995): 0–400 m (green), 400–800 m (yellow), 800–1,200 m (light brown), 1,200–1,800 m (medium brown) and >1,800 m (dark brown). Localities of specimens were represented by red dots (and open circles represented the six main cities in Madagascar). Distribution is also described in the text for each species and subspecies according to the five Malagasy phytogeographic domains as defined by Humbert (1955): East, Sambirano, Center, West, and South.

New botanical taxa

New botanical taxa were described only after considering all species known at least in Madagascar, Africa, Western Indian Ocean Islands (Comoros, Seychelles, La Réunion, Mauritius), and circumaustral islands from the Atlantic and the Indian Ocean. Thus, a morphological comparison to most closely-related species from those areas is provided through diagnoses and keys.

The electronic version of this article in Portable Document Format (PDF) will represent a published work according to the International Code of Nomenclature for algae, fungi, and plants (ICN), and hence the new names contained in the electronic version are effectively published under that Code from the electronic edition alone. In addition, new names contained in this work which have been issued with identifiers by IPNI will eventually be made available to the Global Names Index. The IPNI LSIDs can be resolved and the associated information viewed through any standard web browser by appending the LSID contained in this publication to the prefix “http://ipni.org/”. The online version of this work is archived and available from the following digital repositories: PeerJ, PubMed Central, and CLOCKSS.


Supporting Information

S1 Fig. Bayesian Information Criterion (BIC) as a function of number of clusters for plots 1–3.

Ten different combinations of constraints for multivariate mixture models have been tested: EII = spherical, equal volume VII = spherical, unequal volume EEI = diagonal, equal volume and shape VEI = diagonal, varying volume, equal shape EVI = diagonal, equal volume, varying shape VVI = diagonal, varying volume and shape EEE = ellipsoidal, equal volume, shape, and orientation EEV = ellipsoidal, equal volume and equal shape VEV = ellipsoidal, equal shape VVV = ellipsoidal, varying volume, shape, and orientation.

S1 Table. Georeferenced values of δ 15 N (‰), δ 13 C (‰) and N concentration (g N*kg -1 ) used to create isoscapes.


Making curved labels for polygons in QGIS? - Geographic Information Systems

Over the past decade the abundance of location-aware mobile devices has simplified recording of high-precision, high-accuracy geospatial data for the distribution of organisms. Several mobile apps are now available for this purpose (e.g., iNaturalist iSpot ebird) these contribute to the quality of citizen science databases ( Spyratos and Lutz 2014 ). However, most biodiversity specimens collected prior to the 1990s do not have a latitude and longitude associated with them ( Beaman and Conn 2003 ). This means that many of the world’s three billion biodiversity specimens ( Beach et al. 2010 ), including insects on pins, plants on sheets, and fish in jars—some collected as long as three centuries ago—are not easily mapped. Therefore, their value as an historical baseline for research, education, and policymaking is limited ( Cook et al. 2014 Hanken 2013 ).

Citizen science participants are playing an increasingly important role in transcribing specimen label data ( Ellwood et al. 2015 ), but the expansion of georeferencing of specimen collection localities by public participants lags, partly owing to the dearth of online tools enabling georeferencing and the lack of experiments assessing the quality of the data produced. Here we present two experiments in which locality descriptions were georeferenced (assigned a latitude and longitude coordinate) by both expert and novice participants. We compare the data generated by the two groups and suggest downstream analyses to produce the most accurate locality estimates.

Georeferencing of historical localities is just one of many applications within the field of historical GIS ( Gregory and Ell 2007 ). While we focus here on members of the public georeferencing biodiversity specimens, research in the digital humanities also has made important contributions to current georeferencing methodologies and technologies. For example Georeferencer, an online application designed to enable crowd-sourced rectifying of digital images of historic maps, has been modified and successfully implemented by numerous European institutions ( Fleet et al. 2012 ). These efforts have resulted in tens of thousands of maps available online for increased discoverability, integration with modern map layers, improved visualizations, and a host of specialized research projects ( Fleet et al. 2012 Holdsworth 2003 www.bl.uk/maps/georefabout.html ). Like other fields, the digital humanities have turned to volunteers and crowd-sourcing to improve the rate at which historic documents are georeferenced ( Offen 2012 ).

Volunteered Geographic Information (VGI) is a term coined in 2007 ( Goodchild 2007 ) to recognize the fact that Internet-based media were incorporating geographic information wherever possible, including websites and mobile device apps for shopping, mapping, social connections, and weather ( Sui and Goodchild 2011 ). VGI has grown tremendously over the last decade as evidenced by the millions of registered users on OpenStreetMap ( openstreetmap.org Haklay and Weber 2008 )—a world map created and maintained by volunteers—and WikiMapia ( wikimapia.org ), a highly annotated world map with embedded links to related Wikipedia articles. OpenStreetMap also has a humanitarian arm of volunteers who are applying their geographical skills in poorly mapped parts of the world which are in need of aid, e.g., after the years-long rebellion in the Central African Republic and after the 2015 earthquake in Nepal ( hot.openstreetmap.org ).

Geotagging also has grown in popularity as text messaging systems, social media outlets, and photo sharing sites (in particular Flickr.com ) have enabled users to include geographic information with these various media ( Barve 2014 Kumar and Seitz 2014 ). Participation in, and demand for, this functionality illustrates a general public interest in working with geographic interfaces, expanding geographic data and improving freely available geographic information. Specific applications of geotagging have allowed researchers to track epidemic outbreaks ( Lampos and Cristianini 2010 ), leverage the public’s interest in visiting clean water bodies for improved water quality ( Keeler et al. 2015 ), and improve epidemiology research ( Doherty et al. 2011 ).

While research applications of VGI are relatively common ( Sui et al. 2013 ), working with volunteers to add geographic information based on a textual description is relatively uncommon. In one of the few existing examples, volunteers added geographical information to social media posts to provide targeted and specific help to victims of the 2010 earthquake in Haiti ( Meier 2012 ). Immediately after the earthquake, Haitian and college student volunteers in Boston, Massachusetts, scoured the web for social media posts related to the event and created a live map of the locations from where they were sent. Some of these posts had geographic information embedded in them, while others were textual descriptions of a location (i.e., “trapped under house at corner of Main and 1st” Camponovo and Freundschuh 2014 Meier 2012 ) that needed to be given a latitude and longitude. Volunteers classified the posts based on the type of aid that was needed and added them to the map relief organizations then were able to use the live map to provide timely, appropriate help to individuals around the country.

Though less immediately urgent, the approach needed when georeferencing biodiversity specimens is similar to the above example. That is, citizen science participants read locality information in the form of short textual descriptions and transform that information into a latitude and longitude (i.e., a point on a map) and some measure of uncertainty, such as the radius of a circle. Biodiversity research specimens include a description of the locality that references political units (e.g., country, state, county) proximity to the nearest town or other geographical features and/or the habitat (e.g., roadside, forest, lakeshore). Most descriptions require some interpretation and inference on the part of the georeferencer. The biodiversity research community previously established best practices for this type of work ( Chapman et al. 2006 ), however, these practices were described prior to the recent expansion of VGI ( Elwood et al. 2011 Goodchild 2007 ).

Georeferenced biodiversity specimens are crucial for many research applications including conservation (e.g., Miller et al. 2012 Rivers et al. 2011 ), estimating species ranges and extinctions (e.g., Boakes et al. 2010 Gotelli et al. 2012 Tingley and Beissinger 2009 ), habitat modeling (e.g., Fernández et al. 2015 Hope et al. 2013 Zhang et al. 2012 ), and natural resources management (e.g., Taylor et al. 2013 ). However, the level of accuracy and precision of georeferenced data impacts the quality of the downstream research ( Graham et al. 2008 Rowe 2005 ). Taking advantage of the irreplaceable historical data provided by georeferenced biodiversity specimens will require a tremendous effort to georeference specimens currently in collections ( Beach et al. 2010 ) using efficient methods leading to precise results (e.g., Guo et al. 2008 ).

Consider an example locality description from the label of a plant specimen collected in 1927 in Highlands County, Florida, which reads “High pine land Lake Stearns, Fla.” (Fig. 1 ). Turning this locality into a point on a map requires that a georeferencer find the town of Lake Stearns, determine where high pine habitat is likely to occur, and designate a point with a radius of uncertainty that encompasses the most likely collection location(s) of this specimen. To further complicate this process, habitat types and town names change over time. Since the time this specimen was collected nearly 90 years ago the town of Lake Stearns has changed its name to Lake Placid, and the high pine habitat where this specimen was collected may have ceased to exist. Even an expert georeferencer may have trouble as map layers usually reflect only current information, and finding historical town names and habitat types can be challenging. Also, specimen collection localities may be intentionally imprecise if a species is rare (e.g., to reduce illegal harvesting), and during some time periods and at some locations in the last three centuries, collectors were uncertain about precise locations because fine-scale maps and distinguishing features of the landscape were unavailable. Although many collection locality descriptions may be more straightforward than the one provided in this example, considering the breadth of heterogeneity in locality descriptions, can citizen science participants contribute accurate and appropriately precise specimen georeferences?

Label from a plant specimen from the Robert K. Godfrey Herbarium, Florida State University, Tallahassee, FL, US, demonstrating the potential challenges of georeferencing collection localities. In this case, the town has changed names since 1927, the locality description is imprecise, and the habitat is likely now residential development. Labels with such characteristics may be especially difficult for citizen science participants to georeference without local knowledge.

To investigate this question, we engaged undergraduate students as a proxy for the general population of citizen science participants. While we do not have data demonstrating that these students are comparable to the general citizen science community, they are a subset of the general population and represent a range of abilities, levels of innate interest, and prior experience with geographical information and biodiversity research. We chose to use students so that we could generate sufficient data in the absence of an established citizen science georeferencing platform and community. We asked:

How accurate are student georeferencers compared to automated georeferencing software and experts? Does student involvement improve on the accuracy of a georeferencing algorithm?

What method is most effective at estimating an accurate consensus georeference from replicate points for the same collection locality? Is the consensus generated in this way more accurate than the individual points?

How do the best georeferencers compare to the group as a whole? That is, is it useful to only consider the points produced by the most accurate georeferencers?

To address our research questions we conducted two experiments in which undergraduate students and experts georeferenced the same collection localities. The two experiments differed in the spatial distribution of collection localities (seven states in the USA vs. Florida’s Apalachicola National Forest), the biology of the organisms (fish vs. plants), and the number of student georeferences for each locality (1𔃀 vs. 6󈝻 respectively). We addressed question 1 with both datasets and questions 2 and 3 with the many-georeferences-per-location dataset.

Each of the experiments relied on GEOLocate software ( www.museum.tulane.edu/geolocate/ ), which uses an automated georeferencing algorithm to make the human georeferencing more efficient. The algorithm interprets strings of text and provides a suggested point location and radius of uncertainty. GEOLocate displays the most likely point as a green dot and shows red dots for other possible, though less likely, points based on the GEOLocate algorithm. A user can choose one of these suggestions or create another point. GEOLocate also includes features that allow a user to view different map layers, expand the screen, zoom and pan, mark a spot, measure, and save a point. All participants used GEOLocate to assess, navigate, and extract spatial information.

Fish experiment: Thousands of fish localities each georeferenced by one or two students

In the first experiment, 3,372 U.S. fish collection localities from Fishnet2 ( fishnet2.net/aboutFishNet.html ) were each georeferenced by one (or occasionally two) undergraduate student georeferencers at Tulane University (New Orleans, Louisiana, USA) using GEOLocate’s Collaborative Georeferencing platform ( museum.tulane.edu/geolocate/community CoGe). The data were grouped into seven state datasets and distributed among 11 students (undergraduate students in Natural Resource Conservation and Biodiversity Informatics classes taught at Tulane) and eight trained and experienced project technicians, such that each dataset was georeferenced by at least one student and at least one trained, experienced technician. Students and technicians corrected the geolocation recommended by GEOLocate when necessary and saved the latitude and longitude of that chosen location. Student training involved a 50-minute overview on georeferencing biodiversity data followed by demonstrations on using GEOLocate and CoGe. The technicians were hired specifically to georeference fish specimen localities as part of a research grant. They received two days of training, encompassing basic geographic principles, georeferencing methodologies and standards, and project protocols. Many of them had GIS experience prior to the project, and all of them had months of experience georeferencing localities in the project by the time of the experiment.

At Tulane, data processing and analyses were conducted using PostgreSQL 9.3, PostGIS 2.1, Microsoft Access 2010, Microsoft Excel 2010, and Microsoft Excel 2013. Distances between student and expert points and distances between most highly suggested point in GEOLocate and expert points were compared. Records that were not resolvable by GEOLocate were excluded from GEOLocate comparisons. Because we had only one or two student results for each technician result for each locality in the fish dataset, we could not compute means and medians across student results as in the plant experiment.

Plant experiment: Hundreds of plant localities each georeferenced by many students

In the second experiment, 270 plant collection localities from Florida’s Apalachicola National Forest (ANF) each were georeferenced by 6󈝻 students at Florida State University (FSU, Tallahassee, Florida, USA) using GEOLocate’s standard online platform. The plant collection locality descriptions were taken from the database of FSU’s Robert K. Godfrey Herbarium ( www.herbarium.bio.fsu.edu ). Each student was provided an Excel worksheet with collection information parsed into columns: Specimen barcode, scientific name, country, state, county, and locality description. The locality description was an aggregation of entries in the following of the herbarium’s database fields: Nearest Named Place, Special Geographic Unit, Verbatim Directions to Locality, and Habitat. An example is “Bristol, Apalachicola National Forest by Fla Rt. 12, S of Bristol, Apalachicola National Forest, just within boundary, longleaf pine savanna.” An additional column contained links that took the student directly to the GEOLocate website with the specimen’s locality description preloaded in the interface. The full Excel file had 17 different worksheets, each listing 16 specimens (with the exception of the last worksheet which had only 14 specimens).

Each of 154 Florida State University junior and senior undergraduate students enrolled in the course Plant Biology was assigned one worksheet (i.e., 16 or 14 specimen localities) from within the full file to georeference. As a class, students were provided with both a 30-minute training session and written instructions that included a step-by-step guide for augmenting the Excel file with a latitude and longitude (but not a measure of uncertainty) obtained from their work using GEOLocate. Although each worksheet was assigned to the same number of students, some students did not follow directions, so certain worksheets were completed more frequently than others. In the end, each specimen was georeferenced 6󈝻 times (mode = 8, median = 9).

When a student followed a specimen’s link to GEOLocate, they were asked to use GEOLocate’s automated georeferencing algorithm (a button “Georeference”) to produce suggested points, then they could pan, zoom, and open other map layers to show different features, including political boundaries, streets, and aerial photos, until they found the closest approximation of the textual description. Then they cut and pasted the latitude and longitude into Excel. Completion of these tasks, regardless of accuracy, earned the student credit for the required assignment. However, students could opt out of the experiment by choosing not to complete an Institutional Review Board–approved waiver. Students were given one week to complete the assignment during that time they could email one of us (GN) for guidance or help.

Independent of the student work, two local botanists with extensive collecting experience in ANF volunteered to also complete the georeferencing tasks. As local experts, they were familiar with habitat types in the ANF, specific plant populations, favored collection areas, and field collection protocols. This knowledge provided them the advantage over students of being able to more easily interpret and georeference label information. These individuals included a radius of uncertainty with their georeferences and made note of challenging or vague locality descriptions. The experts produced one point for each specimen, which henceforth are referred to as “expert” points.

A small subset of student points in the plant dataset were interpreted as outliers and were removed from the dataset. Such errors included latitude and/or longitude of 0, positive or negative latitude or longitude when the opposite was appropriate for the hemisphere, values that were incomplete, and values that were placed at the exact centroid of the nearby town of Apalachicola (representing an occasional mistake by the GEOLocate algorithm that students did not always correct the town lies outside of the boundaries of ANF). We consider this data-cleaning step to be a reasonable approximation of what can be done by any project doing georeferencing with citizen science participants, and are not using any special knowledge of the expert points at this step. Analyses were conducted with the remaining points in QGIS version 2.6.1 Brighton ( QGIS Development Team 2014 ), Environmental Systems Research Institute’s ArcGIS version 10.2 ( Environmental Systems Research Institute 2014 ), and R statistical software version 3.1.1 ( R Core Development Team 2014 ).

We calculated distance statistics between the expert point and points generated by students for each collection locality, including mean distance of student points and minimum and maximum distance of student points. For these plant experiment data, we calculated a mean and median georeferenced point for each collection locality from the replicate student points using ESRI’s ArcMap spatial statistics tools Mean Center and Median Center, respectively. The Mean Center is simply the average X and average Y coordinate among all the points, while the Median Center tool utilizes an iterative algorithm to calculate the point that minimizes the Euclidian distance among all the student points for a given specimen record. The median point gives less weight to anomalous georeferences. For comparison, we also calculated the distance between the expert point and those suggested as most likely by the GEOLocate algorithm.

Individual students were evaluated for accuracy by comparing their mean distance from expert points (as measured using uncertainty radii for the specific specimens) for all specimens georeferenced by that individual. To determine the increased accuracy brought about by removing the least accurate georeferencers, we re-ran some of the analyses by first excluding 19 students whose complete set of georeferenced points averaged 100 uncertainty radii or greater from the expert’s points, and then by excluding the bottom half (least accurate) of georeferencers. The first exclusion removes those participants who are perhaps least likely to contribute to a citizen science project requiring this skill set, given their poor aptitude for it or their poor engagement in the activity. The second left us with a proxy for those members of the public who are devoted to a citizen science project and likely to become experienced in a way that becomes recognizable to the project. A disproportionate percentage of online tasks often are completed by a very small number of committed citizen science participants ( Eveleigh et al. 2014 ).

Results How accurate are student georeferencers?

Fish experiment —Eleven students produced 4,433 georeferences for 3,372 localities (1,061 localities georeferenced twice). The mean distance of student points from those of expert georeferencers ranged from 1.5󈞷.5 km (mean = 21.3 km). We defined outliers as student points that were greater than two standard deviations from the overall mean displacement of each student’s result from the expert result outlier distance ranged from 13� km across all determinations. Georeferences with greater than a 25 km deviation were typically placed in the wrong county and/or state, and should be detectable through data validation routines involving spatial queries against administrative units in the absence of expert points. Numbers of outliers ranged from just 0󈝽 georeferences (mean = 6.5) per student. Excluding outliers, per-student mean distances between student and expert georeferencer determinations decreased to 0.9󈞔.7 km (overall mean = 8.3). Forty percent of student georeferences were within 0.5 km of the expert points, 53% were within 1 km, and 81% were within 5 km (Fig. 2 ). Considering the uncertainty radius assigned by the experts, 71% of student points were within one uncertainty radius of the expert, and 90% were within 10 (Table 1 ).

Distribution of the distance of student georeferences from expert points in the fish experiment at Tulane University with outliers removed.

Comparison of student points, consensus student points (using mean and median), and GEOLocate automated points to expert points measured by uncertainty radius (UR) for the fish and plant experiments. Because relatively few of the collection locations in the fish experiment were georeferenced by multiple students, we do not report comparisons with the consensus student points for that experiment.

We found that involving students in the process increased the percentage of points within each of the uncertainty radii cut-offs (Table 1 e.g., 71.07% vs. 49.09%, respectively, within 1 uncertainty radius as assigned by the expert georeferencers) and each of the absolute distance cut-offs less than the 10,000 meter cut-off (Table 2 ).

Comparison of student points, GEOLocate automated points, and median of student points to expert points measured by absolute distance for the fish and plant experiments. Because relatively few of the collection locations in the fish experiment were georeferenced by multiple students, we do not report comparisons with the consensus student points for that experiment.

Plant experiment —A total of 2,425 georeferences were produced by students, and after removing outliers, 2,408 (99%) remained. The mean distance between student points and the expert point for each collection locality ranged from 0.18󈞑.08 km, with an overall mean student distance from the respective expert point of 4.62 km.

To make the comparison between use of the automated georeferencing algorithm of GEOLocate alone and the additional involvement of the student georeferencers, we narrowed the number of collection localities to 251 because GEOLocate’s suggested points for the other specimens were returned as errors. The most successful consensus georeferencing method (use of the median point for the replicate student points) places a greater proportion of points within the uncertainty radii thresholds than the GEOLocate-suggested point (Table 1 ). When measuring that distance in meters, the median point outperforms GEOLocate alone, except at a cut-off of 100 m (where GEOLocate alone has a slight advantage Table 2 ).

Which method is most effective for producing an accurate consensus georeference?

For the plant data, use of the median georeferenced point as a consensus of replicate student georeferences is better than the mean georeferenced point at each of several uncertainty distances from the expert point (e.g., 12.22% of the mean points and 18.15% of the median points are within 1 uncertainty radius of their expert point Table 1 ). Unless otherwise indicated, we will use the median georeferenced point as the standard for comparison of the consensus point with the expert point.

The same is true when we consider distance from the expert point using absolute distance (Fig. 3 ). For more than half of the student points in the plant experiment (58.60% 1411 of 2408 points), the median point for a collection locality is at least 10 m closer to the expert point than the individual student point itself. About a quarter of the student points (25.83% 622 points) are at least 10 m closer to the expert points than the median point (Table 2 ). The remainder have similar distances to the expert point as the median point.

Distribution of the distance between mean (black bars) and median (gray bars) consensus of student replicate georeferences from the expert points in the plant experiment at Florida State University with outliers removed.

Is it useful to differentiate data based on georeferencer performance?

About 39% (99 of 254) of the single best student points for a collection locality are within one uncertainty radius of the expert point for that locality (Table 1 ), and about 43% of the single best student points are within 100 m of the expert point (Table 2 ). Examining the 99 single best points within one uncertainty radius we found that 48 (31%) of the 154 students contributed to them and just four students (3%) were responsible for 24 of those points.

We removed 19 of the 154 students contributing to the plant experiment using our threshold for identifying the least talented or motivated georeferencers, reducing the number of georeferenced points from 2408 to 2095 and the number of localities from 258 to 254. Using this reduced data set, the percentage of localities within one uncertainty radius of the expert increased from 18.15% with the full dataset to 23.33% (Table 1 ). Similarly, the percentage of localities that fell within 100 meters of the expert point increased from 5.56% with the full dataset to 23.70% with the reduced dataset (Table 2 ).

When we included only the best 74 (48%) of the plant georeferencers (1185 points), the distance of the median points calculated from the experts as measured by uncertainty radii was improved from the results of the full dataset, but not strikingly (e.g., 18.15% of the medians are within one uncertainty radius for the whole dataset vs. 20.47% for the subset Table 1 ). Looking at improvement based on the absolute distance, however, shows a marked improvement (e.g., 5.56% of the medians are within 100 m for the total dataset vs. 23.90% of the medians for this subset vs. Table 2 ).

Our results provide a first approximation of what can be expected from citizen science participants with minimal georeferencing training. This is a valuable contribution, for while OpenStreetMap ( Haklay and Weber 2008 ) and WikiMapia ( wikimapia.org ) have demonstrated enthusiasm for volunteered geographic information ( Goodchild 2007 ), we are not aware of studies that have assessed the quality of citizen science georeferencing of collection localities for biodiversity specimens or, more generally, of points contributed by georeferencing novices using locality descriptions (e.g., as done by Meier 2012 in another domain). We consider the results encouraging and suggest that they might serve as a benchmark against which to compare future changes to the process, several of which we suggest here.

Our use of undergraduate students as proxies for the general citizen science population, in the absence of an established georeferencing citizen science platform and community, merits further discussion. Coleman et al. ( 2009 ) present a hierarchy of volunteer participation in the context of contributing geographic data. By their definitions, we expect our student volunteers to mostly be neophytes—“an individual without a formal background in a subject, but who possesses the interest, time, and willingness to offer an opinion” (page 338). Whether the potential population of citizen science participants who would contribute data in this way represents a similar fraction of neophytes remains unanswered by our study. Potentially a greater fraction of those who would be motivated to contribute, and possibly some of our more experienced undergraduate volunteers, would qualify as expert amateurs—“someone who may know a great deal about a subject, practices it passionately on occasion, but still does not rely on it for a living”—as would our expert volunteers in the plant experiment. (Our experts from the fish experiment would qualify as expert professionals in Coleman et al.’s scheme—“someone who has studied and practices a subject … [and] relies on that knowledge for a living.”) By Coleman et al.’s estimation, and further analysis by Lauriault and Mooney ( 2014 ), “expert amateurs” may be the most productive volunteer contributors of geographic information, although positive and negative motivations vary across projects and can influence relative involvement of a group. Targeting expert amateurs, or educating neophytes to become expert amateurs, in the biodiversity community might be an effective strategy for increasing contributions and improving their quality beyond that reported here. Expert amateurs might be found as members of native plant societies, entomological clubs, sportsmen’s groups, online communities such as iNaturalist ( inaturalist.org ), and conservation and environmental organizations. Members of historical societies may provide additional local knowledge and a familiarity with regional geographic and landscape features. Future research on the topic could benefit from including a broader demographic of citizen science participants in experiments, along with additional methods such as surveys, to understand the advantages and limitations to working with each of these groups.

Despite large differences in the spatial extent of the areas considered in the experiments (seven states in the US vs. a national forest) and the biology of the organisms (fish in aquatic habitat vs. plants in, mostly, terrestrial habitat), the experiments produced strikingly similar average distances between student- and expert-contributed points (8.3 km with a range of 0.9󈞔.7 km and 4.6 km with a range of 0.2󈞑.1 km, respectively). However, when the distance is measured by uncertainty radii assigned for each collection locality by the experts, differences emerge. Relatively more of the contributed fish georeferences (71%) are within an uncertainty radius of the expert point than the plant georeferences (15%), perhaps because the extent of fish habitat is more easily identified on a map than that of plants and there is often relatively less of it. Also, the relatively larger uncertainty radii of the fish experiment (expert mean = 4,136 m, range = 0�,118 m) than the plant experiment (mean = 1,054 m, range = 16󈞁,095 m) simplified the process for students to place a point within the uncertainty radius of the expert in that experiment.

Creation of a consensus point from replicates for a collection locality improved upon the overall percentage of points within one uncertainty radius in the plant experiment (the fish experiment did not consistently replicate) when the consensus was produced as the median point, but not the mean point (Table 1 ). The median is less sensitive to outliers and makes more sense than the mean for building consensus in this context. We do not address the relationship between number of replicates used to produce the median and the median’s accuracy here, but the relationship has clear importance when designing efficient citizen science projects in the domain. We expect a plateau above which more replicates do not improve accuracy of the median and therefore might represent wasted effort if other statistics are not also being estimated with the additional points. We expect that the location of such a plateau will vary from project to project for reasons discussed above (habitat requirements differ, as do typical sizes of uncertainty radii), and that location needs to be determined in a pilot study specific to that dataset until patterns begin to emerge across datasets. The additional points beyond those needed to improve the median might be important if used to estimate a measure of uncertainty for the locality if there is a relationship between the spread of points and the uncertainty that an expert might assign the locality (e.g., as an uncertainty radius or polygon Chapman 2006 ). The relationship between spread and uncertainty might plateau at a different place than the accuracy of the median.

The accuracy of the data clearly improved beyond that produced using the automated GEOLocate algorithm when students were part of the workflow. The percentage of GEOLocate-generated points within an uncertainty radius of the expert points was improved upon by the students in both experiments (e.g., 12.75% vs. 15.16% within 1 uncertainty radius for the plants Table 1 ), and even more so when the median was calculated (18.15%). Note that the GEOLocate algorithm may have provided an important step in the student and expert contributions, especially in the fish experiment where the spatial extent of possible localities was very large. We actually cannot say whether the involvement of a georeferencing algorithm improved or reduced the accuracy of student points, because the experiment did not make that contrast. Future studies may wish to include an additional experiment that determines accuracy of citizen science participants in the absence of an algorithm. Further consideration of the topic, particularly by researchers in the field of human computation and machine learning, could investigate how the automated georeferencing algorithm could be improved by closing the loop—providing feedback to it in the form of citizen-science contributed data.

While the median-point consensus of replicates represented an improvement on the percentage of individual points within threshold numbers of uncertainty radii (e.g., 18.15% vs. 15.16% within 1 uncertainty radius for the plants Table 1 ), the fact that the single best point for each locality is even more often within those thresholds (38.98% within 1 uncertainty radius for plants Table 1 ) invites the question: are there ways to assess the likelihood that a contributed point is the best for a collection locality in the absence of expert points for all collection localities? One way that this might be accomplished is to assess the overall performance of georeferencers, assigning them reputation scores that reflect attributes such as success with localities for a handful of points that experts have georeferenced. A likelihood of success with such an approach is suggested by the fact that the 99 single best points within one uncertainty radius for plants were contributed by 31% of contributors (and not 65%, which would be one best per each of 99 of the 154 total students). Furthermore, a quarter of those 99 points were contributed by just four students.

We also looked at this relationship in another way, asking if the accuracy of the median point improves when data from only the best georeferencers are considered. In the case of thresholds of uncertainty radii, the percentages improved at most thresholds, but generally not dramatically (e.g., 50.37% at a threshold of 5 uncertainty radii for all georeferencers, 51.48% with exclusion of the 19 worst georeferencers, and 55.51% with the exclusion of the worst half of georeferencers Table 1 ). The improvement is most striking, though, when the absolute distance of median from expert point is considered at low thresholds (e.g., 5.56% within 100 meters for all georeferencers and 23.70% and 23.90% with exclusion of 19 worst and worst half, respectively). This relationship can become especially relevant when the fitness for use depends on a precision within some absolute distance. For example, considering global latitudinal diversity gradients, modeling species distributions, and relocating a population are three activities that typically require increasingly precise data.

Hunter et al. ( 2013 ) provide a case study of an implementation involving data validation and trust metrics for improving the quality and measuring the reliability of citizen science data within Coral Watch ( www.coralwatch.org ). A similar approach could be used to develop a weighted index of reputation based on some combination of (1) total number of user contributions, (2) frequency of user contributions, (3) geospatial deviation from known results, and (4) geospatial deviation for identical localities from users with higher reputation. Liu and Liu ( 2015 ) demonstrate a learning algorithm that can assess the quality of crowd-sourced data and provide results from only the strongest combination of contributors. The ability to sort “good” data from “bad” data, in an environment where the correct information is not known at the start, has obvious applications to the field of citizen science georeferencing, and we anticipate incorporating techniques similar to this in future work.

It is important to realize that, as illustrated in Fig. 1 , there are specimens for which a precise georeference is not warranted and for which the actual collection locality is obscured by the changes of time. For example, 23% of the single best points for the plant localities were not within 1 km of the expert point, despite there being 6󈝻 replicates for each. Based on the plant dataset, types of labels that resulted in large discrepancies between expert and student points included these cases: a) Directional labels that do not specify how the distance is measured. For example, in the case of “Sumatra flatwoods pond, 16 miles N of Sumatra, flatwoods pond,” students measured 16 miles due north, while the experts followed the main road out of Sumatra, which veered to the northeast. This was a common problem, with three of the ten most poorly placed student points falling into this category and b) Labels with overly general or contradictory information. For example, in the case of 𔄜 miles NE of Sumatra, by Fla. Rt. 379,” there is likely an error because Route 379 runs in a northwesterly direction from Sumatra. The issue of flagging collection localities that are likely to fall into this category for georefencing by experts or even the original collector (if still living) merits future consideration. Collection localities could perhaps be classified algorithmically with natural language processing into those requiring triage of this type to make more efficient citizen science engagement for georeferencing.


Videoya baxın: QGIS Basic: View photo using maptool tip (Oktyabr 2021).