Vairāk

30 meteostaciju telpiskā interpolācija uz citām teritorijām

30 meteostaciju telpiskā interpolācija uz citām teritorijām


Man ir ikmēneša (un dažreiz arī ikdienas) dati par aptuveni 30 Zviedrijas meteoroloģisko staciju temperatūru 19. gadsimta vidū, un es vēlos to veikt visā valstī. Es izmantoju ArcGIS un Stata.

Turpmākajiem gadiem man ir dati par papildu meteoroloģiskām stacijām (ap 100), tāpēc esmu domājis izmantot vēlākos datus, lai kalibrētu modeli, izmantojot vecās stacijas, lai prognozētu laika apstākļus jaunajās stacijās. Tā kā es zinu faktiskos laika apstākļus jaunajās stacijās, es varētu kalibrēt pēc modeļa, lai sasniegtu vislabāko iespējamo piemērotību. Bet es neesmu pārliecināts, kāda ir laba metode, lai sasniegtu piemērotu piemērotību (piemēram, nevēlaties riskēt ar pārmērīgu aprīkojumu).


Jūs, iespējams, varat iegūt saprātīgu interpolāciju, izmantojot lineāru regresiju (pieņemot, ka jūsu 30 meteoroloģiskās stacijas ir reprezentatīvs paraugs), izmantojot neatkarīgu mainīgo lielumu, platumu un attālumu no krasta ar faktoru dienu. Iepriekš to esmu darījis, izmantojot ArcGIS un R.

Katru dienu no pulksten 9:00 un 15:00 temperatūrā 10 dienu laikā no meteoroloģiskajām stacijām Austrālijas dienvidaustrumos

Pamata darbības:

  • Iegūstiet sava apgabala digitālo augstuma modeli.
  • Iegūstiet vektoru vai rastra piekrasti
  • Ģenerēt platuma rastru (piemērs)
  • Ģenerējiet attālumu no krasta rastra (iespējams, izmantojot Eiklida attālumu)
  • Mainīgajiem, par kuriem jums nav datu par katru staciju, izmantojiet rīku Sample or Extract Values ​​to Points, lai vaicātu attiecīgajam rastram. Man tas bija jādara tikai attālumam no krasta, jo manos meteoroloģisko staciju datos bija lons, lats un augstums.
  • Pievienojiet augstumu, lat un attālumu kā neatkarīgus mainīgos, temperatūru kā atkarīgo mainīgo un dienu kā koeficientu lineārās regresijas modelī r / spss / stata / etc…
  • Ja jums ir piemērota atbilstība, izmantojiet modeļa koeficientus, lai izveidotu rastra kalkulatora izteiksmi (temp = α + βaugstums* augstums + βlat* lat + βdist* dist), lai novērtētu temperatūru no augstuma, lata un attāluma. Jums var būt nepieciešams to skriptu, jo katrai dienai iegūsiet atšķirīgus koeficientus.

Šajā rakstā tiek novērtēta sešu dažādu uz ģeogrāfiskās informācijas sistēmu balstītu interpolācijas metožu veiktspēja: apgrieztā attāluma svēršana (IDW), radiālās bāzes funkcija (RBF), globālā polinoma interpolācija, vietējā polinoma interpolācija, krigēšana un kokrigēšana, izmantojot Ohaio māju datu bāzi, kas izveidota laikā no 1987. gada. un 2011. Vislabāk izmantojamā interpolācijas metode, kas jāizmanto radona gāzes koncentrācijas prognozēšanai Ohaio, ASV nenovērotajos apgabalos, tika apstiprināta, apstiprinot modeļa prognozes ar darbības veiktspējas mērījumiem. Turklāt šajā pētījumā tika veikta uz pasta indeksu balstīta analīze, kas sniedza pilnīgu priekšstatu par radona gāzes koncentrācijas sadalījumu Ohaio

Tika atzīta RBF metode ar vislabāko veiktspēju. Lai gan RBF metode darbojās ievērojami labāk nekā IDW, tā bija statistiski līdzīga citām interpolācijas metodēm. RBF prognozētie radona gāzes koncentrācijas rezultāti liecināja par ievērojamu pasta indeksu skaita pieaugumu, kas pārsniedza Amerikas Savienoto Valstu Vides aizsardzības aģentūras un Pasaules Veselības organizācijas darbības robežas, tādējādi norādot uz nepieciešamību Ohaio radona gāzes koncentrāciju mazināt līdz drošam līmenim, lai lai mazinātu ietekmi uz veselību. Šajā dokumentā demonstrēto pieeju var attiecināt uz citām radona skartajām teritorijām visā pasaulē.


Telpiskās interpolācijas metožu salīdzinājums nokrišņu sadalījuma noteikšanai Distrito Federal, Brazīlijā

Distrito Federal pieejamā klimatoloģiskā informācija neatbilst detalizētas klimata diagnostikas prasībām, jo ​​tā nenodrošina nepieciešamo telpisko izšķirtspēju ūdens resursu pārvaldības vajadzībām. Astoņu dažādu telpiskās interpolācijas metožu pārbaudei tika izmantota gada un sezonas klimatoloģija (1971–2000) no 6 meteoroloģisko staciju nokrišņu un 54 lietus mērierīcēm no Centrālās Brazīlijas. Ģeogrāfiskie faktori (t.i., augstums, garums un platums) izskaidro lielu nokrišņu daudzumu reģionā, un tāpēc tika iekļauti daudzfaktoru modeļi. Novērtējumu veiktspēja tika novērtēta, izmantojot neatkarīgu validāciju, izmantojot vidējo kvadrāta kļūdu, korelācijas koeficientu un Neša – Sutklifa efektivitātes kritēriju. Apgrieztā attāluma svēršana (IDW), parastā krigēšana (OK) un daudzveidīgā regresija ar atlikumu interpolāciju ar IDW (MRegIDW) un OK (MRegOK) ir veikusi viszemākās kļūdas un visaugstāko korelācijas un Neša – Sutklifa efektivitātes kritēriju. Interpolācijas metodes nodrošina līdzīgu nokrišņu telpisko sadalījumu visur, kur novērošanas tīkls ir blīvs. Tomēr ģeogrāfisko mainīgo iekļaušanai interpolācijas metodē vajadzētu uzlabot aplēses apgabalos, kur novērojumu tīkla blīvums ir zems. Tomēr nenoteiktību novērtējums, izmantojot ģeostatistisko metodi, sniedz papildu un kvalitatīvu informāciju, kas jāņem vērā, interpretējot nokrišņu telpisko sadalījumu.

Šis ir abonementa satura priekšskatījums, piekļuve caur jūsu iestādi.


2. USGS maksimālās plūsmas ieraksti

[3] Lai raksturotu lielu ASV plūdu telpisko izplatību, mēs esam analizējuši Maksimālās plūsmas faili iegūti no USGS plūsmas apzīmēšanas staciju dokumentiem un uzturēti kā daļa no USGS Nacionālās ūdens informācijas sistēmas [ Lepkins un DeLaps, 1979] (dati ir pieejami vietnē http://waterdata.usgs.gov/usa/nwis/nwis). Katras stacijas maksimālās plūsmas failā ir lielākās momentānās izplūdes (maksimālās plūsmas) vērtības katram stacijas darbības ūdens gadam (no 1. oktobra līdz 30. septembrim), kā arī piezīmes par faktoriem, kas ietekmē plūsmu, un plūsmas ieraksta kvalitāti. Attiecībā uz ierakstiem, kas apkopoti 1997. ūdens gadā (beidzoties 1997. gada 30. septembrim), gada maksimālās plūsmas tiek ziņotas par 23 216 pašreizējām un bijušajām stacijām, kas kopā satur vairāk nekā 0,5 miljonus gada maksimālo izplūdes vērtību.

2.1. Lielākie meteoroloģiskie plūdi no baseiniem no 2,6 līdz 26 000 km 2

[4] No plūsmas kartēšanas staciju maksimālās plūsmas failiem, kuru drenāžas laukumi ir no 2,6 līdz 26 000 km 2 (no 1 līdz 10 000 jūdzēm 2) un ar 5 vai vairāk gadu rekordu, mēs ieguvām 10% no gada maksimālajiem izplūdēm. Iegūto datu bāzi veidoja 43 645 gada maksimālās plūsmas no 18 735 stacijām. Katrai stacijai ir 1 līdz 15 gada maksimālās izplūdes katrā stacijā atkarībā no ieraksta garuma. No šiem datiem mēs noraidījām gandrīz 8000 (aptuveni 19%) no gada maksimālās plūsmas, kas tika kodētas maksimālās plūsmas datnēs, kā lēsts, ietekmēja aizsprostu bojājumi vai ietekmē regulēšana, novirzīšana, urbanizācija, kalnrūpniecība, lauksaimniecības izmaiņas vai kanalizācija . Iegūto datu bāzi veido 35 663 gada maksimālās plūsmas no 14 815 straumēšanas stacijām Amerikas Savienotajās Valstīs un Puertoriko (1. attēls).

[5] Koncentrējoties uz baseiniem, kuru lielums ir no 2,6 līdz 26 000 km 2, un izslēdzot ierakstus, kas kodēti kā ietekmēti antropogēno faktoru, piemēram, regulēšanas vai novirzīšanas, mēs, iespējams, esam samazinājuši šo faktoru ietekmi uz atlikušajām gada maksimālajām plūsmām. Saglabāto ierakstu pārbaude tomēr norāda, ka daudzas analizētās ikgadējās maksimālās izplūdes zināmā mērā tiešām ietekmēja regulēšana, novirzīšana un urbanizācija. Kopumā nesakritīgā kodēšanas prakse ar laiku un starp dažādiem birojiem, kas ziņo par šiem datiem, apgrūtina tādu visu faktoru ietekmēto gada maksimālo plūsmu pilnīgu izolēšanu, pamatojoties tikai uz informāciju maksimālās plūsmas datnēs.

[6] Citi datu aspekti pašreizējā formā kavē objektīvu kvantitatīvu lielu plūsmu telpiskā sadalījuma novērtējumu. Kaut arī USGS plūsmas kartēšanas stacijas mēra plūsmu no baseiniem katrā štatā un Puertoriko, pārklājums nav vienmērīgs, staciju blīvums daļēji atbilst iedzīvotāju blīvumam, par ko liecina lielais staciju skaits gar austrumu piekrasti un citām pilsētām (1. attēls). Turklāt daudzos analīzē iekļautajos meliorācijas baseinos ir vairākas stacijas ar pārklāšanās veicinošajiem apgabaliem, kā tas ir parasti staciju sērijas gar atsevišķu upi. Šādās situācijās šo staciju gada maksimālās izplūdes uzskaite var nebūt neatkarīga, jo to pašu plūdu var izmērīt (un iekļaut pīķa plūsmas datnēs) vairākās vietās. Šis faktors tiek samazināts, bet netiek novērsts, izslēdzot baseinus, kuru lielums pārsniedz 26 000 km 2. Neskatoties uz to, lielais staciju skaits un plašais sadalījums, domājams, pārspēj antropogēnos faktorus, kas saglabāti datu bāzē, kas var sistemātiski ietekmēt lielu maksimālo izplūdumu telpisko sadalījumu, vismaz kvalitatīvu lielu plūsmu telpiskā sadalījuma novērtēšanai.

[7] No pēdējiem saglabātajiem ierakstiem par 35 663 ikgadējām maksimālajām plūsmām no 14 815 plūsmas gaging stacijām, maksimālās novadīšanas diagramma pret drenāžas laukumu, kā paredzēts, parāda, ka lielākiem baseiniem parasti ir lielākas maksimālās izplūdes (2. attēls). Neskatoties uz to, daži baseini rada lielāku plūsmu nekā citi līdzīga izmēra baseini. Lai nošķirtu lielāko no šīm maksimālajām gada plūsmām attiecībā uz drenāžas laukumu, mēs tālāk stratificējām 2. attēla datus ∼90. un ∼99. procentiles vienību izplūdēs (maksimālā izlāde dalīta ar drenāžas laukumu), izmantojot jaudas likuma vienādojumu pāri (1. tabula), kas izveidota, lai saglabātu līdzīgu kopējo meliorācijas baseinu teritoriju sadalījumu attiecībā pret kopējo analizēto staciju populāciju (3. attēls). Lai gan mēs atsaucamies uz šīm lielu vienību izlādes apakškopām kā ∼90. un ∼99. procentili, tās būtībā ir ∼99. un ∼99.9. Procentiles vienību izlādes attiecībā pret visām reģistrētajām gada maksimālajām izlādēm, jo ​​tās iegūst tikai no lielākajiem 10% visas gada maksimālās izplūdes katrai stacijai.

Stratifikācija Vienādojums Plūdu skaits Straumēšanas reitinga staciju skaits
~ 90. procentile Jpk90 = 24,3 [kv km] 0,57 3503 2088
~ 99. procentile Jpk99 = 74 [kv km] 0,53 397 284

2.2. Drenāžas baseina noteikšana

[8] 3503 plūsmas, kas veido ∼90. procentiles vienības izplūdi, ir no 2088 (no 14 815) USGS plūsmas reģistrēšanas stacijām ASV un Puertoriko. Katrai no šīm 2088 stacijām ģeogrāfiskās informācijas sistēmā (ĢIS) tika noteiktas veicinošās drenāžas zonas, izmantojot 1 km izšķirtspējas digitālo augstuma modeli Ziemeļamerikai (HYDRO1k augstuma dati iegūti vietnē http://edcdaac.usgs.gov/gtopo30 / hidro). Augstuma modeļa rupjā izšķirtspēja kavē kvantitatīvu ĢIS analīzi, kas attiecina plūsmas raksturlielumus uz telpiskajiem datiem. Neskatoties uz to, šie aptuvenie ierobežojumi ļauj parādīt to teritoriju telpisko sadalījumu, kurās nacionālā mērogā rodas vislielākās izplūdes, nevis tikai straumes kartēšanas staciju vietas.


3. Rezultāti un diskusijas

3.1. Apvidus analīzes

[15] Vidējais augstums 50 km buferos apkārt meteoroloģiskajām stacijām svārstījās no 1037 m līdz 5040 m, un lielākā daļa pārsniedz 3000 m (3.a attēls). Salīdzinot ar katras stacijas augstumu, vidējais augstums 50 km buferu robežās skaidri parādīja izlīdzināšanas sekas, pateicoties DEM datu 1 km telpiskajai izšķirtspējai, un vidējo rādītāju buferos (4. attēls). Vidējais slīpuma gradients 50 km buferu robežās svārstījās no 0,4 līdz 13,7 grādiem (3.b attēls), bet maksimālais slīpums svārstījās no 1,9 līdz 45,9 grādiem. 5. attēlā parādīts slīpuma aspektu telpiskā sadalījuma modelis. Slīpumu īpatsvars, kas bija līdzens, netika uzrādīts, jo tas mēdza būt ļoti mazs, sākot no 0 līdz 0,052, kas paredzēts vienai stacijai ar 0.234.

3.2. VUM / I aprēķinu neobjektivitāte

[16] 6. attēlā parādīts vidējais SSM / I aprēķinu novirze kā SSM / I novērtējumu attiecība pret stacijā novērotajiem nokrišņiem visu mēnešu vidējiem rādītājiem. Aizspriedumi tika aprēķināti, visus gadus apkopojot pieejamos datus par konkrētu mēnesi vai sezonu. Lielākajai daļai pētāmās teritorijas staciju novirzes bija zem vienotības (vai par zemu novērtētas). Atrašanās vietas ar ievērojamu SSM / I pārvērtējumu galvenokārt tika atrastas Tibetas plato ziemeļu daļā. Lai gan lielākā daļa iepriekšējo starpsalīdzināšanas un apstiprināšanas pētījumu ieteica pārvērtēt ar SSM / I balstītu nokrišņu līmeni, NESDIS algoritms ir parādījis ievērojamas novirzes novirzēs un dažos gadījumos ievērojami nenovērtēšanu augstāka platuma reģionos [ Ēberts u.c., 1996 Ēberts un Mantons, 1998 Adlers un citi., 2001 Kummerow et al., 2001 McCollum et al., 2000, 2002]. Šie pētījumi arī parādīja spēcīgas telpiskās un laika variācijas, kas prasa turpmāku izpēti dažādos reģionālos apstākļos.

[17] Ir vairāki iespējamie iemesli ievērojamiem negatīviem aizspriedumiem, kas atklāti Tibetas plato. Globāls zonu salīdzinājums ar Ferraro u.c. [1996] starp SSM / I un gabarīta analīzi Legāti un Vilmots [1990] ierosināja, ka SSM / I nepietiekami novērtē nokrišņus vidējā platuma grādos līdz augstiem platuma grādiem, jo ​​tiek izslēgti tādi notikumi, kad uz zemes bija sniegs un ledus, bet pārvērtē nokrišņus tropu reģionos. NESDIS algoritma pamatā ir izkliedes noteikšana atmosfēras lietainajā slānī. Tomēr atmosfēras biezums virs Tibetas plato ir aspekts, kas nav pārstāvēts iepriekšējos validācijas pētījumos, kas veikti jūras līmenī vai tā tuvumā. Zemāks gaisa blīvums un relatīvi auksta un neauglīga plato virsma liela augstuma dēļ var izraisīt mazākas izkliedes signālu atšķirības starp plato virsmu un plato atmosfēru. Tāpēc algoritmi, kas izstrādāti, izmantojot datus par maza augstuma apgabaliem, var radīt kļūdainus aprēķinus. Ēberts un Mantons [1998] paziņoja, ka, lai gan SSM / I labi izceļ nokrišņu notikumu telpiskos modeļus, lietusgāzes režīms nepārprotami ir faktors, kas ietekmē aprēķinu precizitāti. Ferraro un Marks [1995] norādīja, ka minimālais lietojamais ātrums, ko nosaka NESDIS algoritms, ir 0,5 mm / hr, kas var novest pie dažiem nelieliem lietus gadījumiem, kas bieži sastopami Tibetas plato. Grīns un citi. [1997] arī ierosināja, ka SSM / I aplēses novirzes var būt atkarīgas no nokrišņu notikumu īpašībām.

[18] Divvirzienu regresijas rezultāti starp satelīta aplēsēm un novērotajiem virsmas nokrišņiem ir parādīti 7. attēlā ass un regresijas koeficienti (slīpumi) parādīja ievērojamus sezonālos modeļus. Visā pētījuma periodā (1987–1999) darbojošos satelītu skaits bija atšķirīgs, kas SSM / I aplēsēs pievienoja vēl vienu variācijas dimensiju. Laikposmos, kad pieejams tikai viens satelīts, ainu var apmeklēt ne vairāk kā divas reizes dienā. Morisejs un Vangs [1994] norādīja, ka šādi paraugu ņemšanas ierobežojumi var izraisīt nepietiekamu novērtējumu tropu okeānos ar ievērojamiem diennakts mākoņainības un nokrišņu cikliem. Līdzīgus argumentus var minēt arī par Tibetas plato, kur musonu sezonā ir labi zināms diennakts nokrišņu daudzums [ Kuvagata u.c., 2001 Liu u.c., 2002]. Runājot par attiecību stiprumu starp SSM / I aplēsēm un stacijā novērotajām vērtībām, R Divvērtīgo regresijas modeļu 2 vērtības vairāk vai mazāk atbilst iepriekšējiem pētījumiem (3. tabula). Piemēram, Ksijs un Arkins [1995] salīdzināja SSM / I balstītās aplēses ar GPCC un CAMS staciju datiem 2,5 ° × 2,5 ° režģa šūnām. Korelācijas starp ikmēneša SSM / I novērtējumiem, kuru pamatā ir Grodija algoritms, un staciju dati zonās 20 ° –40 ° N un 20 ° –40 ° S bija 0,56 CAMS un 0,61 GPCC datu kopām. Viņi arī izmantoja CAMS stacijas virs Ķīnas un ieguva korelācijas koeficientu 0,685 3 gadu pētījuma periodam. Zems R 2 vērtības ziemas mēnešos (3. tabula), iespējams, bija saistītas ar sniega / ledus virsmu apstrādi ar NESDIS algoritmu. Mēs pārbaudījām uz SSM / I balstītos ikmēneša sniega segas datus no NESDIS (ftp://orbit35i.nesdis.noaa.gov/pub/arad/ht/rferraro/ncdc/). Šajā datu kopā ir mēneša vidējās sniega segas daļas (0–1,0) 1 ° × 1 ° režģiem. Ziemas mēnešos (DJF) lielāko daļu Tibetas plato klāja sniegs, salīdzinot ar visiem pārējiem mēnešiem, kad tikai nelielai daļai bija liela sniega segas daļa (8. attēls).

Modelis Pārtvert VUM / I aplēses Slīpums Standartizētais koeficients t Nozīme R 2
JAN 3.354 JAN_EST 3.680 0.698 9.594 0.0000 0.487
FEB 6.572 FEB_EST 2.067 0.416 4.510 0.0000 0.173
MAR 10.672 MAR_EST 4.275 0.790 12.685 0.0000 0.624
GPL 14.902 APR_EST 1.179 0.575 6.918 0.0000 0.330
MAIJS 31.144 MAY_EST 0.624 0.658 8.610 0.0000 0.433
JŪNIS 45.632 JUN_EST 0.507 0.702 9.704 0.0000 0.493
JULIS 50.253 JUL_EST 0.580 0.676 9.035 0.0000 0.457
AUG 60.870 AUG_EST 0.620 0.440 4.828 0.0000 0.194
SEP 43.640 SEP_EST 0.758 0.631 8.009 0.0000 0.398
AZT 20.561 OCT_EST 1.546 0.498 5.663 0.0000 0.248
NOV 4.992 NOV_EST 1.813 0.403 4.333 0.0000 0.162
DEC 2.634 DEC_EST 0.867 0.074 0.732 0.4660 0.005
ZIEMA 11.105 WIN_EST 4.296 0.630 7.995 0.0000 0.397
PAVASARIS 47.556 SPR_EST 1.137 0.734 10.660 0.0000 0.539
VASARA 155.596 SUM_EST 0.575 0.646 8.330 0.0000 0.417
Kritiens 55.380 FAL_EST 1.216 0.708 9.865 0.0000 0.501
MONSOON 218.617 MONS_EST 0.648 0.681 9.170 0.0000 0.464
GADS 20.644 ANN_EST 0.839 0.708 9.883 0.0000 0.502

[19] Visbeidzot, dažos validācijas pētījumos tika izmantoti radara nokrišņu daudzuma dati, kas parasti piedāvāja labākus reģionālos aprēķinus nekā parastie gabarītu dati. Faktiski NESDIS algoritms tika noregulēts ar lietus intensitātes radara datiem. Parasti punktu nokrišņu rādītāji parasti nenovērtē reģionālo nokrišņu daudzumu [ ASV laika birojs, 1957 ]. Anagnostou et al. [1999] norādīja, ka lauka un punkta atšķirība radīja līdz 60% no dispersijas radara-gabarīta salīdzinājumos. Tā kā 1 ° × 1 ° režģa SSM / I aprēķini tika samazināti, izmantojot interpolāciju, un vidēji tika aprēķināti 50 km buferšķīdumos, šūnas ar lielu nokrišņu daudzumu var kombinēt ar šūnu iedarbību ar mazāku nokrišņu daudzumu vai bez nokrišņiem. Šī procedūra varētu vēl vairāk palielināt atšķirību starp stacijas nokrišņiem un SSM / I aprēķiniem 50 km buferu robežās. Ņemot vērā faktu, ka šajā pētījumā izmantotie staciju nokrišņu dati nav koriģēti, ņemot vērā vēja un sniega ietekmi, nepietiekami novērtētais apjoms bija nozīmīgāks, nekā parādījās. Vēsākajos mēnešos koriģētais nokrišņu daudzums var 1,5–2,0 reizes pārsniegt Tibetas plato izmērītās nokrišņu vērtības [ Ueno un Ohata, 1996]. Novirzes analīzes rezultāti nepārprotami norāda uz reģionālu algoritmu nepieciešamību, kas pamatojas uz vietējām un reģionālajām īpašībām, lai iegūtu precīzus nokrišņu aprēķinus.

3.3. Telpiskā modelēšana, kuras pamatā ir daudzkārtēja regresija

[20] Pakāpeniskā regresija tika izmantota, lai izvēlētos neatkarīgus mainīgos, kas sniedz nozīmīgu ieguldījumu staciju nokrišņu variāciju izskaidrošanā. Sakarā ar kolinearitāti starp neatkarīgajiem mainīgajiem, daži reljefa mainīgie neiekļuva galīgajos modeļos, jo to ietekmi atspoguļoja citi saistīti mainīgie. Regresijas analīzes rezultāti norāda, ka sākotnējiem SSM / I aprēķiniem bija mazs nokrišņu telpiskās struktūras skaidrojošais spēks pār Tibetas plato, it īpaši mēnešus ar plašu sniega segu un ka reljefa un atrašanās vietas mainīgie būtiski ietekmēja satelītu aplēses precizitāti. Izmantojot satelīta aplēses, lai prognozētu zemes novērojumus bez šajā pētījumā apskatītajiem reljefa un atrašanās vietas mainīgajiem, R 2 vērtības svārstījās no 0,005 (decembrī) līdz 0,624 (martā), visu mēnešu vidējā vērtība bija 0,334 (3. tabula). Kad regresijas procesam tika pievienoti reljefa un atrašanās vietas mainīgie, R 2 vērtības uzlabojās no 0,217 (decembrī) līdz 0,739 (martā) ar vidējo rādītāju 0,590 (4. tabula). Sezonas un gada modeļi kopumā bija labāki nekā mēneša modeļi ar vidējo R 2 no 0.470 pirms reljefa un atrašanās vietas mainīgo pievienošanas un 0.675 pēc to iekļaušanas.

Modeļa kopsavilkums Tikai ar satelīta aplēsēm Ar reljefa-atrašanās vietas mainīgajiem Mainīgie, kas iekļuvuši modeļos (atbilstoši ievadīšanas secībai)
R 2 Adj. R 2 Std. Kļūda R 2 Adj. R 2 Std. Kļūda
JAN 0.487 0.482 4.6 0.602 0.577 4.1 JAN_EST, DA, MIN_H, MAX_H, MEAN_SLP, W
FEB 0.173 0.165 10.8 0.412 0.380 9.3 FEB_EST, MIN_H, LAT, MAX_SLP, N
MAR 0.624 0.620 13.6 0.739 0.728 11.5 MAR_EST, GARI, LAT, ZR
GPL 0.330 0.323 19.1 0.576 0.558 15.4 APR_EST, MIN_H, GARS, LAT
MAIJS 0.433 0.427 23.5 0.691 0.674 17.7 MAIJS_LIKUMS, GARUMS, DA, D, DR
JŪNIS 0.493 0.487 31.0 0.681 0.664 25.1 JUN_EST, GARUMS, DA, MEAN_SLP, STD_H
JULIS 0.457 0.451 39.3 0.668 0.646 31.6 JUL_EST, DA, MAX_H, LAT, LONG, E
AUG b b AUG_EST (satelīta aplēses) neiekļuva modelī, lai gan tas ir saistīts ar AUG ar nozīmīgumu 0.05.
0.194 0.185 50.3 0.617 0.596 35.4 LAT, MAX_H, N, W, NE
SEP 0.398 0.392 31.2 0.704 0.685 22.5 SEP_EST, LAT, LONG, STD_H, MEAN_SLP, SE
OCT c c OCT_EST vispirms neievadīja modeli.
0.248 0.241 20.4 0.615 0.594 14.9 GARI, LAT, MIN_H, OCT_EST, SE
NOV d d NOV_EST neiekļuva pirmais.
0.162 0.154 6.4 0.558 0.534 4.8 LAT, LONG, NOV_EST, MEAN_H, MAX_H
DEC e e DEC_EST nav statistiski ticama pie 0.05.
0.005 0.000 4.9 0.217 0.192 4.4 STD_H, SE, MEAN_SLP
ZIEMA 0.397 0.391 16.5 0.476 0.459 15.6 WIN_EST, SE, MIN_H
PAVASARIS 0.539 0.535 45.9 0.700 0.684 37.8 SPR_EST, GARS, LAT, MIN_H, SE
SUMMER f f SUM_EST ievadīts pirmais, bet tas tika izslēgts 5. darbībā, pēc tam atkal ievadīts 9. solī.
0.417 0.411 103.9 0.711 0.686 75.9 DA, LAT, GARUMS, MAX_H, DR, W, SUM_EST, ZR
Kritiens 0.501 0.496 45.2 0.711 0.699 34.9 FAL_EST, SE, LONG, LAT
MONSOON g g MONSOON_EST tika izvadīts 8. solī ar R2 = 0,737.
0.464 0.459 143.9 0.732 0.714 104.6 DA, GARUMS, LAT, STD_H, MAX_H, MEAN_SLP
GADS 0.502 0.497 15.3 0.722 0.707 11.7 ANN_EST, DA, GARI, LAT, MAX_H
  • a Pielāgotais R 2 vērtības (pielāg. R 2) atspoguļo kolinearitātes ietekmi starp neatkarīgajiem mainīgajiem. Novērtējumu standarta kļūda (Std. Error) ir vēl viens modeļa veiktspējas rādītājs.
  • b AUG_EST (satelīta aplēses) neiekļuva modelī, lai gan tas ir saistīts ar AUG ar nozīmīgumu 0.05.
  • c OCT_EST vispirms neiekļuva modelī.
  • d NOV_EST neiekļuva pirmais.
  • e DEC_EST nav statistiski ticama pie 0.05.
  • f SUM_EST ievadīja pirmo, bet tas tika izslēgts 5. darbībā, pēc tam atkal ievadīts 9. solī.
  • g MONSOON_EST tika izvadīts 8. solī ar R2 = 0,737.

[21] Pavisam ir 18 modeļi: 12 ikmēneša, 4 sezonālie, 1 musonu mēnešiem (no maija līdz septembrim) un 1 ikgadējie (kā visu mēnešu vidējie rādītāji). No neatkarīgajiem mainīgajiem lielumiem, izņemot SSM / I novērtējumus, lielākajā daļā modeļu ievadīja atrašanās vietas mainīgos. Gan LAT, gan LONG ievadīja pa 13 modeļiem, lai gan tie ne vienmēr iekļuva vienā un tajā pašā modelī kopā. Visbiežāk modeļos ievadītais reljefa mainīgais bija dienvidaustrumu aspekta nogāžu īpatsvars (13 modeļi), kam sekoja maksimālais augstums 50 km buferos (7 modeļi), minimālais augstums (6 modeļi), vidējais slīpums (5 modeļi), augstuma standartnovirze (4 modeļi) un rietumu aspekts (3 modeļi). Slīpumu proporcijas, kas vērstas uz DR, ZR un N, ieguva 2 modeļus. Plakans slīpums (0 aspekts) un minimālais slīpums neiekļuva nevienā modelī, bet maksimālais slīpums, vidējais slīpums un pārējie aspekta mainīgie (NE, E un S) - katrs pa 1 modelim. Visi mainīgie, kas palika modeļos, bija statistiski nozīmīgi 0,05 līmenī.

[22] Attiecībā uz reljefa un atrašanās vietas mainīgo ietekmes laika izmaiņām martā modelim bija visaugstākā R 2, kam seko septembra modelis. Decembra un februāra modeļi bija zemi R 2 vērtības. Faktiski decembrī sākotnējie SSM / I aprēķinātie nokrišņi nekorelēja ar novērotajiem nokrišņiem ar statistisko nozīmīgumu (0.05). Attiecībā uz augustu SSM / I aprēķinātie nokrišņi arī netika iekļauti modelī, lai gan tie bija saistīti ar novērotajiem zemes nokrišņiem pie nozīmības līmeņa 0,05. Oktobrī un novembrī modeļos tika iekļautas SSM / I aplēses, taču tās modeļos neiekļuva pirmās. Kas attiecas uz sezonas modeļiem, ziemas modelim bija viszemākais R 2 vērtība, atkal sniega un ledus dēļ Tibetas plato lielākajā daļā.

[23] Lai vienkāršotu modeļa struktūras, neatkarīgi mainīgie, kas iekļuva modelī vienu vai divas reizes, tika uzskatīti par margināliem un izslēgti no procedūras, lai iegūtu galīgos modeļus. Tāpēc palika tikai astoņi reljefa un atrašanās vietas mainīgie (LAT, LONG, MAX_H, MIN_H, STD_H, MEAN_SLP, SE un W). 5. tabulā parādīti galīgie regresijas modeļi, kuru pamatā ir pakāpeniska regresija, kā arī neatkarīga mainīgā manuāla izvēle. Piemēram, LAT un MAX_H tika iepriekš izslēgti, lai nodrošinātu, ka SSM / I novērtējums iekļaus augusta modeli. Tika mēģināts izmantot to pašu pieeju decembrī, taču tas neizdevās, jo SSM / I aprēķinātais nokrišņu daudzums statistiski nav korelēts ar novērotajiem nokrišņiem zemē. Neskatoties uz to, SSM / I aprēķinātais nokrišņu daudzums modelī tika “piespiests”, lai atspoguļotu starpgadīgo mainīgumu, kaut arī tas nebija statistiski nozīmīgs. Tika atzīmēts, ka vasaras un musonu sezonas modeļiem (no maija līdz septembrim) SSM / I aplēses tika izslēgtas pēdējā posmā. Tāpēc šajās sezonās modeļu versijas pirms SSM / I aprēķinu izslēgšanas tika uzskatītas par labākajām. Nozīmības līmenis 0,1 tika izmantots mainīgo atlases procesā, lai uzlabotu prognozēšanas jaudu, taču gandrīz visi modeļu mainīgie bija nozīmīgi 0,05 līmenī.

Mēnesis / sezona Regresijas modelis R 2
Janvāris JAN = −4,215 + 3,166 JAN_EST + 41,195 SE - 0,002 MIN_H + 0,002 MAX_H - 0,706 MEAN_SLP + 32,281 W 0.602
Februāris FEB = 72,797 + 1,355 FEB_EST - 0,006 MIN_H - 1,556 LAT + 74,736 W - 1,211 MEAN_SLP 0.406
Martā MAR = −30.556 + 3.753 MAR_EST + 1.057 GARS - 1.575 LAT - 0.003 MIN_H 0.738
Aprīlis GPL = −21.991 + 0.460 APR_EST + 130.297 SE - 0.008 MIN_H + 1.271 GARS - 2.157 LAT 0.591
Maijs MAIJS = −170.98 + 0.236 MAY_EST + 2.173 GARS + 254.112 SE + 3.953 MEAN_SLP - 0.066 STD_H - 0.007 MIN_H 0.717
jūnijs JŪNIS = −170.136 + 0.265 JUN_EST + 2.178 GARS + 236.862 DA + 6.488 MEAN_SLP - 0.101 STD_H 0.681
Jūlijs JUL = 203.292 + 0.233 JUL_EST + 313.315 DA - 0.02 MAX_H - 8.907 LAT + 2.467 GARS 0.652
augusts AUG = −1.612 + 804.741 SE + 0.212 AUG_EST + 7.159 MEAN_SLP - 0.098 STD_H 0.436
Septembris SEP = −36,798 + 0,278 SEP_EST - 4,503 LAT + 2,403 GARI - 0,08 STD_H + 4,004 MEAN_SLP + 211,588 SE 0.704
Oktobris AZT = −51.113 + 1.536 GARI - 1.876 LAT - 0.010 MIN_H + 0.568 OCT_EST + 158.320 SE - 0.029 STD_H + 107.318 W 0.643
Novembrī NOV = 3,384 - 0,003 MIN_H - 0,757 LAT + 0,311 GARS + 1,031 NOV_EST + 42,748 SE 0.541
Decembris DEC = −5.172 + 0.635 DEC_EST a a DEC_EST nebija statistiski nozīmīgs 0,1 līmenī, bet tika iespiests modelī.
+ 0,013 STD_H + 48,507 DA - 0,479 MEAN_SLP
0.220
Ziema ZIEMA = 0,939 + 3,644 WIN_EST + 181,552 SE - 0,005 MIN_H + 130,083 W - 1,360 MEAN_SLP 0.512
Pavasaris PAVASARIS = −170.805 + 0.618 SPR_EST + 4.161 GARS - 4.947 LAT - 0.013 MIN_H + 342.192 SE 0.700
Vasara VASARA = 397,674 + 0,147 SUM_EST + 1067,505 SE - 25,590 LAT + 8,087 GARI - 0,050 MAX_H + 0,019 MIN_H 0.678
Kritiens FALL = −37.003 + 0.432 FAL_EST + 390.810 SE + 3.935 GARI - 7.304 LAT - 0.115 STD_H - 0.013 MIN_H + 4.505 MEAN_SLP 0.741
Musons MONSOON = 275,768 + 0,190 MONS_EST + 1464,711 SE + 13,241 GARUMS - 33,701 LAT - 0,139 STD_H - 0,039 MAX_H 0.715
Gada GADS = 14,99 + 0,229 ANN_EST + 169,663 SE + 1,511 GARS - 3,532 LAT - 0,005 MAX_H 0.722

[24] Regresijas koeficientu zīmes norāda neatkarīgo mainīgo lieluma ieguldījumu staciju nokrišņu dispersijas izskaidrošanā. No trim reljefa / atrašanās vietas mainīgajiem, kas visbiežāk tika ievadīti modeļos (LAT, LONG un SE), LAT koeficienti bija konsekventi negatīvi, norādot uz staciju nokrišņu samazināšanos tam pašam SSM / I novērtējumam, virzoties uz ziemeļiem (5. tabula). Koeficienti LONG bija vienmēr pozitīvi, norādot, ka palielinās staciju nokrišņu daudzums uz to pašu SSM / I aprēķinu daudzumu, virzoties uz austrumiem. Šie divi mainīgie lielumi liecināja par attāluma ietekmi uz mitruma avotiem virs Tibetas plato. Iepriekšējie pētījumi liecināja, ka ir divi galvenie mitruma transportēšanas ceļi, viens no Indijas okeāna / Bengālijas līča nāk uz plato dienvidaustrumu daļu un viens no Arābijas jūras uz plato rietumu daļu [ Dings, 1991 Yang et al., 1989 Tang u.c., 1994]. Ziemeļrietumu samazināšanās tendence liecina par mitruma avotu nozīmi no dienvidaustrumiem, savukārt sākotnējie SSM / I dati šo tendenci nenovērtēja. Līdzīgi arī DA koeficienti bija nemainīgi pozitīvi, norādot, ka apgabalos ar nogāzēm, kas vērstas galvenokārt uz dienvidaustrumiem, mēdz būt lielāks nokrišņu daudzums un ka gaisa plūsmai, kas nāk no dienvidaustrumiem, ir liela nozīme nokrišņu veidošanā ap gadu.

[25] Dažos rudens un ziemas mēnešos (janvārī, februārī un oktobrī) un ziemas sezonā uz rietumiem vērstajām nogāzēm bija pozitīva ietekme. Tā kā dominējošās atmosfēras plūsmas jostas rudens un ziemas laikā pārvietojas uz dienvidiem, rietumu plūsmām ir svarīga loma nokrišņu veidošanā, īpaši Tibetas plato rietumu daļā. Vienīgais mainīgais ar zināmu konsistenci bija MIN_H (negatīvs, izņemot vasaru). Zems minimālais augstums 50 km buferos bieži sakrīt ar apgabaliem Plato dienvidaustrumu malā - reģionā ar relatīvi augstiem nokrišņiem. No otras puses, MAX_H klātbūtne bija visizteiktākā sezonālajām vērtībām (negatīvie koeficienti). Tā kā šajā pētījumā izmantotais datu kopums attiecas tikai uz tām stacijām Ķīnā, tas galvenokārt atspoguļo reģiona kalnu grēdu lietus barjeras / lietus ēnas efektu. Tāpēc buferi ar augstāku maksimālo augstumu bieži sakrita ar apgabaliem ar kalnu grēdām plato un zemākām nokrišņu vērtībām tām pašām SSM / I aplēsēm. Visiem citiem reljefa / atrašanās vietas mainīgajiem var būt pozitīvi vai negatīvi koeficienti.

3.4. Gadījuma izpēte: 1999. gads

[26] Lai parādītu, kā šajā pētījumā iegūtos modeļus var izmantot, lai uzlabotu SSM / I nokrišņu daudzumu aplēses Tibetas plato, modeļus izmantojām 1999. gada janvāra, aprīļa, jūlija un oktobra datiem. Pirmkārt, katram 1 ° × 1 ° režģa šūna, centrā tika izveidots 50 km buferis, un to izmantoja, lai aprēķinātu reljefa raksturlielumus buferī, izmantojot 1 km × 1 km DEM. Pēc tam modelēto nokrišņu aprēķinu aprēķināšanai tika izmantoti sākotnējie SSM / I nokrišņu aprēķini kopā ar reljefa un atrašanās vietas mainīgajiem lielumiem. Visbeidzot, punktu nokrišņu dati tika interpolēti, izmantojot krigingu. 9. attēlā parādīti interpolētie modelētie nokrišņu aprēķini par 1999. gada jūliju. Lielākoties modelētie nokrišņi saglabāja sākotnējo SSM / I novērtējumu vispārējo telpisko struktūru (2. attēls), izlīdzinot dažus vietējās variācijas modeļus. Tomēr ir arī pilnīgi skaidrs, ka starp abiem pastāvēja būtiskas atšķirības. Modelētie nokrišņu rādītāji kopumā bija lielāki nekā sākotnējie SSM / I aprēķini visā Tibetas plato, it īpaši plato centrālās daļas apgabalos. DA-ZR gradients kļuva pamanāmāks nekā sākotnējie SSM / I novērtējumi, jo jūlija modelis ietvēra abus atrašanās vietas mainīgos (LAT un LONG).

[27] Mēs salīdzinājām modelētos nokrišņu aprēķinus ar staciju nokrišņiem, iegūstot nokrišņu lauka datus meteoroloģisko staciju 50 km buferiem. 10. attēls ir jūlija sākotnējo SSM / I novērtējumu un modelēto novērtējumu izkliedes diagramma pret stacijas nokrišņiem. Regresijas analīze parādīja, ka modelētajiem nokrišņiem bija a R 2 vērtība 0,65, salīdzinot ar 0,49 sākotnējiem SSM / I aprēķiniem, un gandrīz 1: 1 attiecība pret stacijas nokrišņiem. 6. tabulā iekļauti 1999. gada janvāra, aprīļa, jūlija un oktobra salīdzināšanas rezultāti. Sākotnējā SSM / I aprēķinu uzlabojumus var redzēt par visiem šiem mēnešiem, lai gan janvārī modeļa veiktspēja joprojām bija ļoti slikta. Saknes vidējā kvadrāta kļūda (RMSE) piedāvā vēl vienu modeļa veiktspējas mērījumu. Arī visu pārbaudīto mēnešu laikā uzlabojumi ir vērojami (6. tabula).

Oriģināls SSM / I Modelētais SSM / I
R 2 Standarta kļūda RMSE R 2 Standarta kļūda RMSE
Janvāris 0.013 5.88 6.68 0.190 5.33 5.36
Aprīlis 0.084 37.29 41.68 0.699 21.37 25.22
Jūlijs 0.493 42.56 50.00 0.654 35.14 34.28
Oktobris 0.145 40.25 57.84 0.339 35.40 40.23
  • a Tiek parādīti regresijas (R 2 un aprēķinu standarta kļūdu) un vidējā kvadrāta kļūdu (RMSE) rezultāti par 35 stacijām, kurām bija dati par šo gadu.

[28] Iepriekš minētajā novērtējumā tomēr nav iekļauti apgabali, kuros nav novēroti stacijas. Tā kā šajos apgabalos nav novērotu datu, salīdzināšanai izmantojām citu datu kopu. Parameter-elevation Regressions on Independent Slopes Model (PRISM) is an expert system to produce gridded precipitation data on the basis of point data and DEMs [ Daly et al., 1994 , 2002 ]. It has been used successfully to generate precipitation climatology maps for various regions in the United States (http://www.ocs.orst.edu/prism/prism_new.html). A spatial data set of the long-term precipitation norm (1961–1990) was developed using the PRISM system at a 4-km resolution [ Daly et al., 2000 ], on the basis of observations at over 2500 stations across China. The monthly PRISM data were summarized by the 50-km buffers at the 1° × 1° grids and then compared with the long-term means (1987–1999) of the original SSM/I and the modeled precipitation estimates (calculated using the long-term SSM/I means) for the months of January, April, July, and October. Figure 11 shows that the PRISM precipitation for July had a similar spatial pattern to the modeled estimates of July 1999, but with greater details because of a higher spatial resolution. Regression analysis, based on 327 grid points within the approximate range of the Tibetan Plateau, revealed that for these months examined, the modeled precipitation estimates had higher R 2 values when regressed against the PRISM data than the original SSM/I estimates (Table 7), and with lower RMSE values except for January. Both original SSM/I and modeled precipitation estimates were significantly lower than the PRISM July precipitation at a few grid points, which resulted in lower than expected R 2 values. Had the largest 4 outliers been excluded, the R 2 values would have increased to 0.5696 and 0.6545 for the original SSM/I and modeled precipitation estimates and the RMSE lowered to 61.57 and 46.83, respectively.

Original SSM/I Modeled SSM/I
R 2 Standarta kļūda RMSE R 2 Standarta kļūda RMSE
Janvāris 0.171 6.69 7.48 0.216 6.50 9.64
Aprīlis 0.519 27.66 32.10 0.620 24.55 25.18
Jūlijs 0.358 90.86 102.25 0.448 84.20 89.46
Oktobris 0.396 23.35 30.13 0.671 17.22 17.45
  • a Results of regression (R 2 and standard error of estimates) and root-mean-square errors (RMSE) are presented. The comparison was based on 327 1° × 1° grid points within the approximate range of the Tibetan Plateau.

Ievads

Foot-and-mouth disease (FMD) is a highly infectious viral disease that affects cloven-hoofed animals and has the potential to cause significant economic impact. Rapid disease detection and implementation of control measures to limit geographic spread are high priorities during an outbreak (James and Rushton, 2002 Thompson et al., 2002 Haydon et al., 2004). The effectiveness of control measures can be influenced by characteristics of the virus, geography, livestock density and farm management, and environment in the area of introduction. FMD transmission occurs mainly via droplet nuclei excreted from infectious animals to other animals in close proximity infectious animals can transmit the virus to susceptible animals in as little as 24 h (Alexandersen et al., 2003). The most common FMD transmission routes include direct contact between animals, indirect contact via fomite movement (e.g., vehicles or people), and in some areas, ingestion of infected animal products (Alexandersen et al., 2003). Within a livestock population, different species present different challenges to control FMD. At the individual animal level, cattle are considered most susceptible to airborne FMD spread, as their inhaled dose is likely to be larger than other livestock species due to greater lung capacity (Alexandersen et al., 2003). Ruminants have been shown experimentally to become infected with as little as 10 tissue culture 50% infective doses (TCID50), compared to swine at greater than 10 3 TCID50 (Sørensen et al., 2000 Alexandersen et al., 2003). Although swine have been shown to be relatively resistant to airborne FMD infection, infected swine are an important source of aerosolized FMD virus and are capable of excreting 100 to 1000 times more virus than infected sheep or cattle (Alexandersen and Donaldson, 2002). In the silent spread phase of the 2001 United Kingdom outbreak—prior to imposition of a national ban on livestock movements—FMD spread was attributed mainly to movement of infected livestock, mostly sheep, between premises or through live animal markets before clinical signs were apparent (Gibbens et al., 2001 Haydon et al., 2004). After the national ban on livestock movements, disease response efforts reduced the risk of the most common routes of FMD transmission however, local area spread, which included airborne transmission of the virus, remained difficult to mitigate. In addition to the 2001 UK outbreak (Mikkelsen et al., 2003), airborne spread has been implicated in FMD outbreaks in other countries (Gloster et al., 1982 Daggupaty and Sellers, 1990 Sørensen et al., 2000).

The risk of airborne FMD transmission depends, in part, on the strain or serotype of the virus, topographic factors, the type and number of animals infected (i.e., virus production and concentration), the type and number of animals located downwind from infected animals (i.e., exposures), and weather conditions influencing viral decay (Donaldson, 1972 Cannon and Garner, 1999 Sørensen et al., 2000 Donaldson and Alexandersen, 2002 Alexandersen et al., 2003 Mikkelsen et al., 2003 Colenutt et al., 2016 Van Leuken et al., 2016). Under ideal weather conditions, airborne FMD transmission can occur over short or long range distances (Donaldson et al., 1982 Gloster et al., 2005), and virus has been previously shown to infect susceptible livestock located as far as 250 km downwind from infected premises under suitable weather conditions (Gloster et al., 1982 Sørensen et al., 2000). Aerosolized FMD virus can be dispersed beyond quarantine zones established around detected, infected premises as part of a control program (Donaldson and Alexandersen, 2002).

The U.S. Department of Agriculture’s Foot-and-Mouth Disease Response Plan mandates a minimum Control Area of at least 10 km beyond the perimeter of the closest infected premises following FMD detection (USDA-APHIS, 2014). However, the FMD Response Plan is designed to have the flexibility to adapt the response to outbreak characteristics including evidence of or circumstances favorable to airborne transmission. The United States covers a large, and diverse, geography with widely varying climatic conditions. An enhanced understanding of how weather conditions in the area of infection affect the risk of airborne transmission would allow response officials to consider actual, local weather conditions present during an outbreak while making decisions on control strategies, including Control Area size.

Based on a combination of experimental and observational studies, aerosolized FMD is only viable under certain weather conditions. Experimental data suggest FMD virus infectivity is maximized at relative humidity levels greater than 60% (no known upper bound) and drastically reduced below 55% (Donaldson, 1972). Based on previous FMD outbreaks in which airborne spread was implicated, FMD virus can survive in the environment at temperatures as high as 27 °C (Gloster et al., 1982 Mikkelsen et al., 2003). The exact temperature range for which FMD virus is destabilized is unclear however, and there is no known minimum temperature at which FMD virus inactivation occurs (Donaldson, 1972). Presence of cloud cover, absence of precipitation, stable wind direction, and low to moderate wind speeds are thought to maintain aerosolized FMD virus stability, increasing the possibility of airborne transmission between premises (Hugh-Jones and Wright, 1970 Gloster et al., 1981 Sørensen et al., 2000 Gibbens et al., 2001 Sørensen et al., 2001 Mikkelsen et al., 2003 Gloster et al., 2005).

In the United States, there has been limited research to estimate the risk of airborne FMD spread. The objective of this analysis was to identify seasonal and geographic differences in patterns of environmental conditions favorable to airborne FMD spread in the United States.


TECHNOLOGY

APOGEO Are you building all of your own hardware?

Our founders and partners—Moog, Moog Broad Reach, and Millennium Engineering and Integration Company—are industry leaders in designing, build- ing and operating space sensors, systems and missions, with combined experience of more than 70 years.

Moog is a highly experienced provider of spacecraft systems for both government and commercial customers, with annual revenues of $2.6 billion. For more than 40 years, the international space industry has relied on Moog products for commercial, military and civil/scientific satellite and applications. Moog Broad Reach, founded in 1997 as Broad Reach Engineering and acquired in 2013 by Moog, has a long heritage in mission design and development of instruments and flight systems. Moog Broad Reach specializes in space avionics, systems and software, and built the gold standard for radio occultation sensors currently on orbit.

Millennium Engineering and Integration Company (MEI) is an employee-owned small business and a premier space systems engineering company, with annual revenues of $90 million. MEI has more than 15 years of experience as a leading provider of space systems engineering, satellite integration and testing, and launch and on-orbit operations for NASA, the U.S. Air Force and the Missile Defense Agency.

APOGEO How will you get your satellites into orbit?

Our current plan is to launch the first four satellites as a secondary payload by the end of 2016, with the next eight satellites going up on a dedicated launch vehicle by the end of 2017. However, we will continue to look at any opportunities that could get us to orbit and start delivering data sooner.


2 Atbildes 2

The problem with your maps is not the interpolation method you're using, but the way ggplot displays density lines. Here's an answer to this: Remove gaps in a stat_density2d ggplot chart without modifying XY limits.

The density lines go beyond the map, so any polygon that goes outside the plot area is rendered inappropriately (ggplot will close the polygon using the next point of the correspondent level). This does not show up much on your first map because the interpolation resolution is low.

The trick proposed by Andrew is to first expand the plot area, so that the density lines are rendered correctly, then cut off the display area to hide the extra space. Since I tested his solution with your first example, here's the code:

The only differences is that I used min()- / max() + instead of fixed numbers and coord_equal to ensure the map wasn't distorted. In addition, I manually specified a greater number of levels (using bin ), since by increasing the plot area, stat_density automatically chooses a lower resolution.


Materials and Methods

Geographic Interpolation of Endemism (GIE)

We propose the use of a kernel interpolation function, a method commonly used in Geographic Information Systems (GIS) analysis and implemented in several GIS software, to delimit areas of endemism. This interpolation method is based on the definition of circular areas of influence around point occurrences of a phenomenon. Within the area of influence, which is usually defined by the user, the influence of the phenomenon decreases from the point to the limits according to a Gaussian function [19]. For instance, in an epidemiological study of Rabies in China, the area of influence around each infected subject reported was defined as the range of subject´s movement, reflecting transmission probability [20]. The kernel density function estimates the density of occurrence of the phenomenon based on the overlap of the areas of influence [19]. Thus, the results are summarized on a map, expressed as a surface that indicates estimated values of point density. In the method proposed here, the distributional overlap between species is estimated through the distance between centroids of each species distribution range. This method can be applied for identifying areas of endemism through the following sequence of procedures:

  1. Given a set of occurrence points, the centroid of the distribution of each species is estimated through the arithmetic mean of the latitude and longitude of its points (Fig. 1a).
  2. The distance between the centroid and its farthest point of occurrence is measured for each species (Fig. 1b), and this value is used to sort the species into categories of range size (Fig. 1c). The definition of these categories is necessary to define the area of influence of the centroid, as described below, which is a requirement for the kernel index estimation [19].
  3. For each category a value of a radius around the centroid is defined, in order to delimit a circular area of influence of each species range (Fig. 1d). This value can be established through the maximum value of distance between the centroid and the farthest point of each category. For example, in this study all species with up to 100 km of distance between the centroid and the farthest point were grouped in the same category, and this value was defined as the radius around the centroid of all species in the category. The area of influence of each species is a generalization of its distribution range, and thus it must be defined as realistically as possible. Grouping species with differently sized distribution ranges (e.g., species with up to 50 km together with those up to 200 km of maximum distance between the centroid and its farthest point) could result in the overestimation of the range of the more restricted species.
  4. For each category, the overlap between the areas of influence of the species (Fig. 1d) is estimated by the kernel algorithm. The area of influence of each species is expressed as a value that decreases from the centroid to the limits of the circular area according to a Gaussian function (Fig. 1e). The overlap between the areas of influence is estimated through the sum of the values of the overlapping portion, resulting in the kernel index (k). Consequently, the kernel index varies spatially according to the sum of the values of each area of influence, generating a series of overlapped Gaussian curves (Fig. 1e, f). These curves are rasterized, generating a map of density of overlap of areas of influence of species (Fig. 1f), and the kernel index is an indicator of the degree of species distribution overlap.
  5. The results of steps 3 and 4 can be expressed separately for each category or assembled in a consensus map of areas of endemism (Fig. 2). The spatial variation of the kernel index can be displayed with color hues or with isolines (level curves) representing equal values of the index (Fig. 2). The latter option is useful to show the hierarchy between areas of endemism.

a: a centroid is estimated for the points of occurrence of each species. b: For each species, the distance between the centroid and its farthest point is measured. c: species are organized in groups, according to the distance measured in step b. d: This distance is used to define a circular area of influence around each species centroid. This procedure makes it possible to quantify the overlap between areas of distribution among species. e: The degree of overlap between species areas of influence is measured according to a Gaussian function around each species centroid. f: The density of species on each area of overlap, weighted by the degree of overlapping, is converted into interpolated curves using the kernel interpolation function (at left). These curves can be rasterized for display on maps.

Shaded areas indicate the areas of endemism, dashed lines indicate the major areas of endemism delimited according to the kernel index. The insert shows the Brazilian biomes, discussed in the text.

To perform these procedures, a software that calculates the area of influence of each species, as well as an ArcGIS toolbox to implement the method described above, are available in the S1 File in Supporting Information.

Applying GIE to Brazilian spiders

We applied the method described above to delimit areas of endemism of spiders in Brazil using a database of all published distribution records of species described between 1767 and 2013 and two online databases: GBIF [21] and speciesLink [22]. The database includes 3,425 species distributed in 25,072 records (meaning at least one individual of a species collected) and 3,787 localities. About 40% of the species were represented only by single records, 45% had between 2 and 15 records, 10% had between 16 and 60 records and only 2% of the species showed more than 100 records (S1 Fig.). All coordinates reported in the literature and online databases were checked using the ArcGIS software and vector layers of the political boundaries of Brazil to determine whether they actually fit the municipalities and states mentioned in the original data. Of these, 59% of the records were in the correct coordinates. The records that presented incorrect coordinates were georeferenced, as well as records that had no coordinates originally reported. The georeferencing was based on gazetteers and online databases, and 32% of the records were georeferenced in specific localities and only 8% were georeferenced by the location of the municipality. The species taxonomy follows Platnick [23], and species considered nomina dubia were excluded from the analyses. These same records and species were used in the comparative analysis with PAE and NDM. For analysis through GIE the species were classified in nine groups, according to the distance between the centroid and the farthest point: up to 50 km, 51–200 km, 201–400 km, 401–600 km, 601–800 km, 801–1,000 km, 1,001–1,500 km, 1,501–2,000 km and between 2,001 and 3,299 km. Since the definition of these classes can affect the number and location of the areas of endemism, we repeated the analysis with two other categorization schemes: a more inclusive classification with five categories (up to 50 km, 51–400 km, 401–600 km, 601–800 km, 801–3,299 km) and other less inclusive, with 18 categories (up to 25 km, 26–50 km, 51–100 km, 101–200 km, 201–300 km, 301–400 km, 401–500 km, 501–600 km, 601–700 km, 701–800 km, 801–900 km, 901–1,000 km, 1,001–1,300 km, 1,301–1,600 km, 1,601–1,750 km, 1,751–2,000 km, 2,001–2,500 km, 2,501–3,299 km). To compare results, we used Pearson correlation. To generate the consensus map of areas of endemism, the values of the kernel index of each category were standardized between 0 and 1 before assembling the maps. The number of records of a species can affect the position of its distributional centroid, consequently influencing the estimate of the overlap between species in GIE. We estimated this effect through a rarefaction procedure, in which we randomly removed 10, 20 and 30% of the occurrence points and measured the mean deviation of the centroids of the species in 100 randomizations.

The analysis with PAE was based on a presence/absence matrix of spider species over a grid with 168 2×2° cells, completely covering the Brazilian territory (S2 File). As the size of the grid cells can influence the results, we tested several cell sizes (0.5° to 5°) and used the size that allowed the identification of more areas of endemism. The matrix was analyzed through the software TNT [24], based on twenty trees generated by random-addition sequences, followed by TBR Branch Swapping, retaining 20 trees per replicate. The shortest trees obtained were submitted to an additional round of TBR to assure global optimum was found. The trees obtained were rooted in a hypothetical cell with all taxa absent. The areas of endemism were delimited from clades unambiguously supported by at least one non-homoplastic species occurrence, identified in the strict consensus tree.

The same database was analyzed by NDM using the program VNDM [25] (matrix in S3 File), with 2×2° cells. Search factors were set to retain areas with scores equal or above one and presenting one or more endemic species. The search was repeated 100 times, keeping overlapping areas only if 90% of the species in each area are unique. We did not use any parameters to assume the presence of the species in places where they have not been recorded. The results were summarized through the procedure “consensus flexible areas of endemism”, gathering areas that share at least 40% of their endemic species (for more details see [26]).

The results obtained in GIE were compared to results from PAE and NDM through the number of synendemic species (endemic species occurring together in a given area) that supported areas of endemism spatially congruent between methods. In these cases, we consider that areas identified with the highest number of endemic species should indicate a better fit between the boundaries of the area of endemism and the distribution of its species. We also compared the number of areas identified and visually evaluated the overlap between areas generated by each method. Both NDM and GIE show indexes to quantify the support of each area of endemism, so we analyzed the correlation between the score of the areas obtained through these methods using Pearson correlation analysis in Past 1.95 [27]. This analysis was based on values from grid cells of NDM, so the same grid was overlapped to GIE consensus map and 10 random points were used to estimate the average value of the kernel index for each cell.


Present address: Present address: Max Planck Institute for Developmental Biology, Tübingen 72076, Germany.,

Piederības

Department of Zoology and Physiology, University of Wyoming, Laramie, 82071, Wyoming, USA

Department of Biology, Box 351800, University of Washington, Seattle, 98195, Washington, USA

George Wang & Raymond B. Huey

You can also search for this author in PubMed Google Scholar

You can also search for this author in PubMed Google Scholar

You can also search for this author in PubMed Google Scholar

Iemaksas

M.E.D., G.W. and R.B.H. conceived the project, designed the analyses and wrote the paper M.E.D. and G.W. collated weather station data and did temperature and metabolic rate calculations.

Corresponding author