Vairāk

POI datu kopas Ziemeļamerikai

POI datu kopas Ziemeļamerikai


Es izmantoju foursquare, jo tajā ir daudz IP. Kuru datu bāzi jūs izmantojat, ja jums ir nepieciešams interešu punkts Ziemeļamerikā?


Šķiet, ka ASV ir 7 galvenās "IP" datu bāzes, kurās ir liels daudzums API pieejamu IP datu. (Liela daļa no tā tiek iegūta vietnē http://www.quora.com/What-are-the-pros-and-cons-of-each-Places-API)

  • TheWebMiner GEO
  • Yelp
  • CitySearch
  • Facebook
  • Foursquare
  • Google
  • SimpleGeo, Faktiski

Atkarībā no tā, ko meklējat, tie katrs piedāvā dažādas priekšrocības.

TheWebMiner GEO

TheWebMiner GEO ir POI datu bāzu kolekcija. Ģeogrāfiskos datus var lejupielādēt noteiktā rādiusā no punkta, piem. ja vēlaties iegūt datus par visām Amerikas Savienotajām Valstīm, varat atlasīt Kolorādo kā punktu un 2500 jūdzes kā rādiusu, un jūs varat iegūt visus datus par Amerikas Savienotajām Valstīm.

Yelp, CitySearch

Šīs divas ir līdzīgas vietnes: galvenokārt koncentrējas uz pārskatiem, nevis darbojas kā IP datu bāzes. Līdz ar to viņu dati tiek vairāk novirzīti vietām, par kurām lietotāji rakstītu atsauksmes - šajās datu bāzēs neatradīsit “Tuvo Austrumu augšstāva vīriešu istaba”. Tomēr viņiem ir tendence iegūt bagātīgāku informāciju - papildus kategorizēšanai viņiem, protams, ir arī pašas atsauksmes un papildu informācija, piemēram, vērtējumi utt. Daudzos nolūkos šīs atsauksmju vietnes ir labākas vietās, kur tās ir saturu.

Facebook

Facebook vietu API piedāvā veidu, kā integrēt sociālākas vietas. Vietās, kas atrodas Facebook vietās, biežāk būs tādas ziņas kā sienas raksti, attēli utt., Un vietās, kas veic uzņēmējdarbību pakalpojumā Facebook, varat atrast vairāk satura. Tomēr šo vietu kopējā kvalitāte ir zemāka; manā ierobežotajā izlasē ģeogrāfiskā precizitāte parasti ir zemāka nekā Foursquare, un pārklājums ir zemāks, neizmantojot Yelp un CitySearch piedāvātos pārskatus.

FourSquare

FourSquare ir visaptverošākais šo API vietu saraksts. Tajā ir visplašākais vietu saraksts - daļēji tāpēc, ka tajā ir plašāk definēts, kas ir “vieta”. (Skatīt iepriekš.) Vietnes meklēšanai tai ir samērā atvērta API, un reģistrēšanās, padomi utt. Nodrošina saprātīgu metadatu kopumu, bet ierobežotāku nekā iepriekš minētie “izsmalcinātākie” vietu avoti.

Tomēr, tā kā liela daļa šo datu ir ievadīti lietotāja, liela daļa šo datu ir muļķīgi: dublikāti ir dzīves fakts, un jums būs jātiek galā ar nepareizi ievadītiem datiem.

Google

Google vietu API nodrošina ierobežotu informāciju no Google vietņu lapām. Sniegtā informācija ir saprātīga, taču no šīs API ir grūtāk iegūt informāciju, piemēram, saites uz vietām. Tā ir samērā visaptveroša izvēle, taču tās meklēšana nav īpaši plaša, un tā nepiedāvā tādu informāciju kā čeki un tā tālāk, ko piedāvā Foursquare. Kopumā šī API ir saprātīga, taču ar mazāku pārklājumu nekā Foursquare un (izmantojot API) mazāku dziļumu nekā citi, tā nepiedāvā daudz vairāk nekā Foursquare vai pārējie nevienā no virzieniem.

SimpleGeo, Faktiski

Šos neesmu skatījies. Tomēr tie ir “atvērti” dati, atšķirībā no visiem pārējiem, kas, iespējams, ir ieguvums dažiem lietošanas gadījumiem.

Kopumā tas, kas ir “labākais”, iespējams, ir pilnībā atkarīgs no tā, ko jūs darāt; tie visi piedāvā dažādus punktu komplektus, dažādu dziļumu utt. Foursquare, iespējams, ir ieguvējs pēc platuma; Yelp (apgabalos, uz kuriem tas attiecas) ir lielāks ieguvējs dziļumā; Google dažos veidos iekļaujas starp tiem.

Es atzīmēšu, ka tas viss ir anekdotisks; Google pretendē uz 50 miljoniem vietu, bet Foursquare vairāk par 15 miljoniem, tāpēc var būt būtiska atšķirība faktiskajā Google vietu skaitā ... tomēr vismaz lielākoties pilsētu teritorijās, kuras esmu apskatījis šķiet, ka Foursquare ir visaptverošāks. (Tā kā Foursquare datus lielākoties ir iesnieguši lietotāji, ir lietderīgi labāk aptvert pilsētas teritorijas, tāpēc mani novērojumi var neatbilst nevienam konkrētam lietošanas gadījumam.)


Skatiet vietni https://simplegeo.com/products/places/. Tas ir jauns blokā, bet ir saņēmis labu presi.


Es parasti izmantoju POI plaza, tajā ir laba POI datu bāze.

http://poiplaza.com/?p=co


Pērciet datplūsmas datus

Satiksmes dati norāda uz transportlīdzekļu satiksmes apjomu, plūsmu, ātrumu un klasifikāciju uz ceļiem noteiktā teritorijā. To nedrīkst jaukt ar tīmekļa trafika datiem vai pēdas datplūsmas datiem - šīs datu kopas sniedz informāciju par interneta lietotājiem un gājējiem uz ielas, nevis par automašīnām un transportlīdzekļiem!

Satiksmes dati parasti attiecas uz satiksmi, ko mēs redzam uz ceļiem ap mums, un tāpēc tos dažreiz izmanto savstarpēji aizstājot ar “ceļu satiksmes datiem”. Tomēr satiksmes datiem ir daudz apakškategoriju - dzelzceļa satiksme, kravu satiksme un jūras satiksme - tas viss stāsta par transportlīdzekļu plūsmu noteiktās vietās un nozarēs. Bet šajā rokasgrāmatā, kad mēs atsaucamies uz “satiksmes datiem”, mēs runājam par datiem, kas uzskaita un mēra parastos ceļos atrastos automobiļus un sabiedrisko transportu.

Satiksmes datu analīze kļūst arvien svarīgāka, jo mūsu pilsētas kļūst arvien pārslogotākas. Organizācijas un vietējās iestādes, kas atbildīgas par pilsētplānošanu un ātruma ierobežojumu noteikšanu, paļaujas uz satiksmes datu kopām, lai saprastu, kā transportlīdzekļi ceļo un kur tās visbiežāk apmeklē. Tiešās satiksmes datu plūsmas ļauj šīm organizācijām reālā laikā analizēt satiksmes datus, sniedzot tām visprecīzāko izpratni par ceļiem šodien. Reālā laika datplūsmas datus bieži salīdzina ar vēsturiskajiem datplūsmas datiem, lai noteiktu vēsturiskos satiksmes modeļus un izmaiņas laika gaitā. Tādā veidā organizācijas var izmantot šo kombinēto trafika datu kopu trafika prognozēšanai.

Bet publiskās satiksmes datus izmanto ne tikai valdības un infrastruktūras organizācijas. Faktiski arvien vairāk mazumtirgotāju un uzņēmumu vēršas pie satiksmes datu vākšanas uzņēmumiem, lai uzlabotu savu darbību un pieņemtu uz datiem balstītus lēmumus. Apskatīsim tuvāk dažādas ceļu satiksmes datu lietojumprogrammas.

Kas izmanto datplūsmas datus un kādos gadījumos?

Datplūsmas datu sniedzēji ļauj uzņēmumiem un organizācijām no dažādām nozarēm uzlabot lēmumu pieņemšanu un plānošanu. Šeit ir tikai daži lietotāji un lietošanas gadījumi, kas saistīti ar transportlīdzekļa satiksmes datiem:

Mazumtirgotāji - Datplūsmas datu vākšanai un analīzei ir vairākas priekšrocības uzņēmumiem un mazumtirgotājiem. Datplūsmas skaita dati tiek izmantoti mazumtirdzniecības vietņu izvēlei, jo mazumtirgotāju mērķis ir izvietot savus veikalus vietās, kuras cilvēki bieži apmeklē un uz kurām ir viegli ceļot. Liels satiksmes skaits norāda, ka attiecīgais ceļš vai atrašanās vieta ir populāra. Tādējādi mazumtirgotājs var izmantot datplūsmas skaitīšanas pakalpojumu sniedzēju informāciju kopā ar uzņēmuma iekšējiem rādītājiem, lai lemtu par mazumtirdzniecības veikala vietni. Izmantojot datu sniedzēja datplūsmas datu analīzes programmatūru, uzņēmumi var pieņemt vislabākos lēmumus par vietni: tikai tāpēc, ka apgabala datplūsmas skaits ir augsts, tas ne vienmēr norāda, ka tā ir laba vieta veikala atvēršanai. Daļa no uzņēmuma datplūsmas datu analīzes izlemj, vai liels datplūsmas skaits nozīmē, ka veikals piesaistīs vairāk klientu vai sastapsies ar lielāku konkurenci.

Tūrisms un viesmīlība - Satiksmes prognozēšanas datu kopa ļauj tūrisma un viesmīlības nozares uzņēmumiem saprātīgi plānot savu loģistiku. Dati par satiksmes intensitāti un satiksmes plūsmas dati var parādīt šos uzņēmumus, kad satiksme visvairāk koncentrējas uz ceļiem. Izmantojot satiksmes plūsmas API, tūrisms un slimnīcas var sagatavot savu produktu krājumus un darbaspēku aizņemtiem periodiem, kā arī paredzēt piegādes ķēdes pārtraukumus.

Tirgotāji - Mārketinga speciālisti bieži sadarbojas ar datplūsmas datu analīzes uzņēmumiem, lai noteiktu atrašanās vietu un veiktu DOOH mārketingu. Tirgotāji var izvēlēties, kad rādīt reklāmas ceļmalas digitālajos stendos un displejos, pamatojoties uz reāllaika satiksmes analīzi. Izmantojot tiešsaistes datplūsmas API, lai programmatiski rādītu reklāmas, tirgotāji var rādīt reklāmas, kuras redz pēc iespējas vairāk autovadītāju. Tradicionālāk ceļu satiksmes datu kopa palīdzēs tirgotājiem izlemt, kur izvietot OOH reklāmas. Nav jēgas ieguldīt naudu dārgā reklāmas stendu kampaņā, ja jūsu datplūsmas datu bāze rāda, ka jūsu izvēlētajā apgabalā reti ir transportlīdzekļi!

Vietējās iestādes un valdības - Vietējās iestādes un valdības daudzos gadījumos izmanto datplūsmas datu kopas. Plānojot jaunu ceļu, reģionālās varas iestādes analizē vēsturiskās satiksmes negadījumu datu kopas, lai noteiktu bīstami noslogotas vietas. Tāpat daudzas vietējās autoritātes izmanto arī satiksmes negadījumu API, lai sadursmju pieauguma gadījumā tās varētu pielāgot likumīgo ātruma ierobežojumu. Plašāk valdības un vietējās iestādes izmanto satiksmes plūsmas datu kopas, lai ieviestu maksas par sastrēgumiem visnoslogotākajās pilsētās kā daļu no zaļajām iniciatīvām. Pilsētu plānošanai ir svarīgi, lai vietējām varas iestādēm un valdībām būtu kvalitatīvi satiksmes dati, lai tās varētu uzstādīt tādas ērtības kā degvielas uzpildes stacijas un regulāri uzturēt ceļu. Uz automaģistrālēm tās var ieviest sastrēgumu pārvaldības sistēmas, piemēram, dažādu joslu pieejamību.

Viedā infrastruktūra - Satiksmes datu programmatūra tiek izmantota arvien novatoriskāk. AI un Deep Learning tiek izmantoti satiksmes datu vākšanai, kā arī sarežģītai pilsētplānošanai. Piemēram, daudzas pilsētas izmēģina projektus, kuros tiek izmantoti bezvadu sakaru sensori un viedie materiāli un enerģija, lai radītu viedus ceļus, kas ražo elektrību no garām braucošas satiksmes. Iegūtā elektroenerģija tiek uzglabāta ceļmalas baterijās un tiek izmantota ielu lampu, ceļa zīmju vai gaisa piesārņojuma monitoru darbināšanai, kā arī sensoriem, kas nosaka, kad veidojas bedres. Viedie ceļi var arī uzraudzīt transportlīdzekļa ātrumu, padarot satiksmes ātruma datu vākšanu efektīvāku un uzticamāku. Viedie ceļi var pat atpazīt vadītā transportlīdzekļa tipu, parādot, ka satiksmes datu vākšanas metodes ar katru dienu kļūst arvien jaudīgākas.

Jauns transports - Izmantojot satiksmes datu sniedzēju, uzņēmumi un valdības var pamanīt transporta jauninājumu un uzlabojumu iespējas. Piemēram, Bergenā, Norvēģijā, ir izstrādāta pasaulē pirmā autonomā vieglā dzelzceļa sistēma. Tas samazinās izmaksas, jo nav jāmaksā autovadītājam. Tas var arī uzlabot punktualitāti un uzticamību un palielināt klientu apmierinātību. Uzņēmumi, kas sniedz satiksmes datu pakalpojumus, padarīja šo iespēju iespējamu: satiksmes datu analīze parādīja, ka vieglā dzelzceļa sistēma būtu komerciāli veiksmīga.

Pārvadājumi - Lielākā daļa pārvadājumu uzņēmumu uzskata satiksmes datu API par būtisku transporta un loģistikas pārvaldības daļu. Satiksmes reālā laika analīze ļauj autovadītājiem efektīvi plānot savus braucienus un maršrutus. Pārvadājumu uzņēmumi paļaujas uz reāllaika satiksmes datiem, lai nodrošinātu, ka transportlīdzekļu parks pārvietojas pēc iespējas drošāk un efektīvāk.

Neatliekamās palīdzības dienesti - Satiksmes datu sistēmas ir neatliekamas reaģēšanas komandas neatņemama sastāvdaļa. Lai nodrošinātu, ka ātrās palīdzības automašīnas, policijas automašīnas un ugunsdzēsēju mašīnas sasniedz savu galamērķi pēc iespējas ātrāk, neatliekamās palīdzības dienesti izmanto satiksmes sastrēgumu datu kopu, lai noteiktu, no kuriem maršrutiem izvairīties. Ielu satiksmes dati ir ārkārtīgi noderīgi arī avārijas dienestu loģistikas komandām. Ja iespējams, viņi centīsies novirzīt operatīvos transportlīdzekļus prom no dzīvojamām ielām vai teritorijām, kurās ir daudz gājēju. Izmantojot tiešās satiksmes API, transportlīdzekļi var izvairīties no šiem maršrutiem un pēc iespējas ātrāk ceļot.

Kādi ir tipiskie datplūsmas datu atribūti?

Satiksmes datu mākonis veido daudz datu punktu. Pērkot datplūsmas datu kopu vai datu API no datplūsmas datu nodrošinātāja, tam parasti ir virkne atribūtu. Tie var ietvert

Datplūsmas skaitīšanas dati - Satiksmes uzskaites uzņēmumi virs vai blakus ceļiem uzstāda sensorus un kameras, kas uzrauga, cik transportlīdzekļu noteiktā laika posmā iet garām.

Datplūsmas plūsmas dati - Izpratne par satiksmes plūsmas mērīšanu var būt sarežģīta. Par laimi, reāllaika satiksmes datu API uzreiz parāda, cik regulāra ir satiksmes plūsma uz ceļa un vai tā laika gaitā mainās.

Satiksmes ātruma dati - Satiksmes datu sniedzēji vāc reālā laika satiksmes ātruma datus, izmantojot GPS vai melno kasti, vai izveidojot satiksmes ātruma datu kopu, izmantojot kameras un sensorus ap ceļu.

Dati par satiksmes sastrēgumiem - Satiksmes sastrēgumu datu kopa atklāj, kad uz konkrēta ceļa ir pārāk liela satiksme, kas nozīmē, ka transportlīdzekļi nevar regulāri plūst. Rindas novērtējums ir saistīts arī ar sastrēgumiem.

Dati par satiksmes negadījumiem - Satiksmes datu sniedzēji piedāvā vēsturiskus satiksmes datus par incidentiem, kas notikuši uz ceļa pagātnē, kā arī reālos satiksmes datus, kas ziņo par incidentiem, tiklīdz tie notiek.

Transportlīdzekļu klasifikācijas dati - Transportlīdzekļu klasifikācija organizē dažādus transportlīdzekļus, kas veido satiksmes plūsmu dažādās grupās. Piemēram, automašīnas, autobusi, taksometri, motocikli, velosipēdi, mikroautobusi un kravas automašīnas ir dažādu kategoriju transportlīdzekļi.

Kā tiek apkopoti satiksmes dati?

Visā pasaulē ir neskaitāmas datplūsmas datu vākšanas ierīces. Daži no tiem ir reāllaika trafika datu avoti, citi-komunālās procedūras. Trafika datu uzņēmumi parasti izmanto virkni savākšanas metožu, lai nodrošinātu precizitāti.

Manuālā skaitīšana mēra satiksmes plūsmu un kavēšanos, izmantojot vadītāju aptaujas. Tāpat kā autostāvvietu apsekojumi, manuālā savākšana var identificēt vadītāja sāpju punktus, lai vietējās iestādes varētu apmierināt ceļu plānošanas un stāvvietu prasības. Gājēju aptaujas mēra gājēju plūsmu krustojumos. Līdztekus transportlīdzekļu satiksmes analīzei šos apsekojumus var izmantot, lai ieteiktu uzlabojumus drošai kājāmgājēju kustībai.

Kameras tiek izmantotas numura zīmju atpazīšanai, taču tās tiek izmantotas arī, lai apkopotu datus par satiksmes ātrumu un ieskatu transportlīdzekļa klasifikācijā. Pēc tam šos datus var piegādāt, izmantojot vēsturiskās datplūsmas datu API.

Datplūsmas skaitīšanas datus var iegūt, izmantojot Bluetooth sensorus. Šie sensori ir savienoti ar skaitītāju, un datus var iegūt līdz sešu metru attālumā no skaitītāja. Šos datus var automātiski lejupielādēt, izmantojot GSM/4G pārraidi katru dienu. Skaitīšanas dati tiek automātiski saglabāti datplūsmas datu nodrošinātāja programmatūrā, kur tie ir pieejami analīzei. Reāllaika skaitīšanas datiem var piekļūt arī, izmantojot Ethernet/IP savienojumu.

GPS, satelīta un mobilie signāli var apkopot datus par satiksmes apjomu. GPS analītika tiek izmantota, lai uzraudzītu sastrēgumus un satiksmes plūsmu, kā arī izcelsmes un galamērķa analīzi.

Tīmekļa nokasīšanas rīki un AI sistēmas var uzraudzīt sociālo mediju noskaņojumu un noteikt, kad tiek augšupielādēts liels skaits ziņu par trafiku. Atslēgvārdi, piemēram, “satiksme”, “aizņemts” un “incidents”, var būt pirmais satiksmes plūsmas traucējumu rādītājs. Reāllaika satiksmes datu API nodrošina šo informāciju visu diennakti.

Kas ir labākie datplūsmas datu nodrošinātāji?

Vadošie satiksmes datu nodrošinātāji un datplūsmas datu uzņēmumi ir INRIX, Waze, Uber Movement, OpenStreetMap un Mapbox.

Kā novērtēt satiksmes datu kvalitāti?

Augstas kvalitātes datplūsmas dati ir būtiski, lai veiktu labāko satiksmes analīzi. Tikai konsekventi, atjaunināti un bagātināti satiksmes datu pakalpojumi sniegs jums precīzu informāciju par satiksmi. Lai novērtētu datplūsmas datu kvalitāti, pircēji var veikt tālāk norādītās darbības.

  • Pirkšana no cienījama avota ar lieliskām atsauksmēm ir viens no veidiem, kā nodrošināt kvalitāti.
  • Būtu jāizmanto arī regulāras pārbaudes ar savām kļūdu noteikšanas sistēmām.
  • Regulāra pārbaude un novērtēšana ir labākais veids, kā nodrošināt satiksmes datu kvalitāti. Šīs pārbaudes var iestatīt automātiskai darbībai.

Kā parasti tiek aprēķināti datplūsmas dati?

Datplūsmas datu cenas ir atkarīgas no daudziem mainīgajiem. Datplūsmas datu vākšanas pakalpojumiem parasti ir vairāki cenu modeļi datu pircējiem. Cenas būs atkarīgas no tā, kādam nolūkam tiks izmantoti trafika dati, cik cilvēku jūsu uzņēmumā ir nepieciešama piekļuve datplūsmas datiem, un no ģeogrāfiskajiem apgabaliem, kas nepieciešami satiksmes datu analīzei.

Kādas ir biežākās problēmas, pērkot datplūsmas datus?

Kopējās problēmas ietver satiksmes datu atjaunināšanu. Pērkot reāllaika datplūsmas datu API, šī problēma tiek novērsta.

Ir arī jāpārliecinās, ka savāktie satiksmes dati atbilst jūsu uzņēmuma vajadzībām. Tas nozīmē neapstrādātu satiksmes datu un satiksmes datu paraugu analīzi. Šeit jūs varat paziņot savas prasības satiksmes datu piegādātājam un iegūt datplūsmas datus, kas atbilst jūsu uzņēmuma vajadzībām. Noderīgas informācijas iegūšana no šiem datu paraugiem var būt sarežģīts process. Izmēģinājumi un kļūdas ar dažādiem jautājumiem ir labākais veids, kā iegūt noderīgus rezultātus.

Uzņēmumiem ir jānodrošina, lai datplūsmas dati tiktu regulāri pārbaudīti, lai noteiktu precizitāti un samazinātu kļūdas. Vienmēr pārbaudiet, vai jūsu datplūsmas datu sniedzējam ir kvalitātes sertifikāti un kļūdu samazināšanas procedūras.

Ko jautāt satiksmes datu sniedzējiem?

  • Cik bieži tiek atjaunināta datplūsmas datu kopa? Vēsturisks vai reāllaika?
  • Vai datplūsmas datu analīzes sistēma izmanto mašīnmācīšanās metodes, lai laika gaitā uzlabotu veiktspēju?
  • Vai datplūsmas datu sistēma tiks integrēta ar manām esošajām biznesa tehnoloģijām?

Kas ir labākie datplūsmas datu nodrošinātāji?

Jums piemērotā datplūsmas datu sniedzēja atrašana patiešām ir atkarīga no jūsu unikālā lietošanas gadījuma un datu prasībām, ieskaitot budžetu un ģeogrāfisko pārklājumu. Populārie satiksmes datu nodrošinātāji, no kuriem jūs varētu vēlēties iegādāties datplūsmas datus, ir Automaton AI, MBI ģeodati, DDS digitālie datu pakalpojumi, Matrixian Group un FreightWaves.

Kur var iegādāties datplūsmas datus?

Kā es varu iegūt datplūsmas datus?

Datplūsmas datus varat iegūt, izmantojot dažādas piegādes metodes - pareizā izvēle ir atkarīga no jūsu lietošanas gadījuma. Piemēram, vēsturiskie datplūsmas dati parasti ir pieejami lielapjoma lejupielādei un tiek piegādāti, izmantojot S3 kausu. No otras puses, ja jūsu lietošanas gadījums ir kritisks laika ziņā, varat iegādāties reāllaika datplūsmas datu API, plūsmas un straumes, lai lejupielādētu visjaunāko informāciju.

Kādi datu tipi ir līdzīgi datplūsmas datiem?

Satiksmes dati ir līdzīgi aviācijas datiem, kravas autoparka datiem, kravas datiem, ceļu datiem un tirdzniecības datiem. Šīs datu kategorijas parasti izmanto satiksmes analīzei un datplūsmas datu analīzei.


Tālāk sniegtā statistika ir balstīta uz 2021. gada jūnija izlaidumu Vietām

Valsts IP skaits Atšķirīgi zīmoli % Zīmola IP
CA 639,550 1,190 17.4%
GB 1,311,770 534 8.9%
ASV 6,462,532 5,820 20.6%
Kopsumma 8,413,852 7,544 18.6%

Piezīme. Kopējais dažādu zīmolu nosaukumu skaits tiks palielināts, jo zīmoli tiek vairākkārt uzskaitīti vairākās valstīs.Skatiet zīmola informācijas skaitļus un aizpildīšanas rādītājus, lai iegūtu pašreizējos, unikālos zīmolu nosaukumu rādītājus.

IP skaits laika gaitā mainīsies tādu izmaiņu dēļ kā jaunu datu avotu uzņemšana vai izmaiņas mūsu dublēšanas modelī. Lai iegūtu sīkāku informāciju, skatiet izlaiduma piezīmes.

Mēs izmantojam IP metadatus, lai izsekotu veikalu atvēršanu un slēgšanu, un zemāk ir uzskaitīti zīmoli ar vismaz vienu atvērtu vai aizvērtu IP mēnesī.

Atklāšanas/aizvēršanas datumu secināšana var aizņemt vairāk nekā mēnesi, tāpēc mēs ziņojam par zīmola atvēršanas/aizvēršanas rādītājiem par viena mēneša kavēšanos. Uzziniet vairāk par mūsu kolonnas atvēršanu/aizvēršanu šeit.

Daži IP, piemēram, lidostas vai iepirkšanās centri, aptver mazākus IP to robežās, kur lielākos, tos saturošos POI sauc par "vecākiem", bet mazākos - par "bērniem". Šīs attiecības tiek apzīmētas, iestatot bērna POI parent_placekey vienādu ar vecākā POI vietējo atslēgu. Uzziniet vairāk par mūsu hierarhijas loģiku šeit.

Tālāk esošajā tabulā ir norādīti visu IP un tikai ģeogrāfiskās atrašanās vietas ģeometrijas kolonnu skaits un aizpildīšanas rādītāji. Pārslēdzieties uz cilnēm, lai pārvietotos pa valstīm, un ņemiet vērā, ka ģeometrijas slejas nav paredzētas slēgtiem IP.

Tālāk ir iekļauts zīmola atribūtu absolūtais skaits un to attiecīgie aizpildījuma rādītāji (procentuālā vērtība, kas nav vērtība). Lauku definīcijas skatiet zīmola informācijas shēmā.

Kolonnas nosaukums Absolūtais skaits Aizpildīšanas ātrums
safegraph_brand_id 7,084 100%
zīmola nosaukums 7,084 100%
naics_code 7,084 100%
top_category 7,084 100%
apakškategorija 7,084 100%
parent_safegraph_brand_id 990 14%

Lai kategorizētu vietu galveno funkciju, SafeGraph izmanto NAICS (North American Industry Classification System) klasifikāciju, kas sastāv no skaitliska NAICS koda, kura garums nepārsniedz 6 ciparus. NAICS kodi ir hierarhiski, un tiem ir saistīti apraksti. Plašāku informāciju skatiet Vietas shēmā.

Tālāk varat filtrēt pēc valsts un NAICS kodiem, lai redzētu populārākos zīmolus, kas mums ir pieejami pašreizējā Vietņu laidienā.

Tālāk esošajā tabulā ir norādīts IP skaits pēc kategorijas visiem IP un tikai atvērtiem IP. Pārslēdzieties uz cilnēm, lai pārvietotos pa valstīm.

Zemāk esošā statistika ietver tikai ASV modeļus, tomēr Kanādas nedēļas modeļi tiks iekļauti pēc 2021. gada maija izlaišanas.

Metriskā Valsts Vērtība (miljoni) % izmaiņas pagājušajā mēnesī
IP ar rakstiem ASV 4.5 0.9%
Kopējais apmeklējumu skaits ASV 1,032.0 6.3%
Kopējais apmeklētāju skaits ASV 35.3 7.5%
Vidējās ikdienas ierīces ASV 15.8 -0.5%

Apmeklējums tiek ieskaitīts, ja mūsu panelī esošā mobilā ierīce noteiktā IP atrodas vismaz 4 minūtes. Uzziniet vairāk par to, kā mēs apstrādājam slēgto IP apmeklējumus un citus īpašus gadījumus.

Apmeklējumu skaitu ietekmē ģeogrāfiskie aizspriedumi mūsu datu kopā un paneļa lieluma izmaiņas laika gaitā. Katrā ikmēneša Patterns piegādē ir iekļauti paneļa pārskata dati, lai varētu normalizēt.

Vidējās ikdienā redzamās ierīces tiek aprēķinātas no kopējām ierīcēm, kas redzamas normalizācijas statistikas failā, kas iekļauts katra mēneša izlaidumā.


Visapkārt ĢIS

Quantarctica ir Antarktikas ģeogrāfisko datu kopu kolekcija, kas darbojas ar bezmaksas atvērtā pirmkoda programmatūru QGIS. Tajā pašlaik ir iekļauti ģeogrāfijas, glacioloģijas un ģeofizikas dati, un tas tiks papildināts ar pētnieku kopienas ieguldījumu.

Pensilvānijas telpisko datu piekļuve un#8211 nacionālā augstuma datu kopa 10 metri 7,5 un#2157,5 minūšu četrstūris Pensilvānijai

ASV Ģeoloģijas dienests ir izstrādājis Nacionālo pacēlumu datu bāzi (NED). NED ir bezšuvju mozaīka no labākajiem pieejamajiem augstuma datiem. 7,5 minūšu augstuma dati par Amerikas Savienotajām Valstīm ir primārie sākotnējie avota dati. Papildus visu 7,5 minūšu datu pieejamībai tika izstrādātas efektīvas apstrādes metodes, lai esošajos datos filtrētu ražošanas artefaktus, pārvērstu par konsekventu atskaites punktu, malu atbilstību, aizpildītu trūkstošo datu šķēles četrstūra šuvēs, pārstrādātu datus konsekventu ģeogrāfisko projekciju un konvertēt visas pacēluma vērtības decimālmetros kā konsekventu mērvienību. NED izšķirtspēja ir viena trešdaļa loka sekundes (aptuveni 10 metri) lielai daļai Amerikas Savienoto Valstu, Havaju salu un Puertoriko NAD83 atskaitē. Aļaskai ir divu loka sekunžu izšķirtspēja, un atskaites punkts ir NAD27.

USGS un#8211 nacionālā augstuma datu kopa (ASV)

Nacionālā augstuma datu kopa (NED) ir USGS primārais augstuma datu produkts un kalpo kā augstuma slānis Nacionālā karte. NED sniedz pamatinformāciju par zemes zinātnes pētījumiem un kartēšanas lietojumprogrammām ASV. Zinātnieki un resursu pārvaldnieki izmanto NED datus globālo pārmaiņu izpētei, hidroloģiskajai modelēšanai, resursu uzraudzībai, kartēšanai, vizualizācijai un daudzām citām lietojumprogrammām. NED tiek pastāvīgi atjaunināts, lai integrētu nesen pieejamos, uzlabotos augstuma avota datus. Visi NED dati ir publiski pieejami.


Aizsargājiet atrašanās vietas privātumu ārpakalpojuma telpiskajiem datiem mākoņa krātuvē.

Plaša atrašanās vietas zinošu ierīču izmantošana veicina dažādu veiksmīgu uz atrašanās vietu balstītu pakalpojumu attīstību [1], un telpiskās informācijas apjoms pēdējo desmit gadu laikā ir pieaudzis ārkārtīgi ātri. Šī milzīgā telpiskā informācija būtu jāuztur un jāapstrādā jaudīgai datu pārvaldības sistēmai, kas pārsniedz mazo uzņēmumu un privātpersonu iespējas. Mākoņdatošana adaptīvi sadala resursus un efektīvi samazina datu īpašnieka manipulācijas un uzturēšanas izdevumus. Tāpēc datu ārpakalpojumi kļūst par dominējošo modeli un ir izpelnījušies plašu akadēmisko aprindu uzmanību [2]. Šādā veidā DO deleģē savu datu pārvaldību trešās puses mākoņu krātuves nodrošinātājam (SP), kas uztur DO datus un atbildes uz autorizētā lietotāja (AU) vaicājumiem. Tomēr, tā kā dati tiek nodoti ārpakalpojumam SP, DO nevar zināt, kur dati tiek glabāti, un tādējādi zaudē tiešu kontroli pār savu datu likteni. Tāpēc ārpakalpojumu telpisko datu atrašanās vietas privātuma aizsardzība ir liels izaicinājums, attīstot telpisko datu ārpakalpojumus un uz atrašanās vietu balstītus pakalpojumus [3].

Telpisko datu ārpakalpojuma modelī AU parasti izdod telpiskos vaicājumus, piemēram, K tuvākā kaimiņa (KNN) vai diapazona vaicājumus, lai veiktu telpiskos vaicājumus, AU ir jādala vaicājuma punkta atrašanās vieta (vaicājuma logs) ar SP [4] . Tomēr ĀS atrašanās vieta ir ļoti sensitīva informācija, kas pēc apdraudējuma var izraisīt dažādus privātuma izpaušanas draudus. Piemēram, ļaunprātīga SP var pārdot komerciāli vērtīgu informāciju DO konkurentiem vai var spekulēt par lietotāju veselības stāvokli, pamatojoties uz lietotāju telpiskajiem vaicājumiem.

Lai saglabātu telpisko datu ārpakalpojumu privātumu, viens vienkāršs risinājums ir tas, ka DO vispirms lokāli izmanto datiem parasto šifrēšanu (piemēram, AES) un pēc tam šifrētos datus iegūst no SP. Tomēr, tiklīdz dati ir šifrēti, tradicionālās vienkāršā teksta vaicājumu metodes kļūst nederīgas, un ĀS nevar veikt vaicājumus vai efektīvi izmantot šifrētos datus. Šis risinājums ir neefektīvs vaicājumiem, kuriem nepieciešama tikai neliela datu daļa. Izmantojot aprēķināmus šifrēšanas paņēmienus [5, 6], tiks ierobežoti telpisko vaicājumu apstrāde. Piemēram, ja ĀS ir jāatrod K tuvākie kaimiņu intereses punkti (POI) vaicājuma punktam q, lai gan ar aprēķināmām šifrēšanas metodēm var aprēķināt šifrētos Eiklida attālumus starp šifrēto punktu q un katru IP, tas nevar sakārtot šos šifrētos attālumus augošā vai Dilstoša secība. Tāpēc šie šifrētie attālumi jānosūta atpakaļ ĀS, kas var tos atšifrēt un atrast labākos K rezultātus. Analizējot procesu, mēs zinām, ka, lai iegūtu pareizu vaicājuma rezultātu, SP ir jāaprēķina šifrētie attālumi un jānosūta tie atpakaļ ĀS, tāpēc SP aprēķināšanas un komunikācijas sarežģītība ir O (n), kur n ir lielums no ārpakalpojumu datu kopas. Tā kā mūsdienās dati eksplodē, šī vienkāršā pieeja šādā gadījumā nav piemērojama. Tikmēr konfidencialitātes informācijas izgūšana (PIR) [7] nodrošina, ka neviena informācija par ĀS vaicājumiem netiks pakļauta neuzticamam SP, tādējādi tā var sasniegt spēcīgu privātuma aizsardzības līmeni. Bet tas radīs milzīgas aprēķinu un sakaru izmaksas un nav piemērots telpisko datu ārpakalpojumiem.

Lai garantētu, ka DO un AU var efektīvi vaicāt šifrētos telpiskos datus, vienlaikus aizsargājot ārpakalpojuma telpisko datu atrašanās vietas privātumu, Hilberta līkne tiek izmantota, lai pārveidotu gan AU, gan IP atrašanās vietas [8–12]. Tomēr standarta Hilberta līkne (SHC) veido POI indeksus, izmantojot tādu pašu detalizāciju telpiskajā jomā. Ja POI ir blīvi izplatīti, tā SHC ģenerētajos indeksos būs daudz indeksa vērtību bez atbilstošiem IP, kurus mēs saucam par nulles vērtību segmentiem, un ļaunprātīgajiem SP ir viegli analizēt un spekulēt par POI sadalījumu pārveidotajā telpā. Tas palielinās ārpakalpojuma telpisko datu atrašanās vietas privātuma izpaušanas risku. Šajā rakstā mēs piedāvājam divas indeksu ģenerēšanas metodes ārpakalpojuma telpiskajiem datiem un kvantitatīvi analizējam šo metožu drošību un efektivitāti. Mūsu galvenie ieguldījumi ir apkopoti šādi

(1) Mēs piedāvājam SHC indeksa modifikācijas metodi ([SHC.sup.*]), Lai uzlabotu tā drošību, bet efektivitātes apsvērumu dēļ tiek piedāvāta arī uz blīvumu balstīta telpas aizpildīšanas līkne (DSC).

(2) Tiek ierosināts rādītājs, lai izmērītu telpiskās transformācijas metožu (piemēram, SHC) privātuma izpaušanas risku, proti, neatšķiramība A. Turklāt šīm telpiskās transformācijas metodēm mēs oficiāli definējam uzbrukuma modeli, šis modelis kvantitatīvi nosaka uzbrucēja pamatzināšanas un izmanto modificētu vispārējo uzbrukuma metodi, lai rekonstruētu sākotnējo telpisko datu kopu.

(3) Reālās pasaules datu kopu novērtējuma rezultāti liecina, ka mūsu telpiskās transformācijas metodes var sasniegt labāku drošību nekā SHC.

Pārējā šī darba daļa ir veidota šādi. 2. sadaļā apskatīti saistītie darbi. 3. sadaļā ir piedāvātas mūsu telpiskās transformācijas metodes. Ceturtajā sadaļā sniegts drošības analīzes neatšķiramības un uzbrukuma modelis. Empīriskais novērtējums ir sniegts 5. iedaļā.

2.1. Telpisko vaicājumu privātuma aizsardzība. Konfidencialitāte ir risināta telpisko vaicājumu kontekstā. Mobilo ierīču lietotāji izsniedz telpiskus vaicājumus (piemēram, diapazona vai KNN vaicājumus), uz kuriem atbild pakalpojumu sniedzējs (piemēram, Google Maps). Lietotāji nevēlas SP atklāt precīzu savu atrašanās vietu. Lai aizsargātu telpisko vaicājumu privātumu, lietotāja atrašanās vieta vispirms jāpaziņo ar uzticamas atrašanās vietas anonimizētāju [13], kas apstrādā vaicājumu un ģenerē anonimizējošu telpisko reģionu, nevis precīzu lietotāja atrašanās vietu. Liela daļa darba, kas attiecas uz telpisko vaicājumu privātuma aizsardzību, izriet no k-anonimitātes modeļa, ko pirmo reizi datu bāzē ierosināja Svīnijs [14]. Grutesers un Grunvalds [15], pamatojoties uz šo modeli, vispirms ierosināja atrašanās vietas k-anonimitāti, lai aizsargātu telpisko vaicājumu privātumu. Pamatojoties uz atrašanās vietas k-anonimitāti, Gediks un Liu [16] ierosināja pielāgojamu arhitektūru, kas atbalsta atrašanās vietas k-anonimitāti plašam mobilo klientu lokam ar konteksta jutīgām privātuma prasībām. Bamba u.c. [17] ierosināja sistēmu anonīmu uz atrašanās vietu balstītu vaicājumu atbalstam, kas sadala interesējošo ģeogrāfisko apgabalu tīkla šūnās un ar režģi panāk k-anonimitāti.

Ņemot vērā anonimizācijas politiku, Deutsch et al. [18] ierosināja politiku apzinošu atrašanās vietas kanonimitāti, kas varētu aizsargāties pret reālistiskāku uzbrucēju politiku. Tā kā lielākā daļa atrašanās vietas k-anonimitātes algoritmu nevar efektīvi novērst no atrašanās vietas atkarīgus uzbrukumus, kad lietotāju atrašanās vietas tiek pastāvīgi atjauninātas, Pan et al. [19] ierosināja uz klikšķiem balstītu maskēšanas algoritmu, lai atrisinātu šo problēmu. Papildus atrašanās vietas k-anonimitātei tika piedāvātas vairākas citas vaicājumu privātuma saglabāšanas metodes. Piemēram, Beresfords un Stajano [20] ieviesa jaukto zonu, lai telpisko vaicājumu privātuma problēmu saistītu ar anonīmas komunikācijas problēmu. Izveidojot sajaukšanas zonas ceļu tīklā, Palanisamy un Liu [21] piedāvā sistēmu, lai aizsargātu mobilo sakaru lietotāju atrašanās vietas privātumu, kas ceļo pa ceļu tīkliem.

Telpiskās vaicājuma privātuma saglabāšanas metodes slēpj vaicājuma lietotāju atrašanās vietu no SP, bet neaizsargā vaicājamos datus. Tāpēc tas ir ortogonāls mūsu problēmai.

2.2. Telpisko datu ārpakalpojumu privātuma aizsardzība. Hacigumus et al. [22] vispirms iepazīstināja ar ideju par datu bāzes pakalpojumu ārpakalpojumu sniegšanu trešās puses pakalpojumu sniedzējam. Pēc tam viņi sniedza risinājumu datu privātuma aizsardzībai ārpakalpojumā, izveidojot indeksu, pamatojoties uz šifrētiem datiem un papildu informāciju par grupēšanu, lai atbalstītu šifrētu datu vaicājumu [23]. Vēlāk, cenšoties panākt viendimensiju skaitliskās vērtības, Agrawal et al. [24] ir ierosinājuši pasūtījumu saglabāšanas šifrēšanas shēmu (OPES), kas atbalsta efektīvu vaicājumu apstrādi SP. Pēc tam Huang et al. [25] ir iesnieguši ārpakalpojumu datu privātuma saglabāšanas pieeju, kas atbalsta neskaidru šifrētu virkņu vaicājumu. Visas iepriekš minētās pieejas ir piemērotas virkņu vai viendimensiju skaitliskām vērtībām, un tās nevar tieši piemērot telpisko datu privātuma aizsardzībai.

Vongs u.c. [26] ir pētījuši KNN aprēķinu šifrētiem blokiem, kas glabājas neuzticamā SP, un ierosina metodi, kas atbalsta SP, lai aprēķinātu relatīvo attālumu starp diviem šifrētiem datu punktiem. Tā kā ir ieviesta virtuālā dimensija, šī metode nevar efektīvi izveidot šifrētu datu punktu indeksu. Tāpēc, strādājot ar vaicājuma pieprasījumu, SP ir jāpārvar visi šifrētie datu punkti, kas noved pie salīdzinoši vājas vaicājuma efektivitātes.

Lai atbalstītu vaicājumu pakalpojumus par ārpakalpojuma privātajiem telpiskajiem datiem, daži pētnieki ir izmantojuši telpu aizpildīšanas līknes, lai pārveidotu IP, kas var atbalstīt diapazona un KNN vaicājumus pārveidotajā telpā. Praksē SHC tiek piemērots lielākajā daļā gadījumu. Izmantojot SHC, Ni et al. [8] ir samazinājuši papildu darba slodzi lietotāju parametru iestatīšanas dēļ. Tikmēr diapazona vaicājuma aprēķināšanas un sakaru izmaksas ir samazinātas, jo SHC klasterizācijas un attāluma saglabāšanas īpašības ir augstākas. Khoshgozaran et al. [9] izmantojiet SHC, lai kartētu datu punktus un vaicājuma pieprasījumu pēc Hilberta pārveidotās telpas un iespējotu vaicājumu pakalpojumus šifrētiem telpiskiem datiem. Turklāt viņi ievieš dubultā Hilberta līknes tehniku, kas uzlabo vaicājuma precizitāti un efektivitāti. Ku et al. [10] izpētīt vaicājuma integritātes nodrošināšanas shēmu. Pamatojoties uz SHC, datu punkti tiek šifrēti ar simetrisku atslēgu un indeksēti pēc Hilberta vērtības. Sākotnējā datu bāze un tās paraugs ir šifrēti ar dažādām kosmosa šifrēšanas atslēgām. Pēc tam abas šifrētās datu kopas tiek apvienotas un saglabātas SP integritātes pārbaudei.

Saskaņā ar pašreizējiem pētījumiem, pārveidojot sākotnējo telpu, SHC neņem vērā POI izplatīšanu. Faktiski tas sadala telpu, izmantojot to pašu granularitāti, un ģenerē Hilberta vērtības, lai izveidotu POI indeksus. Lai garantētu drošību un vaicājumu efektivitāti, ir nepieciešams pietiekami liels līknes pasūtījums, lai pārliecinātos, ka nav divu POI ar vienādu Hilbert vērtību. Khoshgozaran et al. [9] norādīja, ka, nezinot Hilberta līknes parametrus, ļaunprātīgs SP joprojām var noskaidrot blīvo POI apgabalu pārveidotajā telpā, analizējot to IP vietu skaitu, kurām ir vienādas vai līdzīgas Hilbert vērtības, kas palielina atrašanās vietas privātuma izpaušanas risku no ārpakalpojuma telpiskajiem datiem.

3. Telpiskās transformācijas metodes

Lai aizsargātu telpisko datu atrašanās vietas privātumu, mums ir jāpārveido sākotnējās POI atrašanās vietas. Ideālai telpas pārveidošanas metodei vajadzētu būt vienvirziena funkcijai, kuru ir viegli aprēķināt, bet grūti apgriezt. Tikmēr, lai saglabātu šifrētu telpisko datu vaicājumu efektivitāti, telpas pārveidošanas metodei būtu jāievēro sākotnējās telpas telpiskais tuvums. Šajā sadaļā mēs vispirms ieviešam standarta Hilberta līkni, kas ir reprezentatīva telpiskās transformācijas metode. Pēc tam mēs piedāvājam divas uzlabotas telpiskās transformācijas metodes, kas nodrošina labāku drošību nekā SHC.

3.1. Standarta Hilbert līkne (SHC). Telpu aizpildīšanas līknēm [27] piemīt iepriekš minētās iezīmes, un tās var izmantot telpisko datu pārveidošanā, lai aizsargātu ārpakalpojuma telpisko datu atrašanās vietas privātumu. Telpas aizpildīšanas līkne iet caur katru slēgtās telpas nodalījumu, un tai nav krustojuma ar sevi. Tādā veidā katrs daudzdimensiju telpas punkts tiks kartēts kā vērtība viendimensiju telpai. Z līkne [28], pelēkā līkne [29] un Hilberta līkne ir visas telpas aizpildīšanas līknes, kuras var izmantot telpas pārveidošanai.

Salīdzinot ar Z līkni un Pelēko līkni, Hilberta līkne tiek plaši izmantota, pateicoties izcilajām klasterizācijas un attāluma saglabāšanas īpašībām [11, 28-30, 34]. Līdzīgi kā [11], mēs izmantojam [H.sup.N.sub.d], lai apzīmētu Hilberta līkni ar kārtību N d-dimensiju telpā, kur N [lielāks vai vienāds ar] 1 un d [lielāks vai vienāds ar ] 2. Šādā veidā d-dimensiju veselu skaitļu telpu [[0, [2.sup.N] -1] .sup.d] var saistīt ar viendimensiju veselu skaitļu kopu [0, [2.sup.Nd ] -1], kas nozīmē, ka jebkuram PO p d dimensiju telpā ir funkcija f, kas atbilst [V.s.H] = f (p), kur [V.sub.H] [dalībnieks] [0, [2.d.] -1]. Tā kā vienā nodalītajā reģionā var būt vairāki POI, dažādiem POI var būt viena un tā pati indeksa vērtība konkrētai Hilberta līknei.

Tā kā šī darba galvenais mērķis ir aizsargāt IP atrašanās vietu privātumu, mēs koncentrējamies uz telpiskajām transformācijām divdimensiju telpā. 1. a) attēlā parādīts divdimensiju pārveidošanas process

vietu Hilberta vērtībās. Visus POI šķērso otrās kārtas Hilberta līkne, un tie tiek indeksēti, pamatojoties uz secību, kādā tos apmeklē līkne. Tātad šajā piemērā POI a, b, c un d attēlo attiecīgi Hilberta vērtības 7, 9, 3 un 13. Attēlā 1 (b) attēlota Hilberta līkne ar kārtību 1,2,4 un 6. No attēla mēs redzam, ka jo lielāka ir kārtība, jo smalkgraudaināka ir Hilberta līkne.

3.2. Indeksa modificēšanas metode SHC ([SHC.sup.*]). Tā kā reālās pasaules telpisko datu kopas parāda kopējo sadalījumu, SHC ģenerētie POI indeksi satur daudz nulles vērtības segmentu, kas palielina privātuma izpaušanas risku. Ļaunprātīgajam SP ir visi indeksi, un tas var pasīvi iegūt dažus kartējumus starp IP un indeksiem.Skenējot indeksus, uzbrucējs var viegli atrast nepārtrauktos segmentus un nulles vērtības segmentus. Viņš var koncentrēties uz šo informāciju un pielietot savas zināšanas, lai novērtētu nezināmu IP atrašanās vietu.

Mēs pētām SHC ģenerēto indeksu izplatības īpašības. Un indeksu sadalījums ir attēlots 2. attēlā.

2. attēlā kreisais attēls attēlo sākotnējo datu kopu, un atbilstošā histogramma attēlo POI indeksu vizualizāciju. Histogrammā melnās līnijas apzīmē nepārtrauktos segmentus, un pelēkās daļas apzīmē nulles vērtības segmentus. Ja mēs saspiežam šīs pelēkās daļas, indeksu sadalījums kļūs līdzsvarots. Tātad uzbrucējiem būs grūtāk analizēt, un samazināsies privātuma izpaušanas risks. Pamatojoties uz šo koncepciju, mēs piedāvājam indeksa modifikācijas algoritmu, lai uzlabotu SHC drošību, kas apzīmēts kā [SHC.up.*].

1. algoritmā, pamatojoties uz SHC ģenerētajiem POI indeksiem i un lietotāju parametra maksimālo atstarpi M, kas apzīmē maksimālo atstarpes vērtību starp diviem indeksiem modificēto POI indeksos I*, mēs salīdzinām starpību starp diviem kaimiņu indeksiem, ja atšķirība pārsniedz maksimālo atstarpi M, tad pēdējais indekss ir jāmaina, izmantojot uz priekšu vērsto indeksu un M. Pārveidoto IP indeksi I* jāatjaunina ar jauno kartīti, kurā ir indekss i un šifrēts IP. Šī algoritma laika sarežģītība ir 0 ([absolūtā vērtība ((I '))]), kur [absolūtā vērtība ((I'))] apzīmē I 'kardinalitāti

Pēc 1. algoritma piemērošanas POI indeksu modificēšanai pelēko daļu garums 2. attēlā ievērojami samazināsies, un ārpakalpojumu telpiskajām datu kopām ļaunprātīgajam SP ir grūtāk uzbrukt.

3.3. Uz blīvumu balstīta telpas aizpildīšanas līkne (DSC). Kad [SHC.sup.*] Sāk izpildīt pēc tam, kad SHC ir ģenerējis indeksus, [SHC.sup.*] Aizņem vairāk laika, lai ģenerētu IP indeksus. Iedvesmojoties no idejas, ka SHC var sadalīt un pārveidot sākotnējo telpu, mēs piedāvājam uz blīvumu balstītu telpu aizpildīšanas līkni (DSC), kurā tiek ņemts vērā IP sadalījums. DSC sadala telpisko domēnu atbilstoši ietilpībai, kas ir maksimālais POI skaits, ko satur sadalītais reģions, apzīmēts kā C. Tas izmanto Hilberta līknes fraktāļu noteikumus, lai noteiktu katra sadalītā reģiona apmeklējuma secību.

DSC paaudzē ir iesaistīti divi soļi. (1) Atbilstoši ietilpībai telpisko domēnu sadala četrstūra struktūra [31]. Un ģenerētie sadalītie reģioni tiks attēloti kā četru koku mezgli. (2) Pamatojoties uz DO norādīto līknes orientāciju, sākuma punktu un mērogošanas koeficientu, katrs sadalītais reģions tiek šķērsots secīgi saskaņā ar Hilberta līknes fraktāļu noteikumiem, pēc tam tiek ģenerēts katra sadalītā reģiona kārtas numurs, un mēs to saucam numura DSC vērtība, ko izmanto, lai izveidotu POI indeksus.

Četru koku kosmosa nodalījums. DSC telpiskais domēns ir sadalīts ar četru koku struktūru. Detalizāciju nosaka C ietilpība, kas nozīmē, ka pašreizējā nodalījumā, ja PO skaits reģionā R pārsniedz C, mums jāturpina sadalīt R, līdz IP skaits katrā sadalītajā reģionā nepārsniedz C. parāda dažādus nodalījumus, izmantojot dažādus C. No 3. attēla redzams, ka, jo mazāks ir C, jo smalkāks ir nodalījums.

DSC sadala telpu un ģenerē četru koku mezglus, kas atbilst sadalītajiem reģioniem, pamatojoties uz IP datu kopu un ietilpību.

Indeksu ģenerēšana DSC. Pēc telpiskā domēna sadalīšanas un četru koku mezglu ģenerēšanas nepieciešams ģenerēt lapu mezglu DSC vērtību un starpposma mezglu apakšizliekuma orientāciju un sākuma punktu atbilstoši iepriekš iestatītajai līknes orientācijai un DSC sākuma punktam, kas parādīts 2. algoritmā. katra POI indeksa vērtība ir iestatīta tāda pati kā sadalītā reģiona DSC vērtība, kurai POI pieder. Šis algoritms izmanto Hilberta līknes fraktāļu noteikumus, kas parādīti 4. attēlā.

Pastāv astoņi Hilberta līknes fraktāļu noteikumu veidi. Apakšreģiona kārtas numurs tiek piešķirts pēc četrvietīgā numura. Saskaņā ar 4. attēla noteikumiem katru apakšreģionu var tālāk sadalīt, lai ģenerētu augstākas kārtas līknes.

2. algoritmā [Q.ub] ir mezgla Q apakšvirzes orientācija, [Qsub.S] ir mezgla Q apakšvirziena sākuma punkts, S ir kaudze, kurā tiek glabāti četru koku mezgli, [Z.sub. D] ir mezgla Z DSC vērtība, un Z (i) ir Z gadsimta pakārtotais mezgls. 2. algoritms dziļumā vispirms šķērso četrkoku Q saskaņā ar iepriekš iestatīto līknes orientāciju 9 un sākuma punktu [S.sub.0] un ģenerē katra sadalītā reģiona indeksa vērtība, pamatojoties uz lapu mezglu apmeklējuma secību. No saknes mezgla mēs iestatām katra starpposma mezgla līmeņa orientāciju un sākumpunktu pa līmeņiem saskaņā ar fraktāļu noteikumiem 4. attēlā (6.-9. Rindas). [T.sub.O] ([Z.O.], [Z.S], i) un Ts ([Z.O], [Z.S], i) apzīmē apakšgrupu attiecīgi Z mezgla pirmā bērna mezgla orientācija un sākuma punkts.

Pieņemot, ka POI datu kopas lielums ir n. Vidējais,

2. algoritmam ir jāapmeklē mezgli [MATEMATISKĀ IZTEIKŠANA, KAS NAV REPRODUKCIJAS ASCII], un katrs mezgls tiks apmeklēts tikai vienu reizi. Tātad 2. algoritma sarežģītība ir O (n).

Šajā sadaļā mēs vispirms analizējam SHC drošību un piedāvājam neatšķirtību, lai izmērītu privātuma izpaušanas risku telpu aizpildīšanas līknēs. Tad mēs oficiāli definējam uzbrukuma modeli, kas nosaka uzbrucēja pamatzināšanas un mēra telpas aizpildīšanas līkņu drošību.

4.1. Konfidencialitātes atklāšanas risks. Kā mēs zinām, ļaunprātīgs SP var identificēt blīvo POI apgabalu pārveidotajā telpā, analizējot to IP skaitu, kuriem ir līdzīgas vai vienādas indeksa vērtības. Lai novērstu to, ka vairāki IP piešķir vienu un to pašu indeksa vērtību, mums jāpalielina SHC līknes secība. Praksē POI vairumā gadījumu ir blīvi izplatīti, un, piemērojot SHC, lai ģenerētu POI indeksus, var tikt ieviesti daudzi nulles vērtības segmenti. Tādā veidā ļaunprātīgs SP var analizēt šos nulles vērtības segmentus un pēc tam uzzināt blīvās vietas pārveidotajā telpā. Lai gan fiktīvo vērtību izmantošana nulles vērtību segmentu samazināšanai [9] var nepārprotami novērst šos segmentus, analizējot vaicājumu žurnālu, ļaunprātīgs SP joprojām var atklāt indeksa vērtības ar zemu vaicājumu biežumu un pēc tam apstiprināt fiktīvās vērtības. Lai kvantitatīvi noteiktu privātuma izpaušanas risku, mēs izmantojam informācijas entropijas ideju un definējam neatšķiramību X šādi:

[MATEMĀTISKĀ IZTEIKŠANA NAV ATRAUDZAMA ASCII] (1)

kur [[delta] .sub.i] apzīmē nulles vērtības segmenta garumu IP indeksos apzīmē nulles vērtības segmentu skaitu [[phi] .j] apzīmē nepārtraukta segmenta garumu IP indeksi apzīmē nepārtraukto segmentu skaitu, kas apzīmē IP indeksu kopējo garumu. Neatšķiramība nosaka, kā nulles vērtības segmenti un nepārtraukti segmenti ietekmē privātuma izpaušanas risku. Ļaunprātīgam SP ir grūti analizēt vienmērīgi sadalītos indeksus. Saskaņā ar informācijas entropijas iezīmēm mēs uzzinām, ka jo nevienmērīgāk sadalās nulles vērtības segmenti un nepārtrauktie segmenti, jo mazāka ir neatšķiramība un līdz ar to lielāks privātuma izpaušanas risks.

4.2. Uzbrukuma modelis. Tā kā ļaunprātīga SP var analizēt šifrētos telpiskos datus, lai novērtētu sākotnējās atrašanās vietas, DO vēlas uzzināt telpiskās transformācijas metožu drošības līmeni. Ļaunprātīgais SP var iegūt zināmas pamatzināšanas, piemēram, kartējumu apakškopu starp sākotnējo datu kopu P un pārveidoto datu kopu P '. Pēc tam viņš var izmantot dažas uzbrukuma metodes, lai novērtētu objektu sākotnējo atrašanās vietu P 'un iegūtu aprēķināto datu kopu P*. Mēs izmantojam novērtējuma izkropļojumus (P, P *) [4], lai izmērītu vidējo kļūdu starp sākotnējo datu kopu un aprēķināto datu kopu * šādi:

DT (P, P*) = [AVG.ap.p.id = p*.id, p [loceklis] P, p*[dalībnieks] P*] [paralēli] p- [p.sup.*] [paralēli], (2)

kur [paralēli] p- [p.sup.*] [paralēli] apzīmē Eiklīda attālumu starp p un [p.sup.*]. Acīmredzot augsta (P, [P.sup.*]) Vērtība nozīmē, ka telpiskās transformācijas metodei ir grūti uzbrukt. Novērtējuma izkropļojumus (P, [P.sup.*]) Varētu izmantot, lai izmērītu telpiskās transformācijas metodes drošības līmeni.

Mēs pieņemam, ka uzbrucējs var iegūt iepriekšējas zināšanas par ārpakalpojuma telpisko datu kopu. Piemēram, uzbrucējs var zināt dažus kartējumus starp sākotnējām atrašanās vietām un atbilstošajiem indeksiem. Pateicoties SHC izcilajām klasterizācijas un attāluma saglabāšanas īpašībām, uzbrucējs var novērtēt indeksu sākotnējās atrašanās vietas, izmantojot zināmos kartējumus. Diskusiju labad mēs pieņemam, ka uzbrucējs pasīvi zina šādu informāciju.

(1) A apakškopa A [apakškopa] P no n POI, A = [[a.1.apakšpunkts], [a.2.apakšpunkts],. [a.sub.n]>, kur [a.sub.i] ir IP atrašanās vieta.

(2) Atbilstošā apakškopa A! [apakškopa] I 'no POI indeksiem, A' = <[a'.sub.1], [a'.sub.2],. [a.sub.n]>, kur ir atrašanās vietas indekss [a.sub.i].

Tā kā uzbrucējs var iegūt tikai A un A! pasīvā veidā viņš nevar tos aktīvi izvēlēties, kā vēlas. Lai gan uzbrucējs zina IP “indeksus I” - A ”, viņš nezina neviena IP atrašanās vietu P - A. Tāpēc uzbrucējs mēģina novērtēt katra indeksa sākotnējo atrašanās vietu I” - A ”. Telpiskās transformācijas metodei vajadzētu veikt šo novērtējumu ar augstu DT (P, [P.sup.*]) Vērtību.

Yiu et al. [4] definēt vispārējo uzbrukuma modeli un piedāvāt uz heiristiku balstītu vispārēju uzbrukuma metodi, kas ļauj uzbrucējam novērtēt saprātīgu sākotnējās atrašanās vietas tuvinājumu, izmantojot savas ierobežotās zināšanas par zināmajiem kartējumiem. Līdzīgi indeksam b 'e I' -A 'mēs definējam tā pazīmju vektoru virs A' šādi:

[MATEMĀTISKĀ IZTEIKŠANA NAV ATRAUDZAMA ASCII], (3)

kur [absolūtā vērtība (b ' -[a'.sub.1])] ir absolūtā starpība starp b' un [a'.sub.i]. Kā mēs zinām, IP indeksos ir nulles vērtību segmenti, un SHC klasterizācijas un attāluma saglabāšanas rādītāji ir augstāki. Tādējādi uzbrucējam nevajadzētu aprēķināt absolūto starpību katram indeksam [a'.sub.i] [dalībnieks] A '. Indeksam b 'uzbrucējs aprēķinās tikai absolūto starpību indeksiem, kas ir tuvu b', un šiem indeksiem jābūt nepārtrauktiem. Šie indeksi veido A! Apakškopu, kas apzīmēta kā B ', kas mainās atkarībā no b'. Tātad indeksa b '[loceklis] I' - A 'pazīmju vektors ir jāpārskata šādi:

[MATEMĀTISKĀ IZTEIKŠANA NAV ATRAUDZAMA ASCII], (4)

kur B '= <[a'.sub.1], [a'.sub.2],. [a'.sub.m]> apzīmē A 'apakškopu, un m & lt n. Izvietojumam p sākotnējā telpiskajā domēnā tā iezīmju vektors ir

V (p, B) = ([paralēla] p- [a.sub.1] [paralēla] p- [a.apakša2] [paralēla]. [Paralēla] p- [a.sub.m] [paralēla] ]), (5)

kur B = <[a'1. apakšpunkts], [a'2. apakšpunkts],. [a'.sub.m]> apzīmē A apakškopu, un šī apakškopa atbilst . Izvēloties kandidāta atrašanās vietu I un pēc tam salīdzinot pazīmju vektoru V (b ', B') un V (l, B) saskanīgo modeli, uzbrucējs var noteikt indeksa b 'sākotnējo atrašanās vietu ar zemu novērtējuma kļūdu. Tiešam salīdzinājumam iezīmju vektori jānormalizē pēc to lieluma, un mēs izmantojam atšķirību [4], lai izmērītu atšķirību starp l un b 'šādi:

[eta] (l, b) = [L. 1] (V (b ', B')/[absolūtā vērtība (V (b ', B'))]], V (l, B)/[ absolūtā vērtība (V (b ', B'))])

kur [L.sub.1] ir Manhetenas attālums. Tātad uzbrucējs var novērtēt indeksa b 'sākotnējo atrašanās vietu kā l*, kas ir kandidāta vieta I ar mazāko atšķirības vērtību,

[MATEMĀTISKĀ IZTEIKŠANA NAV ATRAUDZAMA ASCII]. (7)

Acīmredzot l* aprēķins rada bezgalīgu skaitu kandidātu atrašanās vietu sākotnējā telpiskajā jomā. Mēs pieņemam, ka uzbrucējs izmanto randomizētu skaitlisku metodi, lai pieņemamā laikā iegūtu l* tuvinājumu. Novērtējot katru indeksu b 'el' -A ', uzbrucējs var iegūt aptuvenu datu kopu [P.sup.*],

[MATEMĀTISKĀ IZTEIKŠANA NAV ATRAUDZAMA ASCII]. (8)

5. sadaļā mēs empīriski pētām SHC, [SHCsup.*] Un DSC drošības līmeni, piemērojot iepriekš modificēto vispārējo uzbrukuma modeli.

Mēs novērtējam SHC, [SHC.sup.*] Un DSC veiktspēju un drošību, izmantojot četras reālas telpiskās datu kopas [32]: ASV ziemeļaustrumi (NE: 123, 593 POI), San Joaquin County (TG: 18, 263 POI) ), Sanfrancisko (SF: 174, 956 POI) un Ziemeļamerikā (NA: 175, 813 POI). Šīs datu kopas labi atbilst privātajiem telpisko datu ārpakalpojumiem, kas minēti 1. sadaļā. Katras datu kopas domēns tiek normalizēts līdz vienības kvadrātam [[0,1] .up.2], un eksperimenti tiek veikti ar Intel i5-2400 3.1 Ghz ar 8GBRAM. Sākuma punkts, līknes orientācija un līknes skalas koeficients ir iepriekš iestatīti attiecīgi (0, 0), D1 un 1.

5.1. Parametru izvēle. Piemērojot SHC vai DSC telpiskā domēna pārveidošanai, katram sadalītajam reģionam tiks piešķirta vērtība. IP ir piešķirta tāda pati vērtība kā sadalītajam reģionam, kuram tas pieder, un šo vērtību var izmantot, lai izveidotu POI kopas indeksu. Ja divi IP atrodas tajā pašā nodalītajā reģionā, tiem tiks piešķirta viena un tā pati vērtība. Ļaujiet a attēlot vidējo POI skaitu ar tādu pašu indeksa vērtību, izmantojot SHC un DSC, lai indeksētu POI, mēs izmērām a katrai N un C vērtībai visās datu kopās. Ideālā gadījumā mēs vēlamies, lai a būtu bezgalīgi tuvu 1, kas nozīmē, ka nav divu POI ar vienādu indeksa vērtību.

[SHC.sup.*] Ir tāds pats kā SHC, tāpēc mēs pētām tikai saistību starp līknes parametriem un a SHC un DSC, lai garantētu, ka šādi eksperimenti tiek veikti vienādos apstākļos. 5. attēlā parādīts SHC a dažādās līkņu secības JV. Palielinoties līknes secībai, SHC alfa krasi samazinās. Kad N = 12, alfa tuvojas 1 ZA, TG un SF, bet NA vajag N = 13. 6. attēlā ir attēlots DSC a dažādām jaudām C. DSC pieaug alfa lēnām, palielinoties jaudai. Ja C = 1, [alfa] = 1. Tātad mēs piemērojam šo iestatījumu SHC ([SHC.sup.*] Piemēro to pašu iestatījumu kā SHC) un DSC atlikušajos eksperimentos.

Kā lietotāja parametrs [SHC.sup.*] Maksimālajai atstarpei M var būt jebkura vērtība. Mēs pētām saistību starp neatšķiramību un M [SHC.sup.*] Un noskaidrojam, ka [SHC.sup.*] Neatšķiramība paliek nemainīga, kad M e [5, 55], un samazinās, kad M & gt 60. Apspriežot šo darbu, mēs šādos eksperimentos iestatījām M = 10, kas efektīvi saspiež nulles vērtības segmentus un samazina aprēķina izmaksas.

5.2. Indeksu paaudžu salīdzinājums. Indeksu ģenerēšanas aprēķina izmaksas ir svarīgs rādītājs telpiskās transformācijas metožu novērtēšanai. Mēs iestatījām a = 1 SHC, [SHC.sup.*] Un DSC un salīdzinājām to efektivitāti, veidojot indeksu dažādās datu kopās. EDHO [33] un BIA [34] ir SHC indeksu ģenerēšanas algoritmi, savukārt šajā dokumentā ierosinātais IGD ir DSC indeksa ģenerēšanas algoritms. Tā kā [SHC.sup.*] Sāk izpildīt pēc EDHO vai BIA, mēs izmantojam [SHC.sup.*]-E un [SHC.sup.*]-B, lai attiecīgi apzīmētu dažādas izpildes secības. Eksperiments tiek veikts 100 reizes un tiek aprēķināts indeksa ģenerēšanas laiks (ms).

1. tabulā parādīts SHC, [SHCsup.*] Un DSC indeksa ģenerēšanas laiks dažādās datu kopās. BIA ģenerē indeksu ātrāk nekā EDHO, un [SHC.sup.*]-B ir ātrāks nekā [SHC.up.*]-E, taču tie visi ir lēnāki nekā IGD. Tā kā [SHC.sup.*] -E sastāv no EDHO un [SHC.up.*], Tas aizņem nedaudz vairāk laika nekā EDHO. Un [SHC.sup.*]-B rezultāta skaidrojums ir līdzīgs ar [SHC.sup.*]-E. Vidēji IGD laika izmaksas ir tikai 49,2%, attiecīgi 64,5% no EDHO un BIA izmaksām. Sine DSC ņem vērā POI datu kopas izplatīšanu un izvēlas atšķirīgas līkņu secības reģionos ar atšķirīgu blīvumu, kas ļauj retiem POI reģioniem izmantot salīdzinoši zemu līkņu secību un tādējādi uzlabo aprēķinu efektivitāti.

5.3. Neatšķirības salīdzinājums. Veidojot POI rādītājus, mēs izmantojam parametru iestatījumu 5.1. Sadaļā un aprēķinām šo telpiskās transformācijas metožu neatšķiramību. Tā kā par POI indeksiem tiek izmantotas tikai indeksu vērtības, kas atbilst IP, un tie ir nepārtraukti segmenti, mēs varētu secīgi skenēt POI indeksus un noskaidrot atšķirības starp nepārtrauktajiem segmentiem, un šīs nepilnības ir nulles vērtību segmenti. 2. tabulā parādīta SHC, [SHCsup.*] Un DSC neatšķirība dažādām datu kopām.

[SHCsup.*] Un DSC neatšķirība visās datu kopās ir ievērojami augstāka nekā SHC. Vidēji [SHCsup.*] Un DSC ir attiecīgi par 68,4% un 64,9% augstāki nekā SHC. Tas nozīmē, ka [SHCsup.*] Un DSC var saglabāt ļoti zemu privātuma izpaušanas risku. Analizējot šo telpiskās transformācijas metožu īpašības, mēs varam uzzināt, ka tad, kad SHC veido indeksu uz reālu telpisko datu kopu, būs liels skaits nulles vērtības segmentu, un nepārtraukto segmentu vidējais garums ir diezgan atšķirīgs no nulles vērtību segmenti. Kamēr DSC sadala telpisko domēnu atbilstoši blīvumam, nulles vērtības segmentu skaits un garums būs daudz mazāks nekā SHC, un nulles vērtības segmenti un nepārtrauktie segmenti izplata līdzsvaru, padarot DSC neatšķiramību ievērojami lielāku nekā SHC.

Lai salīdzinātu nulles vērtības segmentu un nepārtraukto segmentu sadalījumu, izmantojot dažādas telpiskās transformācijas metodes, 7. attēlā ilustrējam SHI, [SHC.up.*] Un DSC veidotos POI indeksus, kur (a.1) , (b.1), (c.1) un (d.1) apzīmē attiecīgi NE, TG, SF un NA datu kopas. Un 2, 3 un 4 attēlo POI indeksus, ko veido attiecīgi SHC, [SHCsup.*] Un DSC. Kā aprakstīts 3.2. Sadaļā, histogrammas melnās līnijas attēlo nepārtrauktos segmentus, bet pelēkās daļas apzīmē nulles vērtības segmentus. Mēs redzam, ka pelēko daļu garums dramatiski samazinās pēc 1. algoritma piemērošanas, lai mainītu SHC veidotos POI indeksus.Tā kā [SHC.sup.*] Saspiež nulles vērtības segmentus, kopējais nulles vērtības segmentu garums ir bezgalīgs nekā SHC, un nulles vērtības segmentu un nepārtraukto segmentu sadalījums ir daudz līdzsvarotāks nekā SHC, kas padara [SHC.sup] neatšķiramu .*] daudz lielāks nekā SHC, tādējādi samazinot privātuma izpaušanas risku. No šī skaitļa mēs arī uzzinām, ka [SHC.sup.*] Un DSC veidoto POI indeksu sadalījumi ir līdzīgi, un tāpēc [SHC.sup.*] Neatšķirība ir līdzīga DSC .

5.4. Uzbrukumi SHC, [SHCsup.*] Un DSC. Mēs izmantojam parametru iestatījumu 5.1. Sadaļā un zināmās kopas A attiecību pret 1%, pamatojoties uz pieņēmumu, ka uzbrucēji iegūst ierobežotas pamatzināšanas un kaimiņu atsauces POI skaitu līdz 15, kas ir labākā vērtība POI novērtēšanai mūsu eksperimentos. . Sākotnējo datu kopu rekonstruēšanai tiek izmantota 4. sadaļā aprakstītā uzbrukuma metode.

8. attēlā ir attēlotas aprēķinātās datu kopas, kas rekonstruētas ar uzbrukuma metodi, salīdzinot ar SHI, [SHC.sup.*] Un DSC ģenerētajiem POI indeksiem, kur a, b, c un d apzīmē NE, TG, SF un NA datu kopas attiecīgi, savukārt 1., 2., 3. un 4. attēlo sākotnējās datu kopas, aprēķinātās datu kopas virs SHC, aprēķinātās datu kopas virs [SHC.sup.*] un aprēķinātās datu kopas virs DSC. No 8. attēla mēs varam viegli noskaidrot, ka [SHC.sup.*] Un DSC ģenerētos POI indeksus ir grūtāk uzbrukt, jo aprēķinātās datu kopas ir mazāk līdzīgas sākotnējām datu kopām. Gluži pretēji, aprēķinātās datu kopas, kas rekonstruētas, izmantojot SHC veidotos indeksus, saglabā sīkāku informāciju. Tas nozīmē, ka [SHCsup.*] Un DSC ir drošāki nekā SHC.

Turpmākajai analīzei mēs aprēķinām SHC, [SHCsup.]] Un DSC novērtējuma izkropļojumus, un 3. tabulā ir parādīti SHC, [SHCsup.*] Un DSC novērtējuma izkropļojumi visām datu kopām.

Tā kā novērtējuma izkropļojums atspoguļo vidējo kļūdu starp sākotnējo un aprēķināto datu kopu, lielāka metrikas vērtība nozīmē drošāku metodi. 3. tabulā redzams, ka SHC novērtējuma izkropļojums ir mazāks nekā [SHCsup.*] Un DSC, un DSC novērtējuma izkropļojums ir nedaudz mazāks nekā [SHCsup.*]. Tas nozīmē, ka [SHCsup.*] Un DSC ir drošāki nekā SHC. Tā kā SHC klasterizācijas un attāluma saglabāšanas veiktspēja ir labāka, aprēķinātās datu kopas ir tuvākas sākotnējām datu kopām, un novērtējuma izkropļojumu vērtība ir mazāka. [SHC.sup.*] Un DSC saspiež nulles vērtības segmentus, attāluma saglabāšanas īpašums ir nedaudz pārkāpts, un ļaunprātīgs SP nevar spekulēt ar sākotnējo datu kopu atrašanās vietas sadalījumu, vienkārši analizējot POI rādītājus, tāpēc [SHC.up.* ] un DSC ir drošāki.

Šajā rakstā mēs piedāvājam [SHCsup.*] Un DSC ārpakalpojumu telpisko datu indeksa ģenerēšanai un ierosinām neatšķirtību, lai izmērītu telpiskās transformācijas metožu privātuma izpaušanas risku. Tiek definēts arī uzbrukuma modelis, eksperimentos paredzamās datu kopas tiek vizualizētas nepārprotamai izpētei, un novērtējuma izkropļojumi rāda, ka [SHCsup.*] Un DSC ir drošāki par SHC. Ierosinātās metodes var daļēji pārkāpt SHC attāluma saglabāšanas īpašību, lai panāktu labāku drošību. Indeksa ģenerēšanas laiks rāda, ka DSC ir efektīvāks par SHC un [SHC.sup.*], Tāpēc DSC sasniedz labu drošību un efektivitāti. Nākotnē mēs turpināsim veikt telpiskāku transformācijas metožu drošības analīzi un piedāvāsim efektīvāku metriku drošības kvantitatīvai noteikšanai.

9. un 10. attēlā ir parādīti dažādi atstarpju sadalījumi virs SHC un DSC datu kopas TG. Zilā līnija attēlo telpu aizpildīšanas līknes. Mēs redzam, ka SHC sadala telpisko domēnu, izmantojot vienoto granularitāti, bet DSC sadala telpisko domēnu atbilstoši IP blīvumam. Novērošanas ērtībai SHC iestatījām N = 6, bet DSC - C = 1.

Autori paziņo, ka attiecībā uz šī raksta publicēšanu nepastāv interešu konflikts.

Šo darbu daļēji atbalstīja NSFC ar dotāciju Nr. 61172090, Pētniecības fonds Ķīnas augstākās izglītības doktorantūras programmai ar grantu Nr. 20120201110013, Zinātniskais un tehnoloģiskais projekts Shaanxi provincē ar granta nr. 2012 K06-30 un 2014JQ8322, Zinātnes pamatpētniecības fonds Siaņas Dzjaotunas universitātē (nr. XJJ2014049 un XKJC2014008) un Šanksi zinātnes un tehnoloģiju inovāciju projekts (2013SZS16-Z01/P01/K01). Autori arī pateicas par recenzentu noderīgajiem ieteikumiem.

[1] J. An, X. Gui, W. Zhang, J. Jiang un J. Yang, "Pētījumi par sociālo attiecību kognitīvo modeli mobilajiem mezgliem lietā internetā", Journal of Network and Computer Applications, sēj. 36, nē. 2, 799.-810. lpp., 2013.

[2] L. Hu, W. Ku, S. Bakiras un C. Shahabi, "Telpisko vaicājumu integritāte ar kaimiņiem voronoi", IEEE Transactions on Knowledge and Data Engineering, sēj. 25, nē. 4, lpp. 863-876, 2013.

[3] WS Ku, L. Hu, C. Shahabi un HX Wang, "Vaicājumu integritātes nodrošināšana uz pakalpojumiem, kas balstīti uz atrašanās vietu, piekļūstot ārpakalpojumu telpiskajām datu bāzēm", 11. starptautiskā simpozija par telpiskajām un laika datubāzēm materiāli, 80. lpp. 97, Olborga, Dānija, 2009.

[4] M. L. Yiu, G. Ghinita, C. S. Jensen un P. Kalnis, "Iespējot meklēšanas pakalpojumus par ārpakalpojumu privātajiem telpiskajiem datiem", The VLDB Journal, vol. 19, nē. 3, 363.-384., 2010. gads.

[5] R. Huang, X. Gui, S. Yu un W. Zhuang, "Privātumu aizsargājoša aprēķināmā šifrēšanas shēma mākoņdatošanā", Chinese Journal of Computers, sēj. 34, nē. 12, 2391.-2402.lpp., 2011. gads.

[6] P. Indiks un D. Vudrafs, "Polilogaritmiskas privātas aproksimācijas un efektīva saskaņošana", 3. kriptogrāfijas teorijas konferences materiālos, 245.-264. Lpp., Ņujorka, NY, ASV, 2006. gads.

[7] B. Chor, E. Kushilevitz, O. Goldreich un M. Sudan, "Privātas informācijas iegūšana", Journal of the ACM, vol. 45, nē. 6, 965.- 982. lpp., 1998.

[8] W. Ni, J. Zheng un Z. Chong, "Hil Anchor: atrašanās vietas privātuma aizsardzība lietotāju vēlmju klātbūtnē", Journal of Computer Science and Technology, sēj. 27, nē. 2, 413.-427.lpp., 2012. gads.

[9] A. Khoshgozaran, H. Shirani-Mehr un C. Shahabi, "Akli novērtēt uz atrašanās vietu balstītus vaicājumus, izmantojot telpas transformāciju, lai saglabātu atrašanās vietas privātumu", GeoInformatica, sēj. 17, nē. 4, 599.-634.lpp., 2013.

[10] W. S. Ku, L. Hu, C. Shahabi un H. X. Wang, "Vaicājuma integritātes nodrošināšanas shēma piekļuvei ārpakalpojumu telpiskajām datu bāzēm", Geoinformatica, sēj. 17, nē. 1, 97.-124.lpp., 2013.

[11] B. Moon, H. V. Jagadish, C. Faloutsos un J. H. Saltz, "Hilberta telpas aizpildīšanas līknes klasterizācijas īpašību analīze", IEEE Transactions on Knowledge and Data Engineering, sēj. 13, nē. 1, 124.-141.lpp., 2001.

[12] A. Khoshgozaran un C. Shahabi, "Tuvāko kaimiņu vaicājumu aklais novērtējums, izmantojot kosmosa transformāciju, lai saglabātu atrašanās vietas privātumu", 10. starptautiskā simpozija par telpiskajām un laika datubāzēm materiālos, 239.-257. Lpp., Bostona, Masa, ASV, 2007.

[13] P. Kalnis, G. Ghinita, K. Mouratidis un D. Papadias, "Novērst uz atrašanās vietu balstītas identitātes secinājumus anonīmos telpiskos vaicājumos", IEEE Transactions on Knowledge and Data Engineering, sēj. 19, nē. 12, 1719-1733, 2007. gads.

[14] L. Svīnijs, "k-anonimitāte: privātuma aizsardzības modelis", International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, sēj. 10, nē. 5, 557.-570. lpp., 2002.

[15] M. Grutesers un D. Grunvalds, "Uz atrašanās vietu balstītu pakalpojumu anonīma izmantošana, izmantojot telpisko un laika maskēšanu", 1. starptautiskās mobilo sistēmu, lietojumprogrammu un pakalpojumu konferences materiālos, 31.-42. Lpp., Sanfrancisko, Kalifornija, ASV, 2003.

[16] B. Gediks un L. Liu, "Vietas privātuma aizsardzība ar personalizētu k-anonimitāti: arhitektūra un algoritmi", IEEE Transactions on Mobile Computing, sēj. 7, nē. 1, 2008. gada 1.-18.

[17] B. Bamba, L. Liu, P. Pesti un T. Vangs, "Anonīmu atrašanās vietas vaicājumu atbalstīšana mobilajā vidē ar privātuma režģi", 17. starptautiskās konferences par globālo tīmekli (WWW 08) materiālos. 237-246, Pekina, Ķīna, 2008. gada aprīlis.

[18] A. Deutsch, R. Hull, A. Vyas un K.K. Zhao, "Politiku apzinīga sūtītāja anonimitāte pakalpojumos, kas balstīti uz atrašanās vietu", 26. IEEE starptautiskās konferences par datu inženieriju (ICDE 10) materiālos, 133.-144.lpp., Longbīča, Kalifornija, ASV, 2010. gada marts.

[19] X. Pan, J. L. Xu un X. F. Meng, "Atrašanās vietas privātuma aizsardzība pret uzbrukumiem, kas atkarīgi no atrašanās vietas mobilajos pakalpojumos", IEEE Transactions on Knowledge and Data Engineering, sēj. 24, nē. 8, 1506.-1519. lpp., 2012.

[20] A. R. Beresfords un F. Stajano, "Location privacy in pervasive computing", IEEE Pervasive Computing, sēj. 2, nē. 1, 2003. gada 46.-55.lpp.

[21] B. Palanisamijs un L. Liu, "MobiMix: atrašanās vietas privātuma aizsardzība ar jauktajām zonām virs ceļu tīkliem", IEEE 27. starptautiskās konferences par datu inženieriju materiālos, 494.-505. Lpp., Hannovere, Vācija, 2011. gada aprīlis .

[22] H.

[23] H. Hacigumus, B. Iyer, C. Li un S. Mehrotra, "SQL izpilde pār šifrētiem datiem datu bāzes pakalpojumu sniedzēja modelī", publikācijā ACM SIGMOD starptautiskās konferences par datu pārvaldību (SIGMOD 02), 216. – 227. Lpp., Medisona, Visa, ASV, 2002. gada jūnijs.

[24] R. Agravals, Dž. Kiernans, R. Srikants un YR Xu, "Pasūtījumu saglabāšanas šifrēšana skaitliskiem datiem", publikācijā ACM SIGMOD International Conference on Data Management (SIGMOD 04), 563.-574. , ACM, Parīze, Francija, 2004. gada jūnijs.

[25] R. W. Huang, X. L. Gui, S. Yu un W. Zhuang, "Pētījums par privātuma saglabāšanas sistēmu mākoņu krātuvei", Datorzinātne un informācijas sistēmas, sēj. 8, nē. 3, 801.-819.lpp., 2011.

[26] WK Wong, DW Cheung, B. Kao un N. Mamoulis, "Secure kNN computation on šifrētās datu bāzes", Starptautiskās datu pārvaldības konferences materiālos un 28. simpozijā par datu bāzes sistēmu principiem (SIGMOD-PODS 09), 139.-152.lpp., Providence, RI, ASV, 2009. gada jūlijs.

[27] H. Sagans, Kosmosa aizpildīšanas līknes, Springer, Berlīne, Vācija, 1994. gads.

[28] J. A. Orenšteins, "Telpisko vaicājumu apstrāde objektorientētā datu bāzes sistēmā", izdevumā ACM SIGMOD International Conference on Data Management, Proceedings of the ACM SIGMOD International Conference on Data Management, 326.-336.lpp., Vašingtona, ASV, 1986.g.

[29] H. V. Džagadišs, "Objektu lineāra klasterizācija ar vairākiem atribūtiem", izdevumā ACM SIGMOD International Conference on Data Management Proceedings, 332.-342. Lpp., Atlantic City, NJ, ASV, 1990. gada maijs.

[30] J. K. Lawder un P. J. H. King, "Daudzdimensiju datu vaicājumi, kas indeksēti, izmantojot Hilberta telpas aizpildīšanas līkni", SIGMOD Record, sēj. 30, nē. 1, 2001. gada 19.-24.

[31] H. Samets, "Četrkoku un saistītās hierarhiskās datu struktūras", ACM Computing Surveys, sēj. 16, nē. 2, 187.-260. lpp., 1984. gads.

[32] "Patiesas telpisko datu bāzu datu kopas: ceļu tīkli un interesējošie punkti [EB/OL]", http://www.cs.utah.edu/

lifeifei/ Spatial Dataset htm

[33] X. Liu un G. Šraks, "Hilberta pasūtījuma kodēšana un atšifrēšana", Programmatūra: prakse un pieredze, sēj. 26, nē. 12, 1335-1346, 1996. lpp.

[34] C. Faloutsos un S. Roseman, "Fractals for second key retrieve", Proceedings of the 8ht ACM SIGACT-SIGMOD SIGART Symposium on Principles of Database Systems, 247.-252. Lpp., Filadelfija, ASV, 1989. gada marts .

Feng Tian, ​​(1,2) Xiaolin Gui, (1,2) Jian An, (1,2) Pan Yang, (1,2) Jianqiang Zhao, (1,2) un Xuejun Zhang (1,2)

(1) Elektronikas un informācijas inženierzinātņu skola, Sjaņas Dzjaotunas universitāte, Sjaņa 710049, Ķīna

(2) Shaanxi provinces galvenā datortīkla laboratorija, Sjaņas Dzjaotunas universitāte, Sjaņa 710049, Ķīna


Finansētais projekts: uz datiem balstīta pieeja vietējai sociālajai izpētei

Finansē UW-Madisonas pētniecības un augstākās izglītības vicekanclera birojs (VCRGE) un Viskonsinas Absolventu pētniecības fonds (WARF).

Vietvārdi un vietu semantika, kas aprakstītas dabiskās valodās, nevis koordinātās (t.i., garums un platums), ir plaši izplatīti cilvēku diskursā, dokumentos un sociālajos medijos, savukārt atrašanās vieta ir jānorāda citas informācijas kartēšanai vai sasaistei. Tomēr joprojām pastāv plaisa starp neformālajām vai neskaidrajām izziņas izpausmēm par vietu (piemēram, pilsētas centrs, apkārtne, Viskonsinas ziemeļi) un formālajiem skaitļotajiem attēlojumiem par vietu datorizētās informācijas sistēmās. Kognitīvos reģionus un vietas ir ļoti grūti attēlot ģeogrāfiskās informācijas zinātnē un sistēmās. Tās rodas no indivīdu, sabiedrības un vides sarežģītās mijiedarbības.

Lielo datu parādīšanās paver jaunas iespējas labāk izprast mūsu ģeogrāfisko un sociālekonomisko vidi. Šajā pētījumā mēs sintezēsim vairāku avotu datu kopas no skaitīšanas, uz atrašanās vietu balstītiem sociālajiem tīkliem, ziņu medijiem, Wikipedia, ceļojumu emuāriem un citām atvērto datu vietnēm, kā arī izmantojot vietas teoriju, dabiskās valodas apstrādi, mašīnmācīšanos un vizualizāciju metodes neskaidru kognitīvo vietu iegūšanai un attēlošanai. Pētījums arī palīdzēs labāk izprast indivīdu novērojumus, pieredzi un iedarbību uz dažāda veida vietām un apkārtējo sociālo vidi.

Gao, S., Janovičs, K., Montello, DR, Hu, Y., Yang, JA, McKenzie, G., Ju, Y., Gong, L., Adams, B., & amp Yan, B. (2017. gads ). Datu sintēzes vadīta metode neskaidru kognitīvo reģionu noteikšanai un iegūšanai. Starptautiskais ģeogrāfiskās informācijas zinātnes žurnāls, 31(6), 1245-1271.

Gao, S., Li, L., Li, W., Janowicz, K., & amp Zhang, Y. (2017). Vēstnieku veidošana no brīvprātīgiem lieliem ģeogrāfiskiem datiem, kuru pamatā ir Hadoop. Datori, vide un pilsētas sistēmas, 61, 172-186.

Gao, S., Janowicz, K., McKenzie, G., & amp Li, L. (2013, novembris). Ceļā uz plašu savienojumiem un buferiem vietējā ĢIS. In Pirmā ACM SIGSPATIAL starptautiskā semināra materiāli par vietas skaitļošanas modeļiem (42.-49. lpp.).

Yan, B., Janowicz, K., Mai, G., & amp Gao, S. (2017. gads, novembris). No ITDL līdz Place2Vec: pamatojums par vietas tipa līdzību un saistību, apgūstot iegultojumus no paplašinātiem telpiskiem kontekstiem. In ACM SIGSPATIAL 25. starptautiskās konferences par ģeogrāfisko informācijas sistēmu sasniegumiem materiāli (35. lpp.). ACM.


POI datu kopas Ziemeļamerikai - ģeogrāfiskās informācijas sistēmas

Datu formāts: Personīgās ģeodatubāzes funkciju klase

Faila vai tabulas nosaukums: 04

Koordinātu sistēma: Universāls šķērsvirziena Mercator

Tēmas atslēgvārdi: Atlantijas lasis, biotopu apsekošana, interesantas vietas

FGDC un ESRI metadati:

Identifikācijas informācija:

Citāts: Citāta informācija: Radītāji: ASV Zivju un savvaļas dzīvnieku dienests - Menas līča piekrastes programma

Nosaukums: Apskates vietas *Faila vai tabulas nosaukums: 04

Publicēšanas datums: 20060331 *Ģeotelpisko datu prezentācijas veidlapa: vektoru digitālie dati

Lielāks citāts par darbu: Citāta informācija: Radītāji: Menas Atlantijas laša komisija

Nosaukums: Menas Atlantijas lašu biotopu apsekojumi

Publicēšanas datums: 20060131 Ģeotelpisko datu prezentācijas veidlapa: vektoru digitālie dati

Apraksts:

*Datu kopas valoda: lv

Satura laika periods: Informācija par laika periodu: Viens datums/laiks: Kalendāra datums: 20060331

Pilsēta: Falmouth Štats vai province: ES Pasta indekss: 04105 Valsts: ASV
Sazināties ar balss tālruni: 207-781-8364 Sazinieties ar faksa numuru: 207-781-8369

Sazinieties ar elektroniskā pasta adresi: [email protected]

Darba laiks: P – P 8–16


*Vietējās datu kopas formāts: Personīgās ģeodatubāzes funkciju klase *Vietējā datu kopas vide: Microsoft Windows XP versija 5.1 (versija 2600) 2. servisa pakotne ESRI ArcCatalog 9.1.0.722

Atpakaļ uz augšu Informācija par datu kvalitāti:

Atribūtu precizitāte:

Ciltsraksti: Informācija par avotu: Avota citāts: Citāta informācija: Radītāji: ASV zivju un dzīvnieku savvaļas dzīvnieku dienests - Menas līča piekrastes programma

Nosaukums: Menas Atlantijas lašu biotopu apsekojumi

Publicēšanas datums: 20060331 Ģeotelpisko datu prezentācijas veidlapa: vektoru digitālie dati

Cita citāta informācija: Trimble .ssf GPS failus diferencēti koriģē ar Trimble Pathfinder Office programmatūru, izmantojot Meinas Universitātes Kopienas bāzes stacijas datus.

Avota nesēja veids: disks

Procesa datums: 20060131

Procesa kontakts: Kontaktinformācija: Galvenā kontaktinformācijas organizācija: Sazināties ar organizāciju: ASV zivju un dzīvnieku savvaļas dzīvnieku dienests, Menas līča piekrastes programma
Kontaktadrese: Adreses veids: pasta adrese un fiziskā adrese

Pilsēta: Falmouth Štats vai province: ES Pasta indekss: 04105 Valsts: ASV
Sazināties ar balss tālruni: 207-781-8364 Sazinieties ar faksa numuru: 207-781-8369

Sazinieties ar elektroniskā pasta adresi: [email protected]

Darba laiks: P – P 8–16


Procesa solis:

Procesa solis:

Avots izmantoja citātu saīsinājumu: ALEX2000 C proj Alex gps2003 Habitat03Edit.mdb

Procesa solis:

Avota izmantotais citāta saīsinājums: ALEXXP C proj Alex gps2003 Habitat03.mdb

Procesa solis:

Procesa solis:

Avots izmantoja citātu saīsinājumu: ALEXXP proj Alex gps2005 Habitat05Edit.mdb

Procesa solis:

Avots izmantoja citātu saīsinājumu: ALEXXP proj Alex gps2005 Habitat05Edit.mdb

Procesa solis:

Avota izmantotais citāta saīsinājums: ALEXXP proj Alex gps2005 Habitat05Edit.mdb

Atpakaļ uz augšu Telpisko datu organizācijas informācija:

*Tiešās telpiskās atsauces metode: Vektors

Informācija par punktu un vektoru objektiem: SDTS terminu apraksts: *Vārds: PointsOfInterest04 *SDTS punkta un vektora objekta tips: Vienības punkts Punktu un vektoru objektu skaits: 2,607
SDTS terminu apraksts: SDTS punkta un vektora objekta tips: Punkts Punktu un vektoru objektu skaits: 4
SDTS terminu apraksts: SDTS punkta un vektora objekta tips: Salikts objekts Punktu un vektoru objektu skaits: 3
ESRI terminu apraksts: *Vārds: PointsOfInterest04 *ESRI funkcijas veids: Vienkāršs *ESRI pazīmju ģeometrija: Punkts *ESRI topoloģija: FALSE *ESRI funkciju skaits: 2427 *Telpiskais indekss: PATIESA *Lineārā atsauce: FALSE

Atpakaļ uz augšu Telpiskā atsauces informācija:

Horizontālās koordinātu sistēmas definīcija: Koordinātu sistēmas nosaukums: *Prognozētais koordinātu sistēmas nosaukums: NAD_1983_UTM_Zone_19N *Ģeogrāfisko koordinātu sistēmas nosaukums: GCS_North_American_1983
Planar: Režģa koordinātu sistēma: *Režģa koordinātu sistēmas nosaukums: Universāls šķērsvirziena Mercator Universālais šķērsvirziena Mercator: *UTM zonas numurs: 19 Šķērsvirziena merkators: *Mēroga faktors centrālajā meridiānā: 0.999600 *Centrālā meridiāna garums: -69.000000 *Projekcijas izcelsmes platums: 0.000000 *Viltus austrumi: 500000.000000 *Nepareizi ziemeļi: 0.000000
Plakņu koordinātu informācija: *Plakanisko koordinātu kodēšanas metode: koordinātu pāri Koordinātu attēlojums: *Abscisas izšķirtspēja: 0.010000 *Ordinācijas izšķirtspēja: 0.010000 *Plakanās attāluma vienības: metri
Ģeodēziskais modelis: *Horizontālā datuma nosaukums: 1983. gada Ziemeļamerikas datums *Elipsoīda nosaukums: Ģeodēziskā atskaites sistēma 80 *Daļēji galvenā ass: 6378137.000000 *Izlīdzināšanas koeficienta saucējs: 298.257222
Vertikālo koordinātu sistēmas definīcija: Augstuma sistēmas definīcija: Augstuma izšķirtspēja: 0.000010 Augstuma kodēšanas metode: Skaidra pacēluma koordināta iekļauta horizontālajās koordinātās
Atpakaļ uz augšu Informācija par būtību un atribūtiem:

Detalizēts apraksts: *Vārds: 04

Vienības veids: Vienības tipa etiķete: Apskates vietas *Vienības veida veids: Funkciju klase *Vienību veidu skaits: 2427 Vienības veida definīcija: Punktu atribūtu tabula Entītijas veida definīcijas avots: MASC
Atribūts: *Atribūtu iezīme: JoinID *Atribūtu aizstājvārds: JoinID

*Atribūta veids: String *Atribūta platums: 17 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Drenāža *Atribūtu aizstājvārds: Drenāža

*Atribūta veids: String *Atribūta platums: 20 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Tips *Atribūtu aizstājvārds: Tips

*Atribūta veids: String *Atribūta platums: 20 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūtu domēna vērtības: Uzskaitītais domēns: Uzskaitītā domēna vērtība: Piekļuve

Atribūtu vērtību sākuma datums: 2001 Atribūtu vērtību beigu datums: 2005

Atribūts: *Atribūtu iezīme: Iezīme *Atribūtu aizstājvārds: Iezīme

*Atribūta veids: String *Atribūta platums: 50 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Atlasīt_ *Atribūtu aizstājvārds: Atlasīt_

*Atribūta veids: Vesels skaitlis *Atribūta platums: 4 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūtu domēna vērtības: Uzskaitītais domēns: Uzskaitītā domēna vērtība: 0

Atribūtu vērtību sākuma datums: 2001 Atribūtu vērtību beigu datums: 2005

Atribūts: *Atribūtu iezīme: Komentārs *Atribūtu aizstājvārds: Komentēt

*Atribūta veids: String *Atribūta platums: 70 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Komentārs2 *Atribūtu aizstājvārds: Komentārs2

*Atribūta veids: String *Atribūta platums: 40 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: ObsType *Atribūtu aizstājvārds: ObsType

*Atribūta veids: String *Atribūta platums: 11 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūtu domēna vērtības: Uzskaitītais domēns: Uzskaitītā domēna vērtība: Bebrs

Atribūtu vērtību sākuma datums: 2000 Atribūtu vērtību beigu datums: 2005

Atribūts: *Atribūtu iezīme: Pieejams *Atribūtu aizstājvārds: Izturīgs

*Atribūta veids: String *Atribūta platums: 10 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūtu domēna vērtības: Uzskaitītais domēns: Uzskaitītā domēna vērtība:

Atribūtu vērtību sākuma datums: 2000 Atribūtu vērtību beigu datums: 2005

Atribūts: *Atribūtu iezīme: ObHeight *Atribūtu aizstājvārds: ObsHeight

*Atribūta veids: String *Atribūta platums: 10 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Objekta garums *Atribūtu aizstājvārds: Ilgums

*Atribūta veids: String *Atribūta platums: 11 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: DWDepth *Atribūtu aizstājvārds: DWDziļums

*Atribūta veids: String *Atribūta platums: 10 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Transportlīdzekļa_AC *Atribūtu aizstājvārds: Vehicle_AC

*Atribūta veids: String *Atribūta platums: 23 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūtu vērtību sākuma datums: 2000 Atribūtu vērtību beigu datums: 2005

Atribūts: *Atribūtu iezīme: Boat_Trail *Atribūtu aizstājvārds: Boat_Trail

*Atribūta veids: String *Atribūta platums: 23 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Kanoe_ceļš *Atribūtu aizstājvārds: Kanoe_Ace

*Atribūta veids: String *Atribūta platums: 23 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Orientācija *Atribūtu aizstājvārds: Orientācija

*Atribūta veids: String *Atribūta platums: 20 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Trib_Wetwidth *Atribūtu aizstājvārds: Trib_Wetwidth

*Atribūta veids: String *Atribūta platums: 14 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Trib_CtrDepth *Atribūtu aizstājvārds: Trib_CtrDepth

*Atribūta veids: String *Atribūta platums: 14 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Trib_Flow *Atribūtu aizstājvārds: Trib_Flow

*Atribūta veids: String *Atribūta platums: 14 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Trib_Velocity *Atribūtu aizstājvārds: Trib_Velocity

*Atribūta veids: String *Atribūta platums: 14 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Trib_Name *Atribūtu aizstājvārds: Trib_Name

*Atribūta veids: String *Atribūta platums: 30 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Trib_Temp *Atribūtu aizstājvārds: Trib_Temp

*Atribūta veids: String *Atribūta platums: 12 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: Atribūtu iezīme: Forma

Atribūtu domēna vērtības: Neprezentējams domēns: Koordinātas, kas nosaka pazīmes.

Atribūtu vērtību sākuma datums: 1994 Atribūtu vērtību beigu datums: 2005

Atribūts: Atribūtu iezīme: Straume

*Atribūta veids: String *Atribūta platums: 12 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Seep_Temp *Atribūtu aizstājvārds: Seep_Temp

*Atribūta veids: String *Atribūta platums: 12 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Datu fails *Atribūtu aizstājvārds: Datu fails

*Atribūta veids: String *Atribūta platums: 14 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Atribūts: *Atribūtu iezīme: Point_ID *Atribūtu aizstājvārds: Point_ID

*Atribūta veids: String *Atribūta platums: 10 *Atribūtu precizitāte: 0 *Atribūtu skala: 0

Detalizēts apraksts: *Vārds: Anno_POI

Vienības veids: *Vienības tipa etiķete: Anno_POI *Vienības veida veids: Attiecības Vienības veida definīcija: Anotāciju attiecību tabula Entītijas veida definīcijas avots: ESRI
Atribūts: Atribūtu iezīme: FID

Atribūtu domēna vērtības: Neprezentējams domēns: Secīgi unikāli veseli skaitļi, kas tiek ģenerēti automātiski.

Atribūts: Atribūtu iezīme: Forma

Atribūtu domēna vērtības: Neprezentējams domēns: Koordinātas, kas nosaka pazīmes.

Atribūts: Atribūtu iezīme: DISTANCE#

Atribūtu domēna vērtības: Neprezentējams domēns: Secīgi unikāli veseli skaitļi, kas tiek ģenerēti automātiski.

Atribūts: Atribūtu iezīme: DISTANCE-ID

Atpakaļ uz augšu Izplatīšanas informācija:

Izplatītājs: Kontaktinformācija: Galvenā kontaktinformācijas organizācija: Sazināties ar organizāciju: ASV zivju un dzīvnieku savvaļas dzīvnieku dienests - Menas līča piekrastes programma
Kontaktadrese: Adreses veids: pasta adrese un fiziskā adrese

Pilsēta: Falmouth Štats vai province: ES Pasta indekss: 04105 Valsts: ASV
Sazināties ar balss tālruni: 207-781-8364 Sazinieties ar faksa numuru: 207-781-8369

Sazinieties ar elektroniskā pasta adresi: [email protected]

Darba laiks: P – P 8–16


Resursa apraksts: Menas Atlantijas lašu biotopu apsekojums

Standarta pasūtīšanas process: Digitālā forma: Digitālās pārsūtīšanas informācija: Formāta nosaukums: ArcGIS personīgās ģeodatubāzes funkciju klase Versijas numura formāts: ArcGIS 9.1 Failu dekompresijas tehnika: kompresija nav piemērota
Digitālās pārsūtīšanas iespēja: Bezsaistes opcija: Bezsaistes multivide: CD ROM
Pieejamais laika periods: Informācija par laika periodu: Viens datums/laiks: Kalendāra datums: 20060331
Atpakaļ uz augšu Metadatu atsauces informācija:

*Metadatu datums: 20110913

*Metadatu valoda: lv

Metadatu kontaktpersona: Kontaktinformācija: Galvenā kontaktinformācijas organizācija: Kontaktpersona: Alekss Abots Sazināties ar organizāciju: ASV Zivju un savvaļas dzīvnieku dienests - Menas līča piekrastes programma
Kontaktadrese: Adreses veids: pasta adrese un fiziskā adrese

Pilsēta: Falmouth Štats vai province: ES Pasta indekss: 04105
Sazināties ar balss tālruni: 207-781-8364 Sazinieties ar faksa numuru: 207-781-8369

Sazinieties ar elektroniskā pasta adresi: [email protected]

Darba laiks: P – P 8–16


*Metadatu standarta nosaukums: FGDC satura standarti digitālajiem ģeotelpiskajiem metadatiem *Metadatu standarta versija: FGDC-STD-001-1998 *Metadatu laika vienošanās: vietējais laiks

Metadatu paplašinājumi: Tiešsaistes saite: http://www.esri.com/metadata/esriprof80.html Profila vārds: ESRI metadatu profils
Metadatu paplašinājumi: Tiešsaistes saite: http://www.esri.com/metadata/esriprof80.html Profila vārds: ESRI metadatu profils
Metadatu paplašinājumi: *Tiešsaistes saite: http://www.esri.com/metadata/esriprof80.html *Profila vārds: ESRI metadatu profils
Atpakaļ uz augšu Binārie korpusi:

Sīktēls: Korpusa tips: Bilde


Atpakaļ uz augšu Pēdējo reizi atjaunināts: 2011. gada 13. septembrī

Lūdzu, sazinieties ar Bobu Hjūstonu, GOMP ĢIS/sistēmu vadītāju, ja jums ir jautājumi par šo vietni. USFWS oficiālais paziņojums par konfidencialitāti.


Ziemeļamerikas jūras ekoreģioni

Šī datu kopa parāda Ziemeļamerikas jūras ekoreģionus. Jūras ekoreģioni ir apgabali, kas ietilpst Ziemeļamerikas valstu ekskluzīvajās ekonomiskajās zonās un kuriem ir vispārēja līdzība fizikāli, okeanogrāfiski un bioloģiski. Šie jūras ekoreģioni ir veidoti kā telpisks ietvars ar trim ligzdotiem līmeņiem. Dati ir paredzēti mērogojamībai: piemēroti perspektīvām un interesēm, kas atšķiras no reģionālā līdz kontinentālajam apjomam un ir vērsti uz ekosistēmām: pamatojoties uz virkni saistītu bioloģisko, okeanogrāfisko un fiziogrāfisko īpašību un ir saistīti: saistīti ar citām jūras un sauszemes datu kopām, klasifikācija sistēmas un disciplīnas.

24 I līmeņa jūras ekoreģioni aptver ekosistēmu atšķirības visplašākajā mērogā, apvienojot lielas ūdens masas un straumes, slēgtas jūras un reģionus ar saskaņotu jūras virsmas temperatūru vai ledus segumu. 86 II līmeņa jūras ekoreģioni aptver pārtraukumu starp krasta un okeāna apgabaliem, un robežas nosaka liela mēroga iezīmes, piemēram, kontinentālais šelfs, kontinentālais slīpums, lielākās tranšejas un citas iezīmes. II līmenis atspoguļo dziļuma kā kā arī galveno fiziogrāfisko pazīmju nozīme pašreizējo plūsmu noteikšanā un augšupejā. 86 III līmeņa jūras ekoreģioni aptver atšķirības krasta tuvumā un ir balstīti uz ūdens masas vietējām īpašībām, reģionālajām fiziogrāfiskajām iezīmēm un bioloģisko kopienu veidiem. III ekoreģioni ir definēti tikai kontinentālajam šelfam, jo ​​šī ir vienīgā okeāna teritorija, par kuru ir pieejama pietiekama informācija precīzākai norobežošanai.

Kartētās jūras ekoreģionu jūras robežas ir aptuvenas un neatspoguļo ekoreģionu faktiskās jūras robežas vai precīzu triju valstu ekskluzīvo ekonomisko zonu robežu.

Ziemeļamerikas atlanta dati ir paredzēti ģeogrāfiskai attēlošanai un analīzei valsts un kontinentālā līmenī. Šie dati jāparāda un jāanalizē mērogos, kas atbilst 1: 10 000 000 mēroga datiem. Vides sadarbības komisija neuzņemas atbildību par šos datus.

Ziemeļamerikas jūras ekoreģioni, 2008. gads, ir paredzēti, lai atbalstītu Ziemeļamerikas jūras resursu un ekosistēmu izpēti, izglītību, inventarizāciju, uzraudzību, plānošanu, pārvaldību un saglabāšanu.

Datus sniedzis: Autors: Vides sadarbības komisija
Publicēšanas datums: 2009
Nosaukums: Ziemeļamerikas jūras ekoreģioni, 2008
Ģeotelpiskā_datu_Prezentācijas_forma: vektoru digitālie dati
Publication_Information:
Publication_Place: Monreāla, Kvebeka, Kanāda
Izdevējs: Vides sadarbības komisija
Tiešsaistes_saite: http://www.cec.org/naatlas/
Datus mitina: ScienceBase (USGS) Skatīt ierakstu kartes pakalpojuma URL: https://www.sciencebase.gov/arcgis/rest/services/Catalog/52e185e0e4b0d0c3df9a39b7/MapServer/ Satura datums: nav norādīts Atsauce: Papildu informācija par jūras ekoreģionu datu kopa, tostarp metodoloģija, definīcijas, dalībnieku saraksts un papildu pamatinformācija, ir pieejama ziņojuma projektā Spaces: Marine Ecoregions of North America Commission for Environmental Cooperation Montréal, Québec, Canada 2007
Kontaktorganizācija: nav norādīta Kontaktpersona (-s): nav norādīts Lietošanas ierobežojumi: Šis darbs ir licencēts saskaņā ar Creative Commons Attribution 3.0 licenci.

POI datu kopas Ziemeļamerikai - ģeogrāfiskās informācijas sistēmas

Papildus failu formātiem ir svarīgi arī izstrādāt dokumentāciju, tostarp metadatus, lai atvieglotu saglabāšanu, datu atklāšanu un atkārtotu izmantošanu. Dokumentācija ir viens no arhīvu prakses stūrakmeņiem, un tai vajadzētu būt pašai, lai atvieglotu projektu datu pārvaldību. Kā uzsvērts, identificējot failu tipus, dokumentācijas process ir aktīvi jāturpina jau no paša projekta sākuma, jo to bieži ir grūti izveidot retrospektīvi. Lai gan dokumentācija (kā informācija) bieži tiek iekļauta pašos failos, šīs informācijas saglabāšana atsevišķi ne tikai atvieglo resursu atklāšanu un datu pārvaldību, bet arī ļauj pašiem failiem veikt transformāciju (saglabāšanu vai citādi), neietekmējot saistīto metadatu vai dokumentācijas integritāti .

Metadatu un dokumentācijas komponenti, kas jāiekļauj jūras arhīvā, ir izklāstīti 3.1. Sadaļā Izlemšana, ko arhivēt, un detalizēta metadatu kopa ir norādīta 3.8. Sadaļā Metadati un dokumentācija. Tomēr pašlaik pastāv arī vairāki metadatu standarti, kas ir ļoti svarīgi attiecībā uz jūras datiem, un tie tiks apspriesti nākamajā sadaļā, kā arī sadaļās, kas koncentrējas uz īpašām jūras apsekošanas metodēm.

Jūras projektu metadati

Kā minēts iepriekš, ir svarīgi, lai metadati tiktu izveidoti, kamēr projekta dati tiek aktīvi ģenerēti un apstrādāti. Tieši šajos punktos satura veidotājiem ir skaidrākais priekšstats par to, kādu informāciju katrs fails satur, kur tas tika savākts, kā tas tika savākts un kā tas vēlāk tika apstrādāts. Metadati un dokumentācija, kā arī palīdzība datu pārvaldībā un vākšanā projekta ietvaros, ir izstrādāta, lai palīdzētu citiem atklāt, atkārtoti izmantot, interpretēt un pārvaldīt datus.

Metadatus var izmantot, lai dokumentētu daudzus dažādus projekta aspektus dažādos līmeņos. To var plaši ierakstīt projektam kopumā vai datu kopām, sākot no īpašām metodēm līdz pat metadatiem konkrētiem failiem. Veidojot metadatus, ir svarīgi, ja iespējams, identificēt un ievērot atbilstošus un izveidotus metadatu un dokumentācijas standartus. Ir arī svarīgi saprast, ka metadatu standarti atšķiras ne tikai atkarībā no attiecīgajām metodēm, bet arī atkarībā no ģeogrāfiskā reģiona. Ja ilgtermiņa saglabāšana digitālajā arhīvā ir viens no projekta plānotajiem mērķiem, tad ir jānosaka metadatu standarti, ko pieprasa attiecīgais arhīvs. Šīs sadaļas mērķis ir noteikt vairākus izveidotus metadatu standartus, kas īpaši attiecas uz jūras projektu datiem.

Vispārējie jūras datu standarti

Ģeogrāfiskajiem metadatiem ir īpaša nozīme jūras projektos, ņemot vērā iegūšanas metožu ievērojamo ģeogrāfisko komponentu. Būtībā visām jūras izejvielām, neapstrādātām vai apstrādātām, ir telpisks elements, kas definēts kā reģions vai īpašs punkts. Gan valsts, gan starptautiskā līmenī ir izstrādāti vairāki standarti, kas attiecas uz ģeogrāfiskajiem datiem, un ir ieteicams, lai datu veidotāji tos apzinātos, jo uz tiem bieži atsaucas konkrētos jūras metadatu standartos.

  • ISO 19115: 2003 Ģeogrāfiskās informācijas standarts - metadati [1] nosaka obligātās un nosacītās metadatu sadaļas, metadatu entītijas un metadatu elementus ģeogrāfiskās informācijas aprakstīšanai. Standarts arī nosaka minimālo metadatu kopumu, kas nepieciešams, lai apkalpotu pilnu lietojumprogrammu klāstu (datu atklāšana, datu piemērotības lietošanai noteikšana, piekļuve datiem, datu pārsūtīšana un digitālo datu izmantošana). Turklāt ir aprakstīti neobligāti metadatu elementi, kas ļauj iegūt plašāku ģeogrāfisko datu standarta aprakstu, kas ļauj paplašināt metadatu kopas, lai tās atbilstu specializētām vajadzībām.
  • AK GEMINI (Association for Geographic Information, 2010) ir Apvienotās Karalistes metadatu standarts (atbilst ISO 19115) ģeotelpisko datu kopām.
  • ISO 19115 [2] Ziemeļamerikas profils (NAP) ir ISO standarta ASV variants.

Ir vērts atzīmēt, ka saskaņā ar INSPIRE direktīvu [3] Eiropas valstīm, visticamāk, tiks izstrādātas citas reģionalizētas specifikācijas.

Lai gan liela daļa informācijas, kas šķiet svarīga jūras projektu datu veiksmīgai pārvaldībai un atkārtotai izmantošanai, acīmredzami neietilpst ISO standartā, šo informāciju var iekļaut noteiktos standarta elementos. Piemēram, metadati par izmantoto aprīkojumu, iestatījumiem, metodoloģiju, precizitāti un programmatūru, kā sīki aprakstīts šīs rokasgrāmatas 3. sadaļā, var iekļauties Apvienotās Karalistes GEMINI (vai citā INSPIRE atbilstošā Eiropas ekvivalentā) Anotācija elements, uz kuru specifikācija norāda lietošanas ziņā:

  • Norādiet, kas ir “lietas”, kas tiek ierakstītas
  • Norādiet galvenos aspektus, kas reģistrēti saistībā ar šīm lietām
  • Norādiet, kāda ir datu forma
  • Norādiet jebkuru citu ierobežojošu informāciju, piemēram, datu derīguma termiņu
  • Ja nepieciešams, pievienojiet datu resursa mērķi (piemēram, aptaujas datiem)
  • Mērķis, lai to saprot nespeciālisti
  • Neiekļaujiet vispārīgu pamatinformāciju
  • Izvairieties no žargona un neizskaidrojamiem saīsinājumiem.

Alternatīvi Papildu informācijas avots elementu varētu izmantot, lai norādītu uz saistīto dokumentāciju, piemēram, īsu pārskata pārskatu. Attiecību elementa trūkumu ISO 19115 metadatu komplektā var uzskatīt par trūkumu. Šādu informāciju var ierakstīt arī saistītajā dokumentācijā, kas norādīta dokumentā Papildu informācijas avots elements. Daži ISO 19115 standarti atbalsta a Ciltsraksti elements, ko var izmantot, lai ierakstītu “informāciju par notikumiem vai avota datus, kas izmantoti datu kopas izveidē”. Pēdējais ir īpaši svarīgs izplatītu arhīvu gadījumā, ja avota datus un atvasinātās datu kopas var arhivēt kopā ar dažādām organizācijām. Tomēr līnija ir tikai viena no daudzajām iespējamām attiecībām, kas varētu būt digitālajam objektam vai datu kopai.

Jūras specifiskie standarti

Kā izklāstīts šīs rokasgrāmatas 1.3. Iedaļā (“Pašreizējie noteikumi un iniciatīvas”), ir vairākas iniciatīvas gan valsts, gan starptautiskā līmenī, kas pašlaik strādā pie standartu noteikšanas, metadatu koplietošanas un piekļuves nodrošināšanai jūras datu kopām. Kaut arī konkrēta vispārīga metadatu kopa ir aprakstīta šīs rokasgrāmatas 3. sadaļā, datu veidotājiem jāapzinās, ka dažiem datu centriem būs īpašas prasības.

Starptautiskā hidrogrāfijas organizācija (IHO) ir sagatavojusi dokumentu “Telpisko datu infrastruktūras” un “Jūras dimensija” (2009), kurā ieteikts izveidot metadatus, lai pareizi raksturotu jūras datus, atvieglotu datu atklāšanu, izgūšanu un atkārtotu izmantošanu un ka tiem jāatbilst ISO 19115 standartu, lai nodrošinātu pilnīgu savietojamību. Jo īpaši dokumentā uzsvērts, cik svarīgi ir reģistrēt izmantotās ģeogrāfiskās atsauces sistēmas. Turklāt iepriekšējā dokumentā (IHO 2008, 5. nodaļa) ir izklāstīti IHO ieteiktie metadatu elementi, kas jāreģistrē, lai novērtētu apsekojuma datu kopu kvalitāti.

Apvienotajā Karalistē MEDIN ir izdevusi vairākus dokumentus, kuros izklāstīti metadatu elementi, kas jāreģistrē, iesniedzot datus saviem datu centriem. MEDIN datu pamatnostādņu struktūrā [4] ir izklāstīti konkrēti metadati, kas jāreģistrē datu vākšanas laikā, un tā ietver projekta līmeni, aptaujas informāciju un stacijas informāciju (cita starpā). Turklāt MEDIN ir noteikts “standarta atklāšanas metadatu” komplekts, standartiem atbilstoša (INSPIRE, ISO19115, GEMINI2) specifikācija, ko izmanto, lai standarta un viegli koplietojamā veidā ierakstītu datu kopas metadatus. Paši elementi ir aprakstīti rakstā Seeley un citi (2009), un vairāki metadatu izveides rīki ir pieejami MEDIN tīmekļa vietnē [5]. MEDIN tīmekļa vietnē ir arī vairākas saites uz ārējiem jūras standartiem [6].

Ziemeļamerikā pastāv vairākas specifikācijas papildus vispārējai ģeotelpiskajai specifikācijai, kas izklāstīta NAP ISO19115 un satura standartam digitālajiem ģeotelpiskajiem metadatiem (CSDGM) [7] (pastāv arī atbalsta rokasgrāmatas, kas palīdz izveidot šos metadatus [8] [9] ]). ASV Nacionālā okeanogrāfisko datu centra (NODC) datu iesniegšanas rokasgrāmatā [10] ir izklāstīta minimālā datu izveides metadatu specifikācija (4. sadaļa) jūras datiem, un tā darbības joma ir līdzīga Nacionālās telpisko datu infrastruktūras (2005) dokumenta “Ģeotelpiskās pozicionēšanas precizitātes standartu daļa” darbības jomai. 5: Jūras kartēšanas hidrogrāfisko apsekojumu standarti ”. Ir arī vērts atzīmēt, ka jūras metadatu savstarpējās izmantojamības (MMI) projektā [11], kas tika izveidots, lai sniegtu norādes par jūras metadatiem Ziemeļamerikā, šķiet, ir daudz procesu, lai atvieglotu metadatu apmaiņu, un tas var nodrošināt būtisku pašreizējās situācijas noskaidrošanu un attīstību nākotnē.

Papildu dokumentācija

Tas ietver jebko, kas atvieglos datu kopas saglabāšanu un atkārtotu izmantošanu. Tas varētu būt, piemēram, publicēti ziņojumi, īsi pelēkas literatūras ziņojumi vai pat dažas skenētas lapas no piezīmjdatora. Tie var sniegt informāciju, kas trūkst, atbalsta vai ir detalizētāka par metadatu ierakstiem. Viņi bieži var sniegt papildu kontekstuālu informāciju par to, kā datu kopa sader kopā. Dokumentācija var būt īpaši saistīta ar jūras projektu datiem, ja vairākas apsekošanas metodes ietver virkni šķērsojumu telpiski noteiktā apgabalā. Kompozītu mozaīkas var izgatavot kā daļu no iegādes vai pēcapstrādes. Pēdējā gadījumā ir ļoti svarīgi dokumentēt, kā dati par katru šķērsojumu ir saistīti ar citiem. Pastāv iespēja izmantot Papildu informācijas avots vai līdzīgu elementu ISO 19115 atbilstošā metadatu standartā, lai norādītu uz šādu informāciju. To var pastiprināt arī stingra un ievērota failu nosaukumu konvencija.

[1] http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=26020
[2] http://www.fgdc.gov/metadata/geospatial-metadata-standards#nap
[3] http://inspire.jrc.ec.europa.eu/index.cfm/pageid/48
[4] http://www.oceannet.org/marine_data_standards/medin_data_guide2.html
[5] http://www.oceannet.org/marine_data_standards/medin_disc_stnd.html
[6] http://www.oceannet.org/marine_data_standards/other_marine_data_standards/
[7] http://www.fgdc.gov/metadata/geospatial-metadata-standards
[8] http://www.fgdc.gov/metadata/metadata-publications-list
[9] http://www.fgdc.gov/metadata/online-metadata-resources
[10] http://www.nodc.noaa.gov/General/NODC-Submit/submit-guide.html
[11] http://marinemetadata.org/


POI datu kopas Ziemeļamerikai - ģeogrāfiskās informācijas sistēmas

BJ Holtgreve, vecākais produktu vadītājs/tehniskais evaņģēlists MapPoint, stāsta par telpisko datu importētāju

Uzņēmējdarbības kartēšanas funkcionalitātes pasaule, kas tiek nodrošināta MapPoint 2002, ir salīdzinoši bagāta, ja tā tiek saskaņota ar augstākās klases funkcijām, ko nodrošina tradicionālās ģeogrāfiskās informācijas sistēmas (GIS). Pēc dizaina MapPoint ir paredzēts galalietotājiem, kuri meklē ikdienas biznesa kartēšanas risinājumu, un pēc dizaina nav nepieciešams grāds kartogrāfijā.

Tipisks zināšanu darbinieks zina, ko vēlas darīt ar kartēm, bet uzskata tās par papildinājumu viņu parastajai ikdienas darbībai un misijai, nevis galarezultātam. Ieguvumi no bagātīgas adrešu atrašanas, maršruta plānošanas, iekļauti demogrāfiskie dati, detalizētas integrētas kartes un iespēja to visu apkopot kopā ar viegli saprotamu Office ģimenes lietojumprogrammu, lai iekļautu savus datus, kas jau ir saglabāti Microsoft Excel, Access, Outlook, SQL Ar serveri vai tekstu norobežoti faili vienkārši pazemina sarežģītības pakāpi un ļauj tiem bez grūtībām veikt reālu darbu ar kartēm.

Spektra otrā galā ir kartogrāfu auditorija, kas dzīvo un elpo kartēšanas problēmas katru dienu, izmantojot augstas klases ĢIS lietojumprogrammas, piemēram, tādas, ko nodrošina tādi uzņēmumi kā ESRI un MapInfo. Kartogrāfam ir padziļināta izpratne par telpiskajām datu kopām un to, kā tās maksimāli izmantot. Tie var sniegt vērtīgu ieskatu problēmās, kuru atrisināšana var būt ļoti sarežģīta, un daudzas reizes ir nepieciešams izveidot, modificēt un uzturēt bāzes kartes.

Šai tradicionālajai ĢIS pasaulei ir vajadzīgs tāds telpiskās apziņas līmenis un tehniskās zināšanas, kas daudziem uzņēmumiem un uzņēmējdarbības vajadzībām tiktu uzskatīta par pārmērīgu un grūti attaisnotu naudu un laiku. Tas nenozīmē, ka tie nav svarīgi. Ja nebūtu Microsoft kartogrāfu prasmju un centību, MapPoint izmantotās bāzes kartes nepastāvētu. Bez augstākās klases ĢIS lietojumprogrammām nebūtu iespējams veikt vērtīgu, bet sarežģītu telpiskās analīzes līmeni, ko izmanto valsts aģentūras un lielie uzņēmumi.

Abi šī kontinuuma gali sniedz unikālas iezīmes un kalpo svarīgiem mērķiem. Līdz šim galvenā problēma ir plaisa starp šīm divām pieejām, kas neļauj galalietotājam izmantot abu pieeju priekšrocības. Realitāte ir tāda, ka noteiktā reālās pasaules scenāriju skaitā lietotāji varētu gūt milzīgu labumu, ja šīm divām kartēšanas pasaulēm būtu iespēja viegli sadarboties. Izpētīsim pieeju, izmantojot jauno MapPoint 2002 paplašināto objektu modeli, kas nodrošina līdzekli, lai izveidotu tiltu starp tiem līdz saistītām, bet sadalītām pieejām.

Tilta celtniecības materiāls

Acīmredzamākais kopīgais elements, kas ir kopīgs starp augstākās klases ĢIS sistēmām un MapPoint 2002, ir to telpisko datu kopu izmantošana, taču pieeja katrai ir unikāla. ESRI lietotāji var izveidot un koplietot SHAPE failus. MapInfo lietotāji var izveidot un koplietot TAB un MIF formāta failus. Ir pat trešo pušu programmatūras produkti, kas paredzēti datu kopu vieglai pārsūtīšanai no viena formāta uz otru.

Šie ĢIS failu formāti tiek izmantoti gan bāzes karšu, gan atbilstošo galalietotāju datu slāņu glabāšanai. Pamata karšu kvalitāte un pārklājums ir atkarīgs no avota un modifikāciju un labojumu apjoma, ko galalietotājs varētu veikt. Tā var būt ļoti laba lieta vai ļoti satraucoša darbība. Ja esat kartogrāfs, kas veic augstākās klases analīzi, vai jums ir nepieciešama iespēja mainīt bāzes karti, jūs to uzskatāt par būtisku.

Turpretī MapPoint izmanto ļoti plašas integrētas bāzes kartes, kuras nevar mainīt. Šajās kartēs ir iekļautas politiskās un administratīvās robežas (piemēram, tautas skaitīšana, pasta indeksi, apgabali, metropoles teritorijas, valstis, valstis utt.) Un plašs transporta tīkls.

Ziemeļamerikas 2002. gada izdevums ietver vairāk nekā 6,4 miljonus pielāgojamu ielu un ceļu. 2002. gada Eiropas izdevumos ir iekļauti vairāk nekā 4,8 miljoni iebraucamu ielu un ceļu. Ceļu tīklos ir iekļauti apgriezienu ierobežojumi, vienvirziena braukšana un piecas dažādas ātruma klasifikācijas. Kartes ietver arī plašu apdzīvotu vietu un interesantu vietu (POI) kolekciju. Šo bāzes karšu avoti ietver telpisko datu pārdevējus Navigation Technologies, Geographic Data Technologies Inc., CompuSearch, Inc. un datus, ko Microsoft apkopojusi un izstrādājusi pēdējo desmit gadu laikā.

Plaši pētījumi rāda, ka lielākā daļa galalietotāju vēlas izmantot kartes, nevis tās iegūt, izveidot un uzturēt. Ņemot vērā plašo pārklājumu, ko nodrošina Ziemeļamerikas un Eiropas MapPoint izdevumi, mūsdienās vienkārši nav pieejamas labākas kartes, tāpēc problēmas, kas saistītas ar jūsu karšu "rullēšanu", pazūd.

Pēc konstrukcijas MapPoint kartes nevar aizstāt ar savām kartēm, izmantojot rakstā aplūkoto pieeju, vai ar kādu citu metodi, taču, to darot, tiktu atcelta viena no galvenajām MapPoint priekšrocībām. Jums arī jāapzinās, ka MapPoint 2002 nav paredzēts SHAPE, TAB vai MIF skatītājam.

Bet ko tad, ja jūs varētu paņemt savus ĢIS failus un importēt tos MapPoint failos? Vai tas nodrošinātu integrācijas līmeni, kas nodrošināja reālu vērtību?

Izpētīsim, kā to izdarīt, izmantojot Visual Basic, lai izveidotu MapPoint 2002 COM pievienojumprogrammu un paplašinātu MapPoint 2002 objekta modeli.

ĢIS datu kopu importēšana MapPoint

MapPoint 2002 spēja strādāt saskaņā ar telpiskajām datu kopām, kas izveidotas MapInfo un ESRI formātos, ir iezīme, ko ir pieprasījuši daudzi uzņēmuma klienti. Priekšrocības, ko tas sniegtu, ietver:

1. Sarežģītu vai smalkāku formu integrēšana MapPoint, kas izveidota, izmantojot augstākās klases ĢIS algoritmus vai telpiskās datu kopas, kas iegūtas vai izveidotas ĢIS sistēmās.
2. Veicināt vienkāršākus telpiskos vaicājumus un Excel, Access, Outlook un SQL Server datu integrāciju.
3. Nodrošiniet veidu, kā apvienot datu kopas, kas tika izveidotas atsevišķi GIS un MapPoint vidēs.
4. Viegla karšu izplatīšana galalietotājiem, kas satur plašus datus kopā.

Šo paplašinājumu var izveidot vai nu kā COM pievienojumprogrammu, vai arī izveidojot Visual Basic lietojumprogrammu, izmantojot jauno MapPoint 2002 ActiveX vadīklu. Tā nav gatava funkcija, bet gan piemērs tam, kā MapPoint var funkcionāli kļūt par daudzām papildu jomām.

Mēs izveidojām MapPoint COM pievienojumprogrammas paraugu programmā Visual Basic, kurā tiek izmantotas jaunās paplašinātās MapPoint objekta modeļa metodes un tiek ņemtas vietējās avota ĢIS punktu datu kopas un importētas tās kā MapPoint spraudpogu kopas kopā ar jebkuru vietējo attiecinājumu, kas saistīts ar katru punktu (piemēram, vārds, adrese, platums/garums utt.). Vietējos ĢIS daudzstūrus, daudzsvītras līnijas, taisnstūrus un noapaļotus taisnstūrus var importēt, lai izveidotu MapPoint zīmēšanas objektu slāni, ko var parādīt MapPoint kartē. Parauga koda kopiju un "strādājošo" .dll COM pievienojumprogrammu var atrast vietnē http://msdn.microsoft.com/mappoint.

Izmantojot MapPoint objekta modeļa funkcijas, varat iestatīt līnijas krāsu un izmēru, formas aizpildījuma krāsu un pat pārvietot daudzstūrus un līnijas aiz MapPoint ceļu tīkla.

Liela daļa no šī parauga koda ir vairāk saistīta ar ESRI SHAPE failu un MapInfo MIF failu lasīšanu. No šiem failiem iegūtās informācijas iegūšana un ievietošana MapPoint kartē ir vienkāršā daļa.

Kad poligoni ir importēti MapPoint, tos var izmantot, lai vizualizētu un veiktu telpiskus vaicājumus (t.i., point-in-poly vaicājumus VB kodā un eksportēšanu uz Excel, izmantojot MapPoint lietojumprogrammas lietotāja saskarni) par visiem MapPoint datu slāņiem. Tie var ietvert MapPoint spiedpogu kopu vaicājumus vai demogrāfiskos vai galalietotāju datus, kas parādīti MapPoint ēnotajā apgabalā, ēnotā aplī, lieluma aplī, vairāku simbolu, sektoru diagrammas, lieluma sektoru diagrammas, kolonnu diagrammas un/vai sēriju kolonnu diagrammas datu kopās. Vaicājumi var ietvert vairākus informācijas slāņus vienlaikus.

Šis paraugs un papildu funkcionalitāte, kas pieejama, izmantojot objekta modeli, apmierinās daudzus galalietotājus, taču tai būs dabiskas robežas, kas neapmierinās ekstremālās situācijas.

Lai gan šis GIS importēšanas piemērs parāda, kā importēt ĢIS līnijas un polilīnijas, ir svarīgi ņemt vērā, ka tās nevar pievienot MapPoint transportēšanas slānim un nebūs maršrutējamas. Ciktāl tas attiecas uz MapPoint, tās ir tikai vienkāršas līnijas un polilīnijas.

Šis parauga kods neatbalsta tādu formu importēšanu, kurās ir caurumi. Laiku pa laikam ĢIS sistēmu datu kopās būs "virtuļa" formas objekti.

Šis paraugs funkcionāli nenodrošina importēto ĢIS slāņu eksportēšanu no MapPoint. Vajadzētu būt iespējai rakstīt šādu līdzekli, taču tam būtu nepieciešama plašāka Visual Basic kodēšana.

Ņemiet vērā, ka MapPoint COM pievienojumprogramma, Visual Basic Code un ESRI un MapInfo telpiskie faili ir tikai paraugi, kas tiek izmantoti, lai izceltu iespējas, taču var gadīties, ka COM pievienojumprogramma labi darbojas ar mūsu failiem bez izmaiņām. Varat arī ņemt parauga kodu un pēc vajadzības to pagarināt un modificēt.

ESRI SHAPE failu un MapInfo failu importēšana MapPoint 2002 kartē ir tikai viens piemērs tam, kā izstrādātājs var paplašināt MapPoint funkcionāli, izmantojot jauno paplašināto objektu modeli. Šis paplašinājums ir izveidots vai nu kā COM pievienojumprogramma, vai arī izveidojot Visual Basic lietojumprogrammu, izmantojot jauno MapPoint 2002 ActiveX vadīklu. Tā nav gatava funkcija, bet piemērs tam, kā MapPoint var funkcionāli kļūt par daudzām papildu jomām.

MapPoint 2002 ir paredzēts ikdienas biznesa kartēšanai, un ļoti tehniskas un sarežģītas ĢIS problēmas mēs atstājam ĢIS lietojumprogrammu ziņā. Ja vēlaties izveidot un modificēt savas telpiskās datu kopas, es ieteiktu izmantot tādas ĢIS lietojumprogrammas kā ESRI un MapInfo. Ja vēlaties integrēt telpisko datu kopu priekšrocības ar MapPoint jaudu, jums patiks šis koda paraugs.

Apspriediet šo stāstu forumā. Autors: BJ Holtgrewe
E -pasts: bjholt (AT) microsoft.com
URL: http://www.microsoft.com
BJ Holtgreve ir Microsoft biznesa rīku nodaļas vecākais produktu vadītājs/tehniskais evaņģēlists. Viņš katru nomoda stundu pavada, izplatot Microsoft uz atrašanās vietu balstīto produktu, tostarp MapPoint, evaņģēliju klientiem, izstrādātājiem, programmatūras pārdevējiem, Microsoft sertificēto risinājumu sniedzējiem un gandrīz ikvienam citam, kas klausīsies - jums paliks paliekošas atmiņas, ja sēdēsit viņam blakus garš lidojums! Būdams ģeogrāfijas produktu vienības loceklis, BJ palīdz veidot redzējumu par Microsoft produktiem, kuriem ir ģeogrāfiskas un atrašanās vietas zinošas funkcijas.

Pirms tehniskā evaņģēlista lomas BJ kalpoja kā MapPoint produktu plānotājs. Kad viņš pirmo reizi pievienojās komandai, viņš kalpoja kā vadošais programmu vadītājs Microsoft karšu veidošanas sistēmā. BJ pašlaik ir izveidota Microsoft .NET iniciatīvā, un tai ir divi patenti atrašanās vietas izpratnes jomā. Viņš ir runātājs daudzās konferencēs un semināros, un šobrīd viņš raksta grāmatu par MapPoint 2002.

Pirms dzīves Microsoft, viņš bija projektu un dizaina konsultants un strādāja programmatūras uzņēmumos austrumu krastā un Eiropā. Brīvajā laikā viņam patīk ceļot pa pasauli (kādam jāpārbauda karšu precizitāte!). Viņam ir neārstējama apetīte pēc Eiropas profesionālā riteņbraukšanas un vecām drukātām kartēm. Vēl agrāk BJ bija dedzīgs izpletņlēkšanas instruktors, starptautiski novērtēts izpletņlēkšanas tiesnesis un zemūdens meklēšanas un atveseļošanās nirējs.