Suite

Création d'une couche de polygones à partir d'un raster

Création d'une couche de polygones à partir d'un raster


J'utilise ArcGIS 10.2 afin de créer des zones de gestion des sols pour les agriculteurs. lorsque j'utilise l'outil raster en polygone, il crée de petits triangles à partir des polygones et des bords irréguliers qui sont des zones d'apparence très irréalistes. J'ai utilisé l'outil polygone lisse, ainsi que le quartet, les statistiques focales et le filtre majoritaire alors que les fichiers sont encore un raster afin de réduire le nombre de zones. Avez-vous des idées sur un moyen efficace de changer ces zones de raster en vecteur et de les rendre réalistes ?


Tout d'abord… Est-ce que cela utilise la bascule de généraliser les polygones ou non ? Activer cette option peut être suffisant pour votre objectif. Gardez à l'esprit l'échelle de données prévue par rapport à l'échelle de présentation. Ma suggestion ci-dessous est purement pour la présentation. Maquillage sur un cochon… Aucune infraction signifiait…

Bien qu'il s'agisse de données catégorielles, vous pouvez obtenir une sortie plus naturelle à partir d'une interpolation plutôt que d'une conversion. Vous ne savez pas comment vos SMU sont organisées, mais vous auriez besoin d'avoir chaque type avec un numéro unique, éventuellement organisé dans un ordre de tri supposé par taille de particule. Créez ensuite des contours et polygonisez-les. Si les attributs ne se présentent pas bien, convertissez votre raster en point et joignez les points aux polygones. Il y a probablement des artefacts où la boue se transforme en substrat rocheux ou en rocher… Ce genre de chose. Vous pouvez également essayer de rééchantillonner votre raster à une taille de cellule plus petite et de jouer avec votre type d'interpolation. Le voisin le plus proche est ce que vous devriez utiliser, mais selon le changement de taille de cellule et le degré de lissage que vous recherchez… Quelque chose d'autre pourrait vous donner un résultat plus naturel… gardez à l'esprit qu'il ne s'agit plus de données cependant… Juste illustratif


Types forestiers européens : vers une classification automatisée

Le résultat de la présente étude conduit à l'application d'un algorithme de système expert basé sur des règles (RBES) spatialement explicite visant à classer automatiquement les zones forestières selon le système de nomenclature des types de forêts européennes (EFT) à l'échelle paneuropéenne. Avec le RBES, le système de nomenclature EFT peut désormais être facilement mis en œuvre pour une classification objective, reproductible et automatique des parcelles de terrain pour les inventaires forestiers ou des unités spatiales (pixels ou polygones) pour la cartographie thématique.

Le contexte

Les systèmes de classification des types forestiers visent à stratifier les habitats forestiers. Depuis 2006, un schéma commun de classification des forêts européennes en 14 catégories et 78 types (European Forest Types, EFT) existe.

Ce travail présente une méthode innovante et un système de classification automatisé qui, de manière objective et reproductible, permet de classer avec précision un habitat forestier donné selon le système de nomenclature EFT.

Méthodes

Un système expert basé sur des règles (RBES) a été adopté comme approche transparente après comparaison avec le système bien connu de classification des forêts aléatoires (RF). L'expérimentation a été réalisée sur la base des informations acquises sur le terrain en 2010 sur des parcelles ICP de niveau I dans 17 pays européens. La précision de la classification automatisée est évaluée par comparaison avec une classification indépendante des parcelles ICP en EFT réalisée lors de l'enquête de terrain du projet BioSoil. Enfin, le classificateur automatisé RBES a également été testé pour une classification basée sur des pixels d'une carte de répartition paneuropéenne des forêts dominées par le hêtre.

Résultats

Le RBES a classé avec succès 94% des parcelles, contre 92% obtenu avec RF. Appliquée au domaine cartographié, la précision obtenue avec le RBES pour la classification cartographique de la hêtraie était égale à 95 %.

Conclusion

L'algorithme RBES a réussi à classer automatiquement les parcelles de terrain et les pixels de la carte sur la base du système de nomenclature EFT. Le système de nomenclature EFT peut désormais être facilement et objectivement mis en œuvre dans les programmes opérationnels transnationaux de surveillance des forêts européennes.


2. ARRIÈRE PLAN

L'identification d'emplacements appropriés pour les éoliennes terrestres nécessite l'évaluation d'une gamme de paramètres largement géospatiaux. En conséquence, il y a eu une utilisation intensive des systèmes d'information géographique (SIG) qui sont conçus pour capturer, stocker, manipuler, analyser, gérer et présenter des données spatiales ou géographiques [6]. De telles approches SIG sont souvent associées à une analyse décisionnelle multicritère (MCDA) pour fournir une méthode d'interprétation des données géospatiales et de classement des options potentielles à partir des données du modèle.

Les premiers développements de la modélisation GIS-MCDA de l'éolien terrestre ont commencé à la fin des années 1990 [ 7, 8]. Ces dernières années, il y a eu un intérêt international important pour modéliser l'adéquation des sites d'éoliennes, et une gamme de méthodes ont été développées [9–25]. Ces modèles sont généralement constitués des étapes illustrées à la figure 1. Premièrement, les paramètres d'entrée sont sélectionnés couvrant les aspects environnementaux, techniques et sociaux. Par exemple, les sites idéaux sont généralement identifiés comme ayant des vitesses de vent moyennes élevées, ne se trouvant pas à proximité des zones urbaines, ni dans des paysages protégés (par exemple, les parcs nationaux), ni à proximité des aéroports (pour minimiser les interférences radar), à proximité des routes d'accès et enfin, à proximité des lignes électriques. pour le raccordement au réseau. Chaque emplacement est ensuite évalué en fonction de ces paramètres d'entrée, et les zones incompatibles sont exclues d'une analyse plus approfondie, telles que les zones qui ont déjà été développées (routes et bâtiments).

Un aperçu de la structure typique des méthodologies GIS-MCDA.

Un aperçu de la structure typique des méthodologies GIS-MCDA.

Une préoccupation concernant le WSM est que la méthode est souvent appliquée sans aucune idée de la signification de deux éléments critiques : les poids attribués aux couches d'attributs et les procédures de combinaison des couches [ 6]. Alors que des méthodes telles que la procédure analytique hiérarchique (AHP) ont été utilisées pour réduire la subjectivité de la pondération des paramètres [19], les modèles restent très sensibles aux pondérations utilisées. Dans plusieurs études, la sélection des paramètres de pondération n'a pas été entièrement expliquée [ 7, 14, 25, 26], et, en tant que tel, on craint que les résultats du modèle fournissent l'emplacement sous-optimal du développement potentiel d'éoliennes.

Pour répondre aux préoccupations liées à la pondération des paramètres, il y a eu un intérêt accru pour l'évaluation quantitative des paramètres qui influencent la probabilité que les éoliennes reçoivent un permis de construire [27, 28]. Cette approche a récemment été intégrée dans la modélisation SIG pour évaluer l'influence des paramètres géospatiaux au Royaume-Uni [ 5]. Cela peut être considéré comme une forme d'analyse SIG rétrospective, où la distribution spatiale existante des sites est évaluée pour permettre la prédiction de l'endroit où les futures éoliennes peuvent être acceptables. Les résultats suggèrent que (1) la capacité nominale de la turbine, (2) pourcentage de la population locale avec des niveaux de qualification élevés, (3) l'âge moyen et (4) composition politique locale apparaissent comme des influences clés affectant l'approbation de la planification, tandis que d'autres paramètres généralement utilisés tels que la proximité des zones urbaines semblent moins influents. Cependant, ces résultats doivent encore être intégrés dans un SIG-MCDA.

Enfin, la question de la standardisation des critères non commensurables au sein du WSM et du GIS-MCDA n'a pas encore été traitée de manière satisfaisante. Pour créer un site unique, le score d'adéquation nécessite la combinaison d'une gamme de paramètres économiques, environnementaux et sociaux qui ne peuvent pas être directement additionnés en une seule échelle. De nombreuses méthodologies existantes ont évité ce problème en se concentrant uniquement sur des critères économiques (vitesse du vent, distance aux lignes électriques, etc.) [ 15, 17, 22-24], mais cette méthode néglige les enjeux sociaux qui limitent souvent l'adéquation des sites au développement d'éoliennes. Dans les situations où les paramètres économiques et sociaux sont combinés, des transformations linéaires sont souvent utilisées pour standardiser chaque variable afin de permettre leur addition directe [ 9, 12, 19, 20, 29]. Cependant, il existe une justification empirique limitée pour de telles approches [ 30] et les résultats de ces analyses sont fortement influencés par la subjectivité inhérente des paramètres de pondération utilisés.

La méthode proposée dans cette étude vise à répondre aux préoccupations ci-dessus avec les méthodologies existantes. Premièrement, alors que les méthodologies traditionnelles ont combiné différents types de paramètres (par ex. économique, environnemental) en un seul paramètre de notation, cette étude propose une approche à plusieurs niveaux dans laquelle les paramètres sont regroupés en groupes proportionnels. Ce faisant, cela réduit la subjectivité qui est souvent introduite dans la pondération des paramètres utilisée dans les méthodes WSM et AHP. Deuxièmement, cette étude intègre les résultats d'une analyse statistique précédente qui évalue la probabilité qu'une éolienne reçoive un permis de construire en Grande-Bretagne [ 5]. Ce faisant, le modèle vise à mieux localiser avec plus de précision les sites propices au développement d'éoliennes terrestres.


Géohistoire-Géohistoire Canada

Les chercheurs qui étudient le Canada ont généré de grandes quantités de données géohistoriques pendant de nombreuses années. Alors que nous réfléchissons à la création d'une infrastructure géohistorique nationale, il est pertinent d'identifier des ensembles de données à différentes échelles qui peuvent faire partie d'un tel portail. Nous essayons donc d'améliorer la découvrabilité des ensembles de données existants et disponibles. A terme, il serait préférable d'énumérer et de décrire chaque couche et chaque table attributaire, il n'est pas nécessaire, pour le moment, d'approfondir un tel niveau de granularité détaillée. Nous espérons, à ce stade, identifier des collections issues de différents projets de recherche ou du dépôt en ligne de données numériques préalablement géoréférencées telles que :

  • cartes géographiques raster
  • photographies aériennes
  • couches vectorielles
  • données d'attributs liées aux couches vectorielles

Nous avons déjà identifié des jeux de données proposés par différents types de créateurs afin de pouvoir présenter une diversité dans la nature et le type de données pouvant intéresser les chercheurs. Nous avons donc identifié :

  • données internationales de qualité (FAO)
  • données issues de projets de cartographie collaborative (Open Street Map, Natural Earth)
  • données disponibles sur les sites web des entreprises SIG (ESRI)
  • données nationales (gouvernement du Canada, Géogratis)
  • données provinciales ou territoriales (Colombie-Britannique, Yukon, Québec, Nouvelle-Écosse, Île-du-Prince-Édouard, Nouveau-Brunswick)
  • données municipales (Toronto, Montréal, Sherbrooke)
  • données des équipes de recherche (CIEQ, NICHE, LHPM, MAP, VIHistory)
  • données de cartothèques et centres d'archives (Scholars’ Geoportal, MADGIC, GéoIndex+)
  • données d'initiative personnelle (lignes ferroviaires historiques)

Le choix du type de métadonnées à associer à chaque ensemble de données a nécessité la réalisation d'un compromis. Un niveau de détail insuffisant empêcherait des recherches efficaces tandis que les exigences de métadonnées trop détaillées pourraient décourager les créateurs de données qui ne sont pas formés pour créer des métadonnées conformes aux normes internationales. Selon Rodolphe Devillers, nous pouvons utiliser six critères pour définir la qualité d'un jeu de données géospatiales 1 .

je. Définition : Permet à l'utilisateur d'évaluer si la nature d'une donnée et de l'objet qu'elle décrit, c'est-à-dire “quoi”, répond à ses exigences (définitions sémantiques, spatiales et temporelles)

ii. Couverture : Permet à l'utilisateur d'évaluer si le territoire et la période pour laquelle les données existent, c'est-à-dire le “où” et le “quand”, répondent à ses besoins

iii. Généalogie : Permet à l'utilisateur de savoir d'où proviennent les données, les objectifs du projet lors de l'acquisition des données, les méthodes utilisées pour obtenir les données, c'est-à-dire le “comment” et le “pourquoi” et de vérifier si cela répond aux exigences de l'utilisateur

iv. Précision : Permet à l'utilisateur d'évaluer la valeur des données et si elles sont acceptables pour les besoins de l'utilisateur (précision sémantique, temporelle et spatiale de l'objet et de ses attributs)

v. Légitimité : Permet à l'utilisateur d'évaluer la reconnaissance officielle et le statut juridique des données et si elles répondent aux exigences de l'utilisateur (normes de fait, bonnes pratiques reconnues, reconnaissance légale ou administrative par un organisme officiel, garantie légale par un fournisseur, , etc.)

vi. Accessibilité : Permet à l'utilisateur d'évaluer avec quelle facilité l'utilisateur peut obtenir les données (coût, délais, format, confidentialité, respect des bonnes pratiques reconnues, droits d'auteur, etc.).

Une norme de métadonnées qui répondrait à tous ces critères peut sembler écrasante pour de nombreuses personnes qui souhaiteraient rendre leurs données disponibles. Nous proposons donc d'utiliser le format défini par la Dublin Core Metadata Initiative, un standard international pour lequel les types de champs sont plus faciles à comprendre pour des personnes moins familiarisées avec les métadonnées. Nous avons appliqué et interprété le DCMI à partir de sa définition générale disponible sur Wikipédia 2 et de l'interprétation de quelques domaines proposés par la Bibliothèque nationale de France 3 . Cette approche est certes critiquable, car orientée vers une application simple plutôt que vers la perfection. En fonction de la manière dont les métadonnées seront saisies dans cette liste, nous pouvons affiner ces principes pour améliorer ce compromis. Les champs n'apparaissent pas dans le même ordre que dans le DCMI et certains sont subdivisés pour fournir un niveau de granularité légèrement plus fin.

Tableau 1. Liste des champs utilisés pour décrire les ensembles de données

– gouvernemental
– ONG
– académique
– individuel
– commercial
– collaboratif

– agriculture / élevage
– biote / biote
– limites administratives
– climatologie / climatologie
– économie / économie
– élévation / élévation
– environnement / environnement
– informations géoscientifiques / informations géoscientifiques
– santé / santé
– imagerie / imagerie
– intelligence / intelligence (militaire)
– eaux intérieures / eaux intérieures
– localisation / emplacement
– océans / océans
– urbanisme / urbanisme
– société / société
– structure / structure
– transport / transport
– services publics / services publics

– droits d'auteur
– CC (ou l'une de ses variantes)
– domaine public
– ouvert

– gratuit
– paiement unique
– abonnement gratuit
– abonnement payant


Méthodologie

Zone d'étude

La zone d'étude englobait trois paysages du sud du Kenya et du nord de la Tanzanie, largement définis par les mouvements de gnous résidents équipés de colliers GPS sur une période d'étude de trois ans (2010-2013). Nous appelons ces zones le bassin d'Amboseli, les plaines d'Athi-Kaputiei et de Mara (Fig. 1). Notez, cependant, que ces noms désignent des unités de population étudiées et pas nécessairement des régions géographiques spécifiques. Le bassin d'Amboseli s'étend de 36°43′ E, 2°17′ S à 37°42′ E, 2°57′ S et comprend le parc national d'Amboseli. La densité moyenne de la population humaine, à l'exclusion du parc national, est de 14 personnes/km 2 (LandScan 2008 ). La Mara est la plus grande des trois zones d'étude (26 000 km 2 ), s'étendant de 34°44′ E, 1°4′ S à 35°50′ E, 2°58′ S, couvrant des parties de l'écosystème Serengeti-Mara et y compris la réserve nationale de Maasai Mara (MMNR) au Kenya et des parties du parc national du Serengeti (SNP) en Tanzanie. La densité moyenne de la population humaine, à l'exclusion des deux parcs nationaux où l'établissement est interdit, est de 23 personnes/km 2 (LandScan 2008 ). Un peuplement dense et une agriculture mécanisée se produisent le long de la limite ouest du MMNR et du coin nord-ouest du SNP. Les plaines d'Athi-Kaputiei (36°43′ E, 1°18′ S à 37°9′ E, 1°55′ S) sont situées directement au sud de la capitale du Kenya, Nairobi, et sont la plus perturbée des trois zones d'étude. Un développement et une croissance rapides se sont produits dans cette région au cours des dernières décennies (Reid et al. 2008). La densité moyenne de la population humaine, à l'exclusion du parc national de Nairobi situé dans la partie la plus septentrionale de ce paysage, est de 45 personnes/km 2 (LandScan 2008).

Un gradient de précipitations prononcé du sud-est au nord-ouest existe dans toute la région, la majorité des précipitations tombant pendant deux saisons des pluies (largement avril-juin et novembre-décembre). Le Mara est le plus productif des trois systèmes, recevant environ 665 mm de précipitations par an (plage : 350–1425 mm Xie et Arkin 1997 ), et le bassin d'Amboseli le moins productif (environ 370 mm de précipitations par an : 300–525 mm Xie et Arkin 1997). Les précipitations sur les plaines d'Athi-Kaputiei sont modérées en comparaison, avec une moyenne de 475 mm par an (plage : 415–570 mm Xie et Arkin 1997 ). Chaque zone est composée de prairies semi-arides, dominées par des forêts mixtes d'Acacia et de Commiphora.

Données de relocalisation (utilisation)

Trente-six gnous adultes (22 femelles et 14 mâles) ont été sélectionnés au hasard dans des groupes distincts et équipés de colliers GPS Lotek WildCell (Lotek Wireless Incorporated, Newmarket, Ontario, Canada) entre mai et octobre 2010 (Permis de recherche du Conseil national des sciences et technologies n° NCST/RR1/12/1/MAS/39/4, Nairobi, Kenya). Neuf animaux ont été munis de colliers dans le bassin d'Amboseli, 12 animaux dans les plaines d'Athi-Kaputiei et 15 animaux dans la Mara. Tous les individus munis d'un collier étaient des adultes, dont l'âge (estimé à partir de l'usure des dents) allait de 5 à 12 ans (annexe S1). La distance moyenne par paire entre les emplacements initiaux de pose de colliers était de 12,7 km dans le bassin d'Amboseli, de 26,5 km dans les plaines d'Athi-Kaputiei et de 21,8 km dans la Mara. Tous les aspects de la manipulation des animaux ont été administrés par les vétérinaires de terrain du Kenya Wildlife Service (Nairobi, Kenya) et approuvés par l'International Animal Care and Use Committee (IACUC) de la Colorado State University, Fort Collins, Colorado, États-Unis (Approbation n° 09-214A- 02).

Les colliers ont été programmés pour collecter la localisation des animaux 16 fois par jour, toutes les heures de 06h00 à 18h00 et toutes les trois heures de 18h00 à 06h00 (heure locale). Nous avons supprimé les points de données bidimensionnels avec une dilution de précision (DOP) > 5,0 et les points tridimensionnels avec un DOP > 10,0 pour éviter d'utiliser des données pouvant comporter des erreurs spatiales importantes (Lewis et al. 2007 ). Les données ont été raréfiées à un intervalle de temps de 3 heures. Le succès moyen des correctifs était de 94,2 % et variait de 79,1 % à 100,0 %. La durée pendant laquelle les gnous ont été munis de colliers variait de 16 à 964 jours (médiane = 538). Un total de 139 634 repères parmi les 36 individus ont été collectés, allant de 119 à 7 427 enregistrements d'utilisation par animal (annexe S1).

Les données ont été séparées en périodes de saison sèche et de saison humide et combinées sur plusieurs années. Les dates de début/fin saisonnières ont été définies à l'aide des données d'indice de végétation par différence normalisé MODIS (NDVI MOD13Q1) (Carroll et al. 2004) et du progiciel TIMESAT avec une fonction Savitzky-Golay (Jonsson et Eklundh 2002 , 2004 ). Les périodes de transition (c.-à-d. ±10 jours de dates de début/fin de saison) ont été supprimées des analyses. Les tendances saisonnières dans chaque zone d'étude sont affichées dans Stabach ( 2015 ). Le nombre total de localités utilisées pour chaque période était de 41 330 parmi 35 individus pour la saison sèche (Bassin d'Amboseli : 15 018 localités, m = 9 plaines Athi-Kaputiei : 12 215 emplacements, m = 12 Mara : 14 097 emplacements, m = 14) et 66 461 parmi 36 individus pour la saison humide (Bassin Amboseli : 8813 localités, m = 9 plaines Athi-Kaputiei : 27 150 emplacements, m = 12 Mara : 30 498 emplacements, m = 15). La différence dans le nombre d'emplacements collectés dans la zone d'étude/la saison est liée à la durée des périodes saisonnières (c. Les données. Les données de relocalisation ont ensuite été séparées au sein de chaque saison en périodes temporelles diurnes (06h00-17h59) et nocturnes (18h00-05h59). Les données ont été projetées selon la projection à surface égale d'Albers, datum WGS84.

Covariables de l'habitat

Les gnous sont des brouteurs variables (Gagnon et Chew 2000 ), préférant les pousses d'herbe < 3 cm de hauteur pour maximiser l'apport énergétique (Wilmshurst et al. 1999 ), et sont limités aux zones avec de l'eau de surface disponible (Talbot et Talbot 1963 ). La distribution des gnous est également limitée aux zones ouvertes, basée plus sur une aversion pour les habitats ligneux qui peuvent cacher des prédateurs que par le relief géographique (Georgiadis 1995 ). Pour évaluer la sélection des ressources dans les zones d'étude, nous avons accumulé huit couches de données (annexe S2) dans un système d'information géographique basé sur l'utilisation de l'espace connue ou soupçonnée de l'espèce. Nous n'avons inclus que les variables qui pouvaient être construites dans les trois zones d'étude pour faciliter les comparaisons au niveau de la population. Une analyse supplémentaire a été menée dans la zone d'étude des plaines d'Athi-Kaputiei, en raison de la disponibilité de données supplémentaires à petite échelle (décrites ci-dessous).

Pour évaluer la qualité de la végétation, nous avons extrait (1) la valeur NDVI moyenne sur 16 jours au moment et à l'emplacement de chaque observation de gnous (c'est-à-dire, chaque emplacement « d'utilisation ») et (2) la différence entre la valeur NDVI moyenne actuelle et la valeur précédente. Valeur NDVI (ΔNDVIt = NDVIt − NDVIt−1). Le NDVI est connu pour être fortement corrélé avec la productivité/verdeur de la végétation d'un emplacement (Tucker 1979 , Goward et Prince 1995 ) et s'est avéré être un paramètre important dans les modèles prédisant le mouvement des animaux (Pettorelli et al. 2005 ), y compris les gnous (Boone et al. 2006 , Hopcraft et al. 2014 ). On pense également que la quantité de végétation (biomasse) influence fortement l'utilisation de l'espace par les gnous, les gnous préférant les plaines à herbes courtes tout en évitant les zones boisées (biomasse élevée) en raison de la réduction des matières digestibles (Wilmshurst et al. 1999) et du risque de prédation inhérent (Hopcraft et al. 2005, 2014). Nous avons utilisé l'indice d'humidité topographique (TWI Sørensen et al. 2006 ) comme proxy de la biomasse, car cette métrique tient compte simultanément de la superficie totale du bassin versant et de la pente d'une cellule. Les cellules avec des valeurs TWI élevées ont tendance à être des zones concaves avec de grands bassins versants, retenant plus d'eau que les valeurs TWI faibles et conduisant à une augmentation de la biomasse (Hopcraft et al. 2014 ).

Pour capturer la réponse des gnous aux mesures de perturbation anthropique, nous avons numérisé les routes et les structures visibles à partir des images satellite disponibles (ESRI 2011 , GoogleEarth 2013 ). Pour maintenir la cohérence dans chaque zone d'étude, nous avons créé une grille vectorielle et numérisé toutes les caractéristiques à une échelle de 1:7000. Nous avons séparé les routes en deux catégories distinctes (primaires, secondaires) en fonction des attributs associés à l'imagerie satellitaire (ESRI 2011) et reflétant le type de route. Les distances aux routes principales (tarmac/routes principales) et secondaires (terre/toutes les autres routes) ont été calculées dans chaque zone d'étude à une résolution de 50 m.

Les gnous sont également connus pour être particulièrement sensibles à la fragmentation anthropique (par exemple, Kahurananga et Silkiluwasha 1997 ). Bien que difficile à quantifier dans les prairies arides, nous avons calculé la distance jusqu'à 86 565 structures numérisées dans les trois zones d'étude pondérées par la densité de population humaine estimée (LandScan 2008) en tant que corollaire de la fragmentation anthropique de l'habitat. Appelé « empreinte anthropique » et adopté de Hopcraft et al. (2014), les zones densément peuplées ont les valeurs les plus élevées tandis que les zones les plus éloignées des villages petits ou peu peuplés ont les valeurs les plus faibles. Cette méthode nous a permis d'incorporer des perturbations à petite échelle qui auraient autrement été manquées en raison de la résolution grossière de l'ensemble de données sur la population (1 km 2 ). Des détails supplémentaires sur cette couche de données sont fournis à l'annexe S3.

Les caractéristiques du paysage telles que les forêts denses, les digues ou les confluents de rivières sont connues pour former des pièges naturels pour les gnous (Hopcraft et al. 2005, Balme et al. 2007 ). Pour capturer ces caractéristiques, nous avons édité des rivières numérisées par le World Research Institute (WRI 2007) en utilisant la même échelle de grille et la même procédure que celles décrites ci-dessus. Nous avons ignoré les petites rivières ou les rivières éphémères, visibles sur l'imagerie satellitaire, mais non incluses dans l'ensemble de données WRI. Dans le bassin d'Amboseli, les marécages pérennes du parc national ont également été numérisés et incorporés en tant qu'entités dans cette couche. Nous avons supposé que l'eau était disponible en abondance pendant la saison des pluies et que la distance aux rivières permanentes et aux marécages capturait les sources d'eau dont dépendaient les gnous pendant la saison sèche. La végétation ligneuse, définie comme des arbustes, des bois ou des arbres avec une couverture de > 40 %, a été sélectionnée à partir de l'ensemble de données Africover Global Land Cover (FAO 2014). Les distances à chaque élément ont été calculées à une résolution de 50 m.

Deux couches supplémentaires, la distance aux points d'utilisation de l'eau créés par l'homme (c.-à-d. les barrages) et les limites des clôtures, n'étaient disponibles que pour les plaines d'Athi-Kaputiei et intégrées dans un modèle supplémentaire/séparé pour cette zone d'étude. Ces couches, numérisées par le personnel de l'Institut international de recherche sur l'élevage (ILRI Nairobi, Kenya) de 2004 à 2010 (Reid et al. 2008), décrivent des facteurs à petite échelle qui devaient (respectivement positivement et négativement) affecter la distribution des gnous dans toute la région. Nous avons restreint la limite de la zone d'étude à l'étendue de ces couches de données pour les modèles spécifiques à cette région. Toutes les variables prédictives pour chaque emplacement utilisé et disponible (décrits ci-dessous) ont été extraites à l'aide d'outils du package raster (Hijmans et van Etten 2012) dans le package statistique R (R Development Core Team 2013). Toutes les analyses géospatiales ont été effectuées à l'aide de l'extension Spatial Analyst dans ArcGIS 10.1 (ESRI 2012 ). Aucune variable n'a été observée comme étant fortement corrélée (Pearson's r > |0.6|).

Données de disponibilité

La méthode la plus courante pour caractériser la sélection de troisième/quatrième ordre (Johnson 1980) consiste à générer un échantillon aléatoire de points pour caractériser la disponibilité dans une zone tampon autour de chaque emplacement utilisé (Northrup et al. 2013). Nous avons utilisé une version modifiée de cette méthode, en utilisant la distance maximale déplacée sur une période de 3 heures (la résolution de notre ensemble de données) pour chaque individu et saison comme rayon autour de chaque point « d'utilisation » dans lequel générer la disponibilité. À la suite de Northrup et al. ( 2013 ), nous avons effectué des analyses de sensibilité pour déterminer le nombre approprié de points aléatoires à échantillonner pour chaque point « d'utilisation », en utilisant un animal sélectionné au hasard dans chaque zone d'étude. Nous avons tiré au hasard un nombre de points allant de 1 à 100 (1, 3, 5, 10, 20, 30, 50, 100) par point « d'utilisation » et ajusté les RSF en utilisant une régression logistique à chacune de ces tailles d'échantillon. Nous avons répété ce processus 100 fois et calculé l'espérance des estimations des coefficients et les enveloppes de simulation à 95 %. Ce faisant, nous avons déterminé un échantillon de 50 points de disponibilité par point d'« utilisation » fournissant des estimations de coefficients stables. Les graphiques de sensibilité résultants, avec le code R pour effectuer l'analyse, sont fournis dans les données S1.

Modèles de sélection de ressources

(1) où w(Xje) est le RSF,m est le coefficient de la me variable prédictive Xm, et est l'interception aléatoire pour l'animal je (Manly et al. 2002 , Gillies et al. 2006 ). Il a été démontré que l'incorporation d'effets aléatoires dans la structure du modèle tient mieux compte des différences inhérentes entre les individus et permet l'inclusion de plans d'échantillonnage déséquilibrés (Gillies et al. 2006 ). Nous avons standardisé () toutes les variables prédictives pour chaque emplacement utilisé et disponible afin de faciliter les comparaisons intersaisonnières et inter-zones d'étude. Des termes quadratiques ont été inclus sur tous les paramètres de distance pour tester les relations non linéaires.

Sept modèles candidats a priori (tableau 1) ont été créés et classés à l'aide du critère d'information d'Akaike (AIC Burnham et Anderson 2002 ). L'ajustement du modèle de chaque modèle le mieux classé (zone d'étude/saison) a été évalué à l'aide de corrélations de rang de Spearman entre les fréquences ajustées en fonction de la zone à l'aide de prédictions de validation de présence uniquement et de bacs RSF (Boyce et al. 2002), pour lesquels nous avons sélectionné au hasard 20 % les données de présence uniquement de chaque zone d'étude/saison pour validation. NDVI et ΔNDVI n'ont pas été inclus dans la validation car les valeurs ont changé temporairement.

Modèle Structure K
1. Nulle 2
2. Végétation NDVI + ΔNDVI + TWI 5
3. Prédation Distance à la végétation ligneuse + (Distance à la végétation ligneuse) 2 + Distance aux rivières + (Distance aux rivières) 2 8
4. Perturbation humaine Empreinte anthropique + Distance à la route principale + (Distance à la route principale) 2 + Distance à la route secondaire + (Distance à la route secondaire) 2 7
5. Végétation et risque humain NDVI + ΔNDVI + TWI + Empreinte anthropique 6
6. Végétation et risque de prédation NDVI + ΔNDVI + TWI + Distance à la végétation ligneuse + (Distance à la végétation ligneuse) 2 + Distance aux rivières + (Distance aux rivières) 2 9
7. Plein NDVI + ΔNDVI + TWI + Distance à la végétation ligneuse + (Distance à la végétation ligneuse) 2 + Distance aux rivières + (Distance aux rivières) 2 + Empreinte anthropique + Distance à la route principale + (Distance à la route principale) 2 + Distance à la route secondaire + (Distance à la route secondaire) 2 14

Remarques

  • Le NDVI est l'indice de végétation par différence normalisé. TWI est l'indice d'humidité topographique. Les paramètres sont définis dans le texte. K est le nombre de paramètres fixes et aléatoires inclus dans le modèle.

Des modèles supplémentaires, séparés en périodes de jour et de nuit et (pour les plaines d'Athi-Kaputiei) incluant les paramètres « Distance aux points d'utilisation de l'eau » et « Distance aux clôtures », ont été ajustés en utilisant la même méthodologie que celle décrite ci-dessus. Toutes les analyses statistiques ont été réalisées en R (R Development Core Team 2013 ) en utilisant le package lme4 (Bates et al. 2014 ).


Discussion

Bien que les estimations des distributions géographiques des espèces (longitude, latitude) et les valeurs des variables environnementales associées (c. Pour la plupart, les valeurs des variables environnementales dérivées des deux sources différentes dans nos analyses étaient fortement corrélées entre les espèces, ce à quoi on pouvait s'attendre étant donné le chevauchement des points et des plages en raison des contraintes que nous avons imposées sur l'inclusion de points d'analyse (pas plus de 500 km des limites publiées de l'aire de répartition). Ces résultats reflètent ceux d'Alhajeri et Fourcade (2019) dans une analyse similaire basée sur les données de 1191 espèces de rongeurs, qui ont observé des corrélations élevées entre les 19 variables WorldClim plus l'altitude dans une comparaison des points GBIF aux cartes de répartition de l'UICN. En utilisant tous les points GBIF d'une espèce indépendamment des limites de l'aire de répartition, Alhajeri et Fourcade ( 2019 ) ont observé une distance médiane entre les centroïdes des données GBIF et UICN de 224 km, remarquablement proche de nos 234 km observés. De plus, en plus d'utiliser tous les points GBIF d'une espèce, Alhajeri et Fourcade ( 2019 ) ont répété leurs analyses en utilisant uniquement les points situés dans les limites de la carte de répartition. Les corrélations des variables environnementales étaient encore plus élevées pour les données contraintes, mais seulement légèrement. Bien qu'ils aient évalué les effets de la taille des aires de répartition géographique différemment de nous, ils n'ont pas observé de différences dans les modèles d'association entre les tailles des aires de répartition.

Bien que les estimations des valeurs basées sur l'aire de répartition par rapport aux valeurs basées sur des points pour les variables géographiques et environnementales étaient généralement étroitement associées, certaines espèces différaient néanmoins considérablement (ou du moins plus que la grande majorité des espèces) entre les deux estimations. For example, there was a notable difference in longitude for several species (Fig. 1A) that showed an eastern bias in range-based estimates (or alternatively, a western bias in point-based estimates). This occurred in several species whose distributional ranges are reported to be broadly Palearctic (e.g. hazel grouse Tetrastes bonasia black grouse Lyrurus tetrix (Fig. 5) western capercaillie Tetrao urogallus) or even circum-Arctic (willow grouse Lagopus lagopus), but for whom there are very few records in north Asia east of 40°E. For willow grouse, only 11 of 2660 points are east of 34°E despite its ostensible circumpolar distribution. While it is difficult to attribute unequivocally a cause for the differences in longitude in the examples above, the scarcity of northeastern Asian observations for these grouses likely reflects the scarcity of any records at all for the region in question, rather than simply a regional scarcity of these species. Boakes et al. ( 2010 ) assessed the spatial distribution of Eurasian galliform locality records from a variety of sources, noting that whereas records obtained from museums were spread throughout the area of interest, northern Asia (mainly Russia) was particularly depauperate in records from other sources (e.g. literature, atlases and website trip reports). La Sorte and Sumveille ( 2020 ) report a similar scarcity of eBird surveys in northern Asia. The Map of Life (Jetz et al. 2012 ) indicates that coverage of birds (a measure of how well GBIF-mediated data characterize the makeup of avian assemblages averaged over all 150-km grid cells in a defined area) is only 0.4% for Russia, compared to 31% for the USA and over 60% for several Scandinavian countries (<https://mol.org/indicators/coverage/> accessed 10 December 2018).

Range map of black grouse Lyrurus tetrix (from Birdlife IUCN 2016 ) overlaying point localities (small gray or black dots, from GBIF.org 2018 ). Large star to west represents median latitude and longitude based on 3737 points (10′ × 10′ resolution) large pentagon to east represents median latitude and longitude based on rasterized range map (75 077 points). Distance between star and pentagon is

3400 km. Image prepared in ModestR (Garcia-Rosello et al. 2013 , 2014 ).

Latitude also differed noticeably for several species, although there was no apparent geographical pattern as with longitude species that differed by more than 10° were scattered across the globe. The largest difference in latitude was also associated with the longest distance between range and point centroids,

5400 km for Asian blue quail Excalfactoria chinensis (Fig. 6). This difference was due to the higher concentration of occupied points along the eastern Australia coast compared to the rest of the range, which reported extends northward into western India. As with longitude, this difference is most likely attributable to differences in data coverage, which vary from 17.5% in Australia (and up to 50% in its Pacific coastal grids) down to < 5% in India, southeastern Asia, Indonesia and the Philippines (<https://mol.org/indicators/coverage/> accessed 10 December 2018).

Range map of Asian blue quail Excalfactoria chinensis (from Birdlife IUCN 2016 ) overlaying point localities (from GBIF.org 2018 ). Large star to southeast represents median latitude and longitude based on 638 points (10′ × 10′ resolution) large pentagon to northwest represents median latitude and longitude based on rasterized range map (24 233 points). Distance between star and pentagon is

5400 km. Image prepared in ModestR (Garcia-Rosello et al. 2013 , 2014 ).

Although over all species the correlation between range-based and point-based annual temperatures was similar to those of latitude and longitude, and nearly 1, the slope of the regression of point medians on range medians was shallower and the intercept higher (Table 1), such that points yielded slightly warmer values in colder regions (Fig. 3A). Again, we attribute this to the scarcity of points in northern and eastern Asia (e.g. Siberia) for a number of species compared to coverage of range maps. However, the largest individual species’ difference between point- and range-based estimates of annual temperature reflects the coupling of temperature with elevation. Although only 125 km separates range versus point centroids of Sclater's monal Lophoporus sclateri in the mountain forests of the Himalayas (a region with a steep elevational gradient), the nearly 1300-m difference in median elevation (3222 m for ranges versus 1954 m for points) generates a 10°C difference in median temperatures. Overall, distance between centroids accounted for 11.4% of the variation in the magnitude (absolute value) of the difference between the two estimates (r = 0.34, n = 286).

Two of the species that displayed substantial differences (> 1000 mm) in annual precipitation estimates (Fig. 3B) both occurred on Borneo, an island with a very large precipitation gradient (1600–4200 mm). Despite having distribution centroids differing within the island by only 410 km, precipitation estimates for Bornean partridge Arborophila hyperythra differed by 1200 mm crimson-headed partridge Haematortyx sanguiniceps centroids were separated by only 208 km, but precipitation differed by 1100 mm. Although elevation certainly plays a role in creating the precipitation gradient, these two species differ in median elevations based on ranges versus points of less than 200 m. Micronesian scrubfowl Megapodius laperouse precipitation medians differed by 1200 mm, but these medians were based on only two occurrence cells versus five range cells, with occurrence cells from one island, range cells from another, 1300 km apart. This particular large distance notwithstanding, distance between centroids overall accounted for only 1.6% of the difference in magnitude between estimates based on ranges versus points (r = 0.13, n = 286).

Without going into similar species-specific detail for other climate variables, in general those species that showed the largest deviations between ranges and occurrence points with respect to diurnal temperature range and precipitation seasonality (Fig. 3C–D) also tended to occur in areas with relatively steep spatial gradients in those environmental variables. Overall, the variation in the absolute difference in medians that was associated with the distance between centroids was 18.0% (r = 0.42) for precipitation seasonality and 11.5% (r = 0.34) for diurnal temperature range (both n = 286).

Four species had differences between point-based and range-based elevations > 1000 m (Fig. 4A). Of these, three had point-based elevations characterized by only three points, whereas the fourth, with 95 points, manifest a distance of almost 3000 km between range versus point centroids. Thus, we attribute much of the discrepancy to inadequate sampling. But perhaps more importantly, differences between point-based and range-based estimates of median elevation were only about half the differences observed between point medians and minimum–maximum elevation mid-points, with the latter consistently higher. As implied by Quintero and Jetz ( 2018 ), species’ detections might be biased downward as it may be more difficult to access higher elevations, leading to fewer observations there. On the other hand, mid-points may be biased upward to the extent observers may be more likely to report particularly high elevation observations of a species (i.e. beyond its customary range) as they may be deemed more noteworthy, and thus extend the maximum upward. However, regardless of any reporting biases, the difference between median and mid-point values for elevation is also influenced by geometry. Visualizing a mountain as a simple, tapering cone, it is apparent that it has a larger surface area (and hence more map cells with a value for elevation) below the mid-point between its base and its apex than above that mid-point. As a result, for any such tapering surface the median value of all cells will be less than the value that is the mid-point. Certainly, the magnitude of any difference between the two values (median versus mid-point elevation) for a species will depend on the topographic complexity of the landscape over which it occurs. Nevertheless, our observations are broadly consistent with this geometry.

The extreme outlier with respect to differences in elevation based on minimum–maximum mid-point versus median of occupied cells (Fig. 4B) was the rock ptarmigan Lagopus muta, a species described as occupying ‘rocky tundra with fairly sparse vegetation, or alpine summits’ (HBW). Birdlife reports its elevational range as 2000–5000 m (3500 m mid-point), and Q&J gives values of 2000–6000 m (4000 m mid-point). In contrast, the median elevation of an occupied 10′-cell was 584 m (range 1–2807 m, n = 989), and that of all cells within its range was 345 m (range 1–5455 m, n = 120 499). Conceivably, this could represent systematic misidentification arising from confusing this species with the similar-appearing sister taxon, the willow grouse, whose habitat is described as ‘primarily Arctic tundra’ (HBW). The two species overlap broadly, particularly in the northern parts of their ranges. For the willow grouse, Q&J provide a midpoint elevation of 490 m, compared to a median of 267 m estimated from point occurrence data (range 1–3646 m, n = 163 171). Nonetheless, regardless of the cause it is difficult to reconcile a discrepancy of 3400 m.

It is not surprising that there were exceptions to the general concordance of values in our analyses, given that we expect that not all points within a species’ range will be occupied (in this case, the median number of cells occupied based on points was

4% of the number based on ranges), and that points are more likely not to be occupied the more environmental conditions at the point differ from (in the sense of being less suitable than) others in the range. Given that the geographic locations (occupied cells) derived from the two different methods overlap considerably, at least some departures of point-based environmental variable values from range-based ones likely represent lack of occupancy of cells within ranges that are simply less suitable with respect to the variable. That the differences do not seem to be strongly influenced by geographical offset is further consistent with the notion that species’ may have environment-restricted distributions within ranges, leading to ‘holes’ associated with less-suitable environment. Consistent with the notion that range maps might include inappropriate as well as appropriate environmental conditions, we observed variances (both interquartile and interdecile ranges) that were greater for range maps than occupied points for annual precipitation, diurnal temperature range and precipitation seasonality. However, points-based variances were generally greater than range-based ones for elevation and annual temperature, which we predicted could occur if we included occupied points that lay outside range map boundaries. To the extent that any observed difference between medians or variances seemed biologically relevant or important to a particular question at hand, it could be tested by taking repeated samples of N randomly selected cells within a species’ range (N = the number of points for the species) to generate an expected median and variance value and their statistical distributions, to which the observed values could be compared (Fourcade 2016 ).

As we noted, not all deviations between range-based and point-based medians could be ascribed to a species’ habitat specificity. In several instances it appeared that there was simply an insufficient number of points to characterize adequately a species’ value with respect to an environmental variable. Repeated random sub-samples of an environmental variable at a species’ points across a range of sample sizes could provide some idea of the minimum N necessary to achieve a stable estimate of the median value. However, as this number is likely to vary as a function of the underlying geographical heterogeneity of the variable within the species’ range at the scale sampled, sampling different environmental variables could produce different estimates of an adequate sample size. And if a species simply has too few points to begin with, subsampling is not feasible.

Although range-based and point-based estimates of median elevation of species were highly correlated, these estimates differed substantially from those based on mid-points of the reported span (minimum–maximum) of elevations occupied. Although it is certainly possible that the discrepancy is due to inadequate sampling (i.e. fewer points) at higher elevations within a species’ range of occurrence, an alternative, that the distribution of a species’ occurrences along an elevational gradient is not symmetrical (and hence the mid-point is not a suitable measure of central tendency, as we argue above based on topographic geometric considerations), seems plausible as well. For example, a lowland species may have a reported range of 0–1000 m, where it may have only been seldom observed at 1000 m but is widely distributed at sea level. Compared to the mid-point elevation of 500 m, this is an immediate skew of nearly 500 m. Clearly the frequency distributions of species’ points in our sample were generally skewed, with relatively more at lower versus higher elevations. In this event, the median will be a more suitable measure of the central tendency of the distribution than will the mid-point, which better characterizes the central tendency of a symmetrical distribution. Nevertheless, the best resolution of this discrepancy is also likely the most difficult, a more thorough sampling and reporting of species’ distributions along elevational gradients.

To what extent does this elevational discrepancy even matter? To the extent that one uses elevation as a proxy for, say, temperature, if one derives the actual values of environmental variables (e.g. climate) associated with a species distribution from either range maps or occurrence points then associating elevation (meters) with a species’ distribution may be irrelevant. There is little point in determining the value of a proxy if one has in hand the values of the variables for which the proxy is a surrogate. Moreover, although temperature globally declines with elevation, it does so with an interaction with latitude average annual temperature at 1500 m at 20°N is different from that at the same elevation at 50°N. However, other physical environmental features that may influence life history traits in animals and plants, such as air pressure and oxygen availability, are not latitude-dependent, and having a more accurate estimate of a species’ elevational distribution becomes more important (Körner 2007 ).

Concluding remarks

For most species, we conclude that using points of known occurrence will likely provide more reliable environmental data than overlaying range maps, although differences between the two may be slight. Perhaps most importantly, use of points can obviate the ‘porosity’ issue of range maps, and its creation of false-positives of occurrences. The performance of several commonly used species distribution modeling techniques that employ presence/absence data have been shown to be more adversely affected by false-positives than by false-negatives (Fernandes et al. 2019 ), and this may carry over to other types of models as well. Another significant advantage to points is deflating the overestimation of a species’ elevational distribution based on mid-points between minimum and maximum extents. Likewise, by retaining points that occurred outside of range map boundaries one includes peripheral or disjunct populations that range maps often omit. We acknowledge, however, that the 500-km limit we applied to retaining out-of-range points was arbitrary and that different limits would possibly produce different results, although this effect was small in the analyses of Alhajeri and Fourcade ( 2019 ). We further note that even with relatively dense sampling of a species’ distribution, objectively determining the exact boundaries of a species’ range can be a fraught process (Fortin et al. 2005 ). Indeed, the observation that some variables had higher range-based variances whereas others had higher points-based variances suggests potentially poor accuracy in determining the exact limits of species’ distributions (Alhajeri and Fourcade 2019 ). Rasterizing species’ occurrences to simply presence in a 10′ map cell regardless of the number of occurrences reduces the ‘hot spot’ effect by eliminating redundant observations, although it does not necessarily remove other forms of non-randomness in the distribution of points (e.g. along roads). Moreover, the size of our map cells absorbs some imprecision in geographical coordinates. What using points does not do, however, is increase the amount of data available for species with few observations (which often have small ranges as well), nor does it rectify gross inconsistencies in geographical reportage of observations of a species. Nevertheless, macroecological analyses based on species’ occurrences will continue to improve as the challenges of increasing the coverage and reducing the biases of observational data are met (Callaghan et al. 2019 ).

Data availability statement

Species medians and interquartile and interdecile ranges for all variables extracted from both point occurrences and range maps will be available from the Dryad Digital Repository: <https://doi.org/10.6086/D1Z396> (Rotenberry and Balasubramaniam 2020 ).

Acknowledgements – We express gratitude to the thousands of contributors to the Global Biodiversity Information Facility, including eBird, and the International Union for the Conservation of Nature for the data that make macrogeographical analyses such as our possible. We thank A. T. Peterson for comments that helped clarify our presentation. We also thank Seshadri Rajagopal for assistance with GIS issues. The Univ. of Minnesota Dept of Ecology, Evolution and Behavior provided administrative support for this project.

Conflicts of interest – The authors declare no conflicts of interest.

Author contributions – JTR and PB conceived the project JTR collected and analyzed the data JTR prepared the initial draft and JTR and PB revised the manuscript.


Muluneh Yitayew

Interested on water resources engineering that includes irrigation aminly microirrigation, hydraulics, hydrology, hydraulic structures, and transboundary river basin management. Additionally, recent interset includes climate change and development, sustainable development, and disaster risk sciences. My teaching interest goes along my research interest, mainly soila nd water resources engineering. Also, computer aiaded design and microcomputer application.

Work Experience

  • Fulbright Program, US StateDepartment (2001 - 2003)
  • ABE Department (1999 - Ongoing)
  • University of California, Riverside, Riverside, California (1983 - 1984)

Awards

  • US Ambassador's Distinguished Scholar Award
    • US Embassy in Addis Ababa, Ethiopia, Spring 2018
    • Irrigation Association, Fall 2017
    • Western Agricultural Experiment Directors, Summer 2014

    Related Links

    Interests

    Research

    Microirrigation, Water Conservation, Climate Change, Geospatial Analysis, Remote Sensing

    Teaching

    Teach Soil and Water Resources Engineering, Hydraulics, Hydrology, Computer Aided Design, Microcomputer Application


    Materials and Methods

    Assumptions.—In this study, we largely follow the assumptions outlined in Peterson et al. (2004b), but with several important adjustments. Briefly, we assumed the following: First, the reservoir is a mammal ( Leroy et al. 2005 Murphy et al. 1990 Murphy and Peters 1998 Peters et al. 1993 Swanepoel et al. 1996=). Second, the reservoir supports persistent, largely asymptomatic filovirus infections, which eliminates most primates and ungulates from consideration ( Lahm et al. 2007). Third, the geographic distribution of the virus is restricted to the geographic distribution of the reservoir. Fourth, the reservoir has small body size, on the grounds that a larger animal would likely be more memorable, and thus have been noted by index cases who had some sort of contact. Fifth, a revolutionary link exists between the virus and its reservoir(s). Sixth, the reservoir is not commensal with humans. In the current study, we modified the assumptions of the previous study to allow inclusion of widespread species with ranges that include the ranges of all known African filovirus species, considering that many of these single “species” may actually be highly structured genetically, and represent complexes of related species. We also allowed inclusion of larger-sized mammals, up to about 10–15 kg. Finally, and most importantly, we used a considerably more detailed geographic filter in defining geographic coincidence, described in more detail below.

    Occurrence data.—Occurrence data for each species listed in the original, coarse-filter analysis ( Peterson et al. 2004b), plus additions based on consideration of widespread species and species of larger body size, were accumulated from natural history museum specimens ( Table 1) by direct inspection of specimens and capture of data from specimen labels, by review of digital catalog data provided by collections personnel, or by consulting the Mammal Networked Information System (MaNIS) distributed biodiversity information database system ( Stein and Wieczorek 2004).

    Natural history museum collections from which locality data were obtained for the distributional maps for mammal species, and how data were obtained.

    Institution . How data obtained .
    American Muséum of Natural History Electronic a
    Natural History Muséum (London) Manual b
    Los Angeles County Muséum of Natural History Electronic
    United States Natiónal Muséum of Natural History Electronic
    University of Michigan Muséum of Zoology Electronic
    Yale Peabody Muséum Electronic
    Muséum Natiónal d'Histoire Naturelle, Paris Manual, electronic
    Musée Royal de l'Afrique Centrale, Tervuren Manual, electronic
    Muséum fur Naturkunde, Berlin Manual
    Data sets served in MaNIS c : University of Washington Burke Museum, Field Museum, Royal Ontario Museum, University of New Mexico Mueum of Southwestern Biology, California Academy of Sciences, University of Kansas Natural History Museum, Museum of Vertebrate Zoology Electronic
    Texas Tech University Electronic
    Louisiana State University Museum of Natural Science Electronic
    Institution . How data obtained .
    American Muséum of Natural History Electronic a
    Natural History Muséum (London) Manual b
    Los Angeles County Muséum of Natural History Electronic
    United States Natiónal Muséum of Natural History Electronic
    University of Michigan Muséum of Zoology Electronic
    Yale Peabody Muséum Electronic
    Muséum Natiónal d'Histoire Naturelle, Paris Manual, electronic
    Musée Royal de l'Afrique Centrale, Tervuren Manual, electronic
    Muséum fur Naturkunde, Berlin Manual
    Data sets served in MaNIS c : University of Washington Burke Museum, Field Museum, Royal Ontario Museum, University of New Mexico Mueum of Southwestern Biology, California Academy of Sciences, University of Kansas Natural History Museum, Museum of Vertebrate Zoology Electronic
    Texas Tech University Electronic
    Louisiana State University Museum of Natural Science Electronic

    Specimen data provided in electronic format by collections personnel.

    Specimens examined and data recorded manually.

    Specimen data accessed via query of the Mammal Networked Information System ( Stein and Wieczorek 2004).

    Natural history museum collections from which locality data were obtained for the distributional maps for mammal species, and how data were obtained.

    Institution . How data obtained .
    American Muséum of Natural History Electronic a
    Natural History Muséum (London) Manual b
    Los Angeles County Muséum of Natural History Electronic
    United States Natiónal Muséum of Natural History Electronic
    University of Michigan Muséum of Zoology Electronic
    Yale Peabody Muséum Electronic
    Muséum Natiónal d'Histoire Naturelle, Paris Manual, electronic
    Musée Royal de l'Afrique Centrale, Tervuren Manual, electronic
    Muséum fur Naturkunde, Berlin Manual
    Data sets served in MaNIS c : University of Washington Burke Museum, Field Museum, Royal Ontario Museum, University of New Mexico Mueum of Southwestern Biology, California Academy of Sciences, University of Kansas Natural History Museum, Museum of Vertebrate Zoology Electronic
    Texas Tech University Electronic
    Louisiana State University Museum of Natural Science Electronic
    Institution . How data obtained .
    American Muséum of Natural History Electronic a
    Natural History Muséum (London) Manual b
    Los Angeles County Muséum of Natural History Electronic
    United States Natiónal Muséum of Natural History Electronic
    University of Michigan Muséum of Zoology Electronic
    Yale Peabody Muséum Electronic
    Muséum Natiónal d'Histoire Naturelle, Paris Manual, electronic
    Musée Royal de l'Afrique Centrale, Tervuren Manual, electronic
    Muséum fur Naturkunde, Berlin Manual
    Data sets served in MaNIS c : University of Washington Burke Museum, Field Museum, Royal Ontario Museum, University of New Mexico Mueum of Southwestern Biology, California Academy of Sciences, University of Kansas Natural History Museum, Museum of Vertebrate Zoology Electronic
    Texas Tech University Electronic
    Louisiana State University Museum of Natural Science Electronic

    Specimen data provided in electronic format by collections personnel.

    Specimens examined and data recorded manually.

    Specimen data accessed via query of the Mammal Networked Information System ( Stein and Wieczorek 2004).

    Data extracted from these sources (museum, catalog number, species, country, state, locality) were assigned geographic coordinates via consultation of a variety of electronic ( Natiónal Geospatial-Intelligence Agency 2004 University of California, Santa Barbara 2003) and print ( Davis and Misonne 1964) gazetteers. All georeferencing was checked for accuracy and consistency with taxonomic concepts by plotting occurrences on maps of Africa in Arc View version 3.2 (Environmental Systems Research Institute, Inc., Redlands, California) although some misidentifications and other errors may persist, the picture of species' distributional areas is consistent with authoritative references ( Kingdon 1997 Rosevear 1969 Wilson and Reeder 1993).

    Ecological niche modeling.—To provide further detail and an educated interpolation of likely distributional patterns for each species, we used ecological niche modeling. This general class of procedures is based on known occurrences of species, as they relate to digital raster geographic information system coverages that summarize potentially relevant ecological parameters. The idea is to identify a suite of ecological conditions within which the species in question can likely maintain populations without immigrational input ( Grinnell 1917, 1924). The result is a picture of the species' potential geographic distribution, defined as the area meeting the species' ecological niche requirements that characterize known distributional areas ( Soberón and Peterson 2005).

    We used the Genetic Algorithm for Rule-set Prediction, or GARP ( Stockwell and Noble 1992 Stockwell and Peters 1999), which has seen extensive testing and application to such questions ( Peterson and Cohoon 1999 Stockwell and Peterson 2002a, 2002b, 2003). GARP is an evolutionary-computing approach that relates known occurrences of species to raster data layers summarizing relevant environmental parameters to create a model of the ecological niche of the species, which can in turn be used to identify a potential geographic distribution ( Soberón and Peterson 2005). We used the 19 bioclimatic variables from the WorldClim global 0.17° data set ( Hijmans et al. 2005), plus data on topography and land form, including elevation, slope, aspect, and compound topographic index ( United States Geological Survey 2001) to characterize ecological landscapes. All data were resampled to 10 × 10-km spatial resolution for analysis.

    Because our use of GARP is for visualization and interpolation purposes only, and because the technique has been documented in detail elsewhere ( Anderson et al. 2002, 2003 Illoldi et al. 2004 Martx00EDnez-Meyer et al. 2004 Ortega-Huerta and Peterson 2004 Peterson 2005 Soberón and Peterson 2004), we do not provide a full, detailed description herein. We used half of the available occurrence data for training models, and half to provide test data sets that characterized model success in predicting independent occurrence points. Using the GARP algorithm, we developed 100 replicate models for each species, and followed recent recommended protocols ( Anderson et al. 2003) in using independent measures of omission and commission (type I and type II) prediction error to identify an optimal 10% of models from the 100 replicate models originally produced the sum of these 10 models was taken as the best hypothesis of the species' distribution.

    Procedures for applying filters.—Known and predicted distributions of each mammal species or set of mammal species making up broader clades were reviewed by ATP, MP, DSC, HL, and James N. Mills (see “Acknowledgments”) as a group, and compared with the known distribution of filovirus disease outbreaks ( Peterson et al. 2004a Fig. 1) across Africa. We considered 3 features of distributions of mammal clades: whether the geographic distribution of the mammal species or clade overlaps all of the known virus outbreak sites, a criterion that was considered necessary for further consideration whether the mammal species or clade is distributed more broadly than the virus, and in which directions and whether single mammal species (using taxonomy from Wilson and Reeder [1993]) cover the range of multiple virus species or whether multiple mammal species were represented within the distributional area of a particular filovirus species. The latter 2 features of mammalian distributions were not considered to be grounds on which mammal clades would be eliminated from consideration, but they are certainly relevant to the issue, because broad distributions can complicate bio-geographic interpretations ( Page 2003). Mammal clades were identified based on traditional, hierarchical taxonomy ( Wilson and Reeder 1993).

    Distributional summary of Ebola and Marburg viruses, with predicted distributions based on ecological niche models of outbreak coordinates ( Peterson et al. 2004a). Ebola virus distribution shown as highest probability in black and intermediate probability in dark gray Marburg virus distribution shown as highest probability in white and intermediate probability in light gray. Square, Ebola virus outbreak triangle, Marburg virus outbreak.

    Distributional summary of Ebola and Marburg viruses, with predicted distributions based on ecological niche models of outbreak coordinates ( Peterson et al. 2004a). Ebola virus distribution shown as highest probability in black and intermediate probability in dark gray Marburg virus distribution shown as highest probability in white and intermediate probability in light gray. Square, Ebola virus outbreak triangle, Marburg virus outbreak.


    Abstract

    Assessing the cytoplasmic uptake of fluorescently-tagged drugs in heterogeneous cell types currently involves time-consuming manual segmentation of confocal microscopy images. We developed a set of methods that incorporate map algebra techniques to facilitate and expedite image segmentation, particularly of the parenchyma of intermediate cells in the stria vascularis of the inner ear. Map algebra is used to apply a convolution kernel to pixel neighborhoods to create a masking image to select pixels in the original image for further operations. Here, we describe the utility of integrated intensity-based, percentile-based, and local autocorrelation-based methods to automate segmentation of images into putative morphological regions for pixel intensity analysis. Integrated intensity-based methods are variants of watershed segmentation tools that determine morphological boundaries from rates of change in integrated pixel intensity. Percentile- and local autocorrelation-based methods evolved out of the process of developing map algebra- and integrated intensity-based tools. We identified several simplifications that are surprisingly effective for image segmentation and pixel intensity analysis. These methods were empirically validated on three levels: first, the algorithms were developed based on iterations of inspected results second, algorithms were tested for various types of robustness and third, developed algorithms were validated against results from manually-segmented images. We conclude the key to automated segmentation is supervision of output data.

    Citation: Kachelmeier A, Shola T, Meier WB, Johnson A, Jiang M, Steyger PS (2018) Simplified, automated methods for assessing pixel intensities of fluorescently-tagged drugs in cells. PLoS ONE 13(11): e0206628. https://doi.org/10.1371/journal.pone.0206628

    Editor: Thomas Abraham, Pennsylvania State Hershey College of Medicine, UNITED STATES

    Received: June 5, 2018 Accepted: October 16, 2018 Publié : November 1, 2018

    Copyright: © 2018 Kachelmeier et al. This is an open access article distributed under the terms of the Creative Commons Attribution License, which permits unrestricted use, distribution, and reproduction in any medium, provided the original author and source are credited.

    Data Availability: All files are now available at the following web address: https://www.dropbox.com/sh/z64316akvqd332e/AAD5fpXFtV5Q95aU0DK6OlIca?dl=0.

    Funding: This work was supported by the National Institute of Deafness and Other Communication Disorders (NIH-NIDCD) grants R01 DC004555 to PSS, R01 DC012588 to PSS and P30 DC005983, with illustration drafts and figure formatting by Karen Thiebes, Simplified Science Publishing, LLC. Funding agencies had no role in study design, data collection and analysis, preparation of the manuscript, or decision to publish.

    Competing interests: Illustration drafts and figure formatting were completed by Karen Thiebes, Simplified Science Publishing, LLC. A provisional patent application has been filed on this subject matter: US Provisional Patent Application No. 62/678,409 “Automated methods for assessing pixel intensities of fluorescently-tagged drugs in cells." There are no products in development or marketed products to declare. This does not alter our adherence to all the PLOS ONE policies on sharing data and materials.


    Author Contributions

    All authors conceived the ideas for this manuscript. F.B. executed the analyses and led the writing, with contributions from all co-authors. A.B., M.N. and A.G. developed the larger framework and obtained the funding for the project.

    Please note: The publisher is not responsible for the content or functionality of any supporting information supplied by the authors. Any queries (other than missing content) should be directed to the corresponding author for the article.


    Voir la vidéo: Création dune couche vectorielle