Glossaire

Glossaire sur les données

Nom

Définition

Données

Source

Les données sont un groupe de variables qualitatives ou quantitatives. Alors que le concept de données est généralement associé à la recherche scientifique, les données sont collectées par un énorme ensemble d’organisations, d’institution, d’entreprises (par ex. données de vente, de revenues, bénéfices, prix de l’action), gouvernements (par ex. criminalité, chômage, illettrisme) et des organisations non gouvernementales (par ex. recensement des sans-domicile fixe).

Modèle de données

Source

Un modèle de données est un modèle abstrait qui organise des éléments de données et standardise les relations entre eux et leurs propriétés dans le monde réel. Par exemple, un modèle de données peut spécifier une donnée ‘voiture’ qui englobe un nombre d’autres éléments qui représentent, la couleur, la taille et le propriétaire de la voiture.

Qualité de données

Source

La qualité de la donnée renvoie au niveau de qualité de la donnée. Il y a un grand nombre de définitions sur la qualité de la donnée mais les données sont considérées de grande qualité si “elles sont adaptées à l’intention d’usage en opération, prise de décision ou planification.”

Données ouvertes

Source

Les données ouvertes sont l’idée que certaines données devraient être librement accessibles à tout le monde à utiliser et à republier à leur gré, sans restrictions du droit d’auteur, des brevets ou d’autres mécanismes de contrôle. Les objectifs du mouvement ouvert de données sont semblables à ceux d’autres mouvements «ouverts» tels que le code source ouvert, le matériel ouvert, le contenu ouvert et l’accès ouvert.

Requête

Source

Une requête Web est une requête qu’un utilisateur entre dans un moteur de recherche Web pour satisfaire ses besoins en informations. Les requêtes Web sont distinctes du fait qu’elles sont souvent du texte brut ou de l’hypertexte avec des directives de recherche facultatives (telles que «et» / «ou« avec »-« à exclure »). Elles sont considérablement différentes des langages de requête standard, qui sont régis par des règles de syntaxe strictes ou des langages de commande avec des paramètres de mot clé ou de position.

Web sémantique

Source

Une représentation en deux (ou peut-être trois) dimensions des relations sémantiques entre et parmi les termes et les concepts qu’ils représentent; (ANSI / NISO Z39.19-200x). Le Web sémantique fournit un cadre commun qui permet de partager et de réutiliser les données entre les frontières des applications, des entreprises et des communautés.

Taxonomie

Source

Une collection de termes de vocabulaire contrôlés organisés en structure hiérarchique.

Données non structurées

Source

Des données libres, telles que des fichiers multimédias, des images, des fichiers audio ou des textes non structurés. Les données non structurées ne suivent pas nécessairement un format ou une séquence hiérarchique, et ne suivent aucune règle relationnelle. Les données non structurées se réfèrent à des masses d’informations (habituellement) informatisées qui n’ont pas de structure de données facilement lisible par une machine.

Glossaire OpenDataSoft

Nom

Définition

Ressources

Les ressources sont les éléments graphiques téléchargés sur la plateforme. Les ressources peuvent être des images ou des polices et peuvent être utilisées sur des pages personnalisées.

Catalogue

Le catalogue est un registre de tous les jeux de données sur votre plate-forme. L’ensemble des jeux de données est organisé et on peut filtrer à l’aide de la recherche textuelle ou des filtres sur les caractéristiques des jeux de données.

Graphe

Source

Un graphe est une représentation graphique de données sur laquelle la données est représentée par des symboles, des barres dans un histogramme, des lignes dans un graphe linéaire ou des tranches dans un graphe camembert. Un graphe peut représenter des données tabulaires numériques, des fonctions ou des structures qualitatives et fournir différentes informations.

Editeur de graphes

L’éditeur de graphe est la solution de construction de graphes d’OpenDataSoft. Avec l’éditeur de graphe, vous pouvez choisir le type de visualisation, choisir les données à afficher et personnaliser les axes X et Y ou les couleurs.

Carte choroplèthe

Source

Une carte choroplèthe est une carte thématique dans laquelle les zones sont colorées ou avec des motifs en proportion de la variable statistique affichée sur la carte, par exemple la densité de population ou le revenu par habitant.

Console (API)

La console API permet aux utilisateurs d’interagir avec l’interface de programmation d’application. La console offre une gamme de paramètres à entrer pour voir les différentes réponses API.

Schéma de données (jeu de données)

Le schéma de données décrit les propriétés attachées à chaque champ d’un enregistrement d’un jeu de données. Le schéma de données inclut le nom du champ, le type et un exemple.

Jeu de données

Source

Un jeu de données est une collection organisée de données. La représentation la plus basique d’un jeu de données est un tableau d’éléments. Chaque colonne représente une variable particulière. Chaque ligne correspond à une valeur donnée de cette variable. Un jeu de données pourrait aussi représenter de l’information dans une variété de formats non-tabulaires, par exemple un fichier XML (extended mark-up language), un ficher géographique, ou un fichier image.

Description (jeu de données)

La description est un texte attaché au jeu de données, il permet aux utilisateurs de comprendre les données dans le jeu de données. Une bonne description permet de trouver des informations pertinentes.

Document

Source

Un fichier contenant des données structurées et/ou semi-structurées. Une aggregation de données discrètes et uniques produites avec l’intention de transmettre de l’information. Toutes les données dans le document peuvent être dans le même format (par ex. texte), ou un document peut être un ensemble de jeux de données dans une variété de formats (par ex. un fichier Word avec des graphiques insérés).

Format de fichier

Source

Un format de fichier est une manière standard d’encodage pour le stockage d’informations dans un fichier informatique. Il spécifie comment bits sont utilisés pour coder les informations dans un support de stockage numérique. Les formats de fichier peuvent être propriétaires ou libres et peuvent être non publiés ou ouverts.

Moissonneur

Un moissonneur est un processus automatisé pour aller chercher des données sur un portail distant. Le moissonneur va chercher des jeux de données sur un portail distant et les copie automatiquement sur la plateforme. Les jeux de données récupérés peuvent être cherchés avec des paramètres.

Mot-clé (jeu de données)

Les mots clés aident à comprendre le contenu des données de l’ensemble de données. Ils sont utilisés pour filtrer, rechercher et parcourir des ensembles de données par contenu. Les mots-clés sont non contraints et peuvent être tapés librement.

Licence (jeu de données)

La Licence fait référence aux autorisations attachées à un ensemble de données concernant les conditions d’utilisation, la reproductibilité et l’utilisation payante

Editeur de cartes

Editeur de cartes est la solution de création de cartes OpenDataSoft. Avec l’éditeur de carte, vous pouvez ajouter des jeux de données sur une vue géographique et personnaliser les couleurs, l’aggrégation et les infobulles.

Métadonnées

Source

Les métadonnées sont des “données qui fournissent des informations sur d’autres données”. Il existe deux types de métadonnées: les métadonnées structurelles et les métadonnées descriptives. Les métadonnées structurelles sont des données sur les conteneurs de données. Les métadonnées descriptives utilisent des instances individuelles de données d’application ou de contenu de données.

Producteur (jeu de données)

Le producteur est l’entité responsable de la diffusion des données soit auprès du grand public dans Open Data, soit auprès des utilisateurs ciblés

Enregistrement

Source

Un enregistrement (également appelé structure ou données composées) est une structure de données de base. Un enregistrement est un ensemble de champs, éventuellement de types de données différents, typiquement en nombre fixe et en séquence

Réutilisation

Une réutilisation est une déclaration volontaire d’utilisation de jeu de données dans un autre contexte (une carte, une application, un site Web) par n’importe qui

Sous domaine

Un sous-domaine est un domaine enfant d’un domaine parent. Un domaine parent peut distribuer ou collecter du contenu à ces domaines enfants.

Tags

Les tags (ou les mots clés) aident les utilisateurs à découvrir votre ensemble de données et doivent inclure des termes qui seraient utilisés par des utilisateurs techniques et non techniques.

Thème (jeu de données)

Un thème est une rubrique de jeu de données, il aide à classer les ensembles de données en grandes catégories. Les thèmes sont contraints et doivent être sélectionnés dans une liste.

Glossaire technique

Nom

Définition

API

Source

Une interface de programmation d’application est un ensemble de définition des manières de communiquer entre logiciels. C’est généralement une méthode d’abstraction entre la programmation haut-niveau et bas-niveau.

Clé API

Source

Une clé d’interface de programmation d’application (clé d’API) est un code passé par un programme qui appelle une interface de programmation d’application (API) pour identifier le programme appelant, son développeur et l’utilisateur associé sur le site.

Basic Auth

Source

L’authentification HTTP Basic authentication (BA) est la technique la plus simple pour implémenter le contrôle d’accès à des ressources web car elle ne nécessite pas de cookies, d’identifiants de sessions, de pages de login. A la place, l’authentification HTTP BA utilise des champs standards dans l’entête HTTP supprimant le besoin de ‘handshake’

CKAN (Comprehensive Knowledge Archive Network)

Source

CKAN signifie Comprehensive Knowledge Archive Network, c’est un système de gestion de données distribué en Open Source à la base du catalogue Data.gov et des catalogues d’environ 50 hubs de données dans le monde.

Connecteur

Un connecteur est un programme informatique conçu spécifiquement pour se connecter à une source de données. Une source de données peut être un portail Open Data ou bien un serveur FTP.

CSV (comma separated value)

Source

Un fichier séparé par des virgules (CSV) est un fichier utilisé pour implementer les listes séparées par des virgules. Le fichier CSV est utilisé pour le stockage de données structurées dans une table de listes . Chaque line dans le fichier CSV correspond à une ligne dans la table. Au sein de chaque ligne, les champs sont séparés par des virgules et chaque champ correspond à une table d’une colonne.

CSW (Catalog Service for the Web)

Source

Catalog Service for the Web (CSW), parfois aussi appelé Catalog Service - Web, est un standard pour exposer un catalogue d’enregistrements XML sur Internet (en HTTP). Le catalogue est constitué d’enregistrements qui décrivent les données géospatiales (e.g. KML), les services géospatiaux (e.g. WMS) et les ressources associées.

Base de données

Source

Une base de données est une collection organisée de données. Il s’agit de la collection de schémas, de tables, de requêtes, de rapports, de vues et d’autres objets.

DKAN (Drupal based CKAN)

Source

DKAN est une plate-forme de gestion de données open-source

DNS

Source

Le DNS (Domain Name System) est un système hiérarchisé décentralisé de noms pour les ordinateurs, les services ou toute ressource connectée à Internet ou à un réseau privé.

Point d’entrée

Source

Un endpoint indique un emplacement spécifique pour accéder à un service en utilisant un protocole spécifique et un format de données.

EPSG (European Petroleum Survey Group)

Source

Le jeu de données géodésiques EPSG est un jeu de données structuré de systèmes de référence de coordonnées et de transformations de coordonnées [...] La couverture géographique des données est dans le monde entier, mais il est important de noter que le jeu ne peut pas enregistrer tous les paramètres géodésiques possibles utilisés partout dans le monde.

FTP

Source

Le protocole de transfert de fichiers (FTP) est un protocole de réseau standard utilisé pour transférer des fichiers informatiques entre un client et un serveur sur un réseau informatique.

Géocodage

Source

Le géocodage est le processus informatique consistant à transformer une description d’adresse postale en un emplacement sur la surface de la Terre

HTML (HyperText Markup Language)

Source

HyperText Markup Language (HTML) est le langage de balisage standard pour la création de pages Web et d’applications Web. Avec Cascading Style Sheets (CSS) et JavaScript, il forme une triade de technologies angulaires pour le World Wide Web. Les navigateurs Web reçoivent des documents HTML d’un serveur web ou d’un stockage local et les rendent en pages Web multimédias.

HTTP (HyperText Transfer Protocol)

Source

La principale méthode utilisée pour transmettre des informations sur le World Wide Web. HTTP est un protocole de requête / réponse entre les clients et les serveurs.

JSON (JavaScript Object Notation)

Source

JSON (JavaScript Object Notation) est un format standard ouvert qui utilise un texte lisible par l’homme pour transmettre des objets de données constitués de paires attribut-valeur. C’est le format de données le plus courant utilisé pour la communication asynchrone de navigateur / serveur (AJAJ), remplaçant largement XML qui est utilisé par AJAX.

KML (Keyhole Markup Language)

Source

Keyhole Markup Language (KML) est un format XML qui permet d’exprimer une annotation et une visualisation géographiques dans des cartes bidimensionnelles et des navigateurs en trois dimensions de la Terre.

KMZ (Keyhole Markup Zipped)

Source

Les fichiers KML sont très souvent distribués dans des fichiers KMZ, qui sont des fichiers compressés avec une extension .KMZ. Lorsqu’un fichier KMZ est décompressé, un doc.kml unique est extrait ainsi que toute image de recouvrement et d’icône référencée dans le KML et tous les fichiers KML présents sur le réseau.

LDAP (Lightweight Directory Access Protocol)

Source

Le Lightweight Directory Access Protocol est un protocole d’application standard non lié à un fournisseur, permettant d’accéder et de maintenir des services d’information de répertoire répartis sur un réseau IP (Internet Protocol). Les services d’annuaire jouent un rôle important dans le développement d’applications intranet et Internet en permettant le partage d’informations sur les utilisateurs, les systèmes, les réseaux, les services et les applications sur l’ensemble du réseau.

Fichier lisible par une machine

Source

Se rapporte aux informations ou aux données qui sont dans un format qui peut être facilement traité par un ordinateur sans intervention humaine tout en s’assurant qu’aucun sens sémantique n’est perdu.

Mapbox

Source

Mapbox est un fournisseur de cartes en ligne personnalisées pour des sites tels que Foursquare, Pinterest, Evernote, le Financial Times, The Weather Channel et Uber Technologies. Depuis 2010, il a rapidement élargi la niche des cartes personnalisées, en réponse au choix limité offert par les fournisseurs de cartes telles que Google Maps.

OAuth

Source

OAuth est un standard ouvert pour l’autorisation d’accès, généralement utilisé comme un moyen pour les utilisateurs d’Internet de se connecter à des sites Web tiers en utilisant leurs comptes Google, Facebook, Microsoft, Twitter, One Network, etc sans exposer leur mot de passe. Généralement, OAuth fournit aux clients un “accès délégué sécurisé” aux ressources du serveur pour le compte d’un propriétaire de ressource.

oData

Source

Open Data Protocol (OData) est un protocole ouvert qui permet la création et la consommation d’API RESTful interrogeables et interopérables d’une manière simple et standard

Logiciel Open Source

Source

Les logiciels qui sont disponibles sous forme de code source: le code source et certains autres droits normalement réservés aux titulaires de droits d’auteur sont fournis sous une licence open-source qui permet aux utilisateurs d’étudier, de modifier, d’améliorer et parfois de distribuer le logiciel. Le logiciel est très souvent développé de manière publique et collaborative.

Parseur (ou extracteur)

Un parseur est un programme d’ordinateur qui prend un fichier comme entrée, le traite et l’indexe afin que la plate-forme ou les personnes effectuent des opérations complexes dessus.

RDF (Resource Description Framework )

Source

Le Resource Description Framework (RDF) est une famille de spécifications du World Wide Web Consortium (W3C) conçue à l’origine comme un modèle de données de métadonnées. Il est devenu une méthode générale pour la description conceptuelle ou la modélisation de l’information qui est implémentée dans les ressources Web, en utilisant une variété de notations de syntaxe et de formats de sérialisation des données. Il est également utilisé dans les applications de gestion des connaissances.

REST (Representational state transfer)

Source

REpresentational State Transfer (REST) est un style architectural utilisé pour le développement web. Les systèmes et les sites conçus à l’aide de ce style visent des performances rapides, la fiabilité et la capacité à l’échelle (de croître et de supporter facilement des utilisateurs supplémentaires). Pour atteindre ces objectifs, les développeurs travaillent avec des composants réutilisables qui peuvent être gérés et mis à jour sans affecter le système dans son ensemble pendant qu’il est en cours d’exécution.

RSS (Rich Site Summary)

Source

RSS (Rich Site Summary, à l’origine RDF Site Summary, souvent appelé Really Simple Syndication) utilise une famille de formats d’alimentation Web standard pour publier des informations fréquemment mises à jour: entrées de blog, titres d’actualités, audio et vidéo. Un document RSS (appelé «flux», «flux Web» ou «canal») comprend un texte complet ou résumé et des métadonnées, comme la date de publication et le nom de l’auteur.

Flux RSS

URL d’un flux RSS fournissant un accès à l’ensemble de données.

SAML (Security Assertion Markup Language)

Source

Le Security Assertion Markup Language (SAML) est un format de données standard ouvert XML pour échanger des données d’authentification et d’autorisation entre les parties, en particulier, entre un fournisseur d’identité et un fournisseur de services.

Shapefile

Source

Le format shapefile est un format de données vectoriel géospatial populaire pour les logiciels de système d’information géographique (SIG). Un shapefile stocke la géométrie non topologique et les informations d’attribut pour les entités spatiales d’un jeu de données. La géométrie d’une caractéristique est stockée sous la forme d’un ensemble de coordonnées vectorielles. Les fichiers Shapefile peuvent prendre en charge les fonctions point, ligne et zone.

SOAP (Simple Object Access Protocol)

Source

SOAP (Simple Object Access Protocol) est un protocole basé sur des messages basé sur XML pour accéder aux services sur le Web. Il emploie la syntaxe XML pour envoyer des commandes texte à travers l’Internet en utilisant HTTP. SOAP est similaire dans la finalité à la DCOM et CORBA distribué des systèmes d’objet, mais est plus léger et moins de programmation intensive. En raison de son mécanisme d’échange simple, SOAP peut également être utilisé pour mettre en œuvre un système de messagerie.

SQL (Structured Query Language)

Source

SQL (Structured Query Language) est un langage de programmation spécialement conçu pour gérer des données stockées dans un système de gestion de bases de données relationnelles (RDBMS) ou pour le traitement de flux dans un système de gestion de flux de données relationnelles (RDSMS).

Certificat SSL

Source

Un certificat SSL est un document électronique utilisé pour sécuriser les connexions entre les sites Web. Le certificat contient des informations sur la clé, des informations sur l’identité de son propriétaire et la signature numérique d’une entité qui a vérifié que le contenu du certificat est correct.

Swagger

Source

La spécification OpenAPI (initialement connue sous le nom de Swagger Specification) est une spécification pour les fichiers d’interface lisibles par machine pour décrire, produire, consommer et visualiser des services Web RESTful. Une variété d’outils peut générer du code, de la documentation et des cas de test à partir d’un fichier d’interface

Tuiles

Source

Les tuiles sont des fichiers images demandés individuellement sur Internet qui sont joints de façon transparente pour créer une carte

Token

Source

Un jeton (ou token) est une donnée qui est utilisée dans les communications réseau (souvent sur HTTP) pour identifier une session, une série d’échanges de messages connexes. Sur la plate-forme, les jetons vous permettent de vous connecter à des services externes.

TSV (Tab Separated Values)

Source

Un format de texte simple pour une table de base de données. Chaque enregistrement dans le tableau est une ligne du fichier texte. Chaque valeur de champ d’un enregistrement est séparée de la suivante par un caractère d’arrêt de tabulation. Il s’agit d’une forme du format de valeurs séparées par un délimiteur plus général.

Turtle (Terse RDF Triple Language)

Source

Turtle (Terse RDF Triple Language) est un format pour exprimer des données dans le modèle de données Resource Description Framework (RDF) avec une syntaxe similaire à SPARQL. RDF, à son tour, représente l’information en utilisant «triples», chacun d’eux étant constitué d’un sujet, d’un prédicat et d’un objet. Chacun de ces éléments est exprimé en URI Web.

Service Web

Source

Un service Web est un service offert par un dispositif électronique à un autre dispositif électronique, communiquant entre eux via le World Wide Web. Dans un service Web, la technologie Web, telle que HTTP, conçue à l’origine pour la communication homme à machine, est utilisée pour la communication machine à machine, plus spécifiquement pour le transfert de formats de fichiers lisibles par machine tels que XML et JSON.

WFS (Web Feature Service)

Source

Web Feature Service Interface Standard (WFS) fournit une interface permettant des demandes de fonctionnalités géographiques à travers le Web en utilisant des appels indépendants de la plate-forme

WSDL (Web Services Description Language)

Source

Le langage de description de services Web est un langage de définition d’interface basé sur XML qui est utilisé pour décrire les fonctionnalités offertes par un service Web.

XML (Extensible Markup Language)

Source

XML (Extensible Markup Language) est une spécification polyvalente pour la création de langages de balisage personnalisés. Il est classifié comme un langage extensible, car il permet à l’utilisateur de définir les balises. Le but de XML est d’aider les systèmes d’information à partager des données structurées notamment via Internet, à encoder des documents et à sérialiser des données.