Hackaviz 2021 : quartiers prioritaires (QP) d’Occitanie : caractéristiques et transactions immobilières.
Cette année, nous proposons dans un jeu de données inédit :
- les caractéristiques démographiques et économiques des quartiers prioritaires
- les transactions foncières du 1er janvier 2016 au 31 décembre 2020.
- les contours géographiques des communes et des quartiers prioritaires
Ce jeu de données est réparti sur trois fichiers. Il est possible de faire de belles visualisations à partir d’un seul de ces fichiers. Vous pouvez aussi les combiner, mais il n’est pas certain que la plus belle histoire ait besoin de toutes ces données.
Ces données sont extraites de sources pour lesquelles certaines valeurs ne sont pas renseignées. Avant de vous lancer dans des calculs d’indicateurs statistiques, pensez à examiner la qualité des données et le nombre d’échantillons considérés !
Retrouvez les règles et les modes d’évaluation sur la page Hackaviz 2021 de l’association Toulouse Dataviz (TDV).
N’hésitez pas à nous contacter sur le discord du Toulouse DataViz pour discuter entre participants, si vous avez besoin d’aide à propos des données ou pour rapporter des bugs.
Bonne chance !
Description générale des données
Ces données sont disponibles sous forme de 4 fichiers, déclinés sous
forme de données tabulaires au format
.csv
et
géographique au format
.geojson
.
Pour télécharger un de ces fichiers, placez la souris sur le nom du fichier, faites un clic droit et choisir “Enregistrer la cible du lien sous …”.
Fichier de données | Contenu |
---|---|
qp.csv |
caractéristiques des 105 quartiers prioritaires d’Occitanie |
foncier_qp.csv |
transactions immobilières dans ces quartiers entre 2016 et 2020 |
communes.geojson |
contour géographique des communes d’Occitanie |
qp.geojson |
contour géographique des quartiers de ces communes |
Une archive (.zip
) est aussi disponible pour
télécharger
toutes les données.
Format de fichiers CSV
- Les fichiers sont encodés en UTF-8.
- Les fichiers
csv
utilisent le séparateur de colonne “,
” et le caractère décimal “.
”. - Ces
csv
ont été exportés depuis à un paramètre régional anglais. Pensez à modifier les paramètres d’import de votre logiciel préféré ! - Si vous avez des difficultés à importer ces
csv
, nous vous proposons une alternative sous forme de fichier Microsoft Excel.
Fichier de données | Contenu |
---|---|
qp.xlsx |
caractéristiques des 105 quartiers prioritaires d’Occitanie |
foncier_qp.xlsx |
transactions immobilières dans ces quartiers entre 2016 et 2020 |
Format de fichiers JSON
- Les latitudes et longitudes sont exprimées dans la projection
World Geodetic System 1984
(WGS 84). - Elles sont tronquées sur 4 décimales.
Jointures
- Nous avons pris le soin d’unifier les noms de colonnes des différents fichiers afin que vous puissiez faire des jointures.
- Vous n’avez aucune obligation à fusionner ces fichiers : pensez d’abord à l’histoire que vous voulez raconter !
- Pour joindre deux
csv
, vous pouvez utiliser un modèle ObservableHQ, des librairies comme Pandas ou le coder directement. - Pour fusionner des données géographiques
geojson
et uncsv
, si vous ne connaissez pas QGIS ou R, nous vous suggérons Geo Data Merger qui vous permet de faire cela via une interface graphique simple. Sélectionnez un fichiergeojson
puis uncsv
qui va venir enrichir le geojson. Désignez ensuite une colonne “clé” sur les 2 fichiers pour faire la jointure.
Format des valeurs
- Les codes de départements et de communes ont été formattés respectivement sur 2 et 5 caractères conformément au code officiel géographique.
- Les codes de quartiers sont formés par le préfixe “QP” et 6 chiffres.
- Les dates sont au format ISO-8601 (YYYY-MM-DD) ex:
2020-12-31
. - Les valeurs foncières sont exprimées en euros.
- Les surfaces sont en mètres carrés.
Description détaillée des données
Description du fichier qp.csv
Caractéristiques démographiques et économiques des quartiers prioritaires d’Occitanie
-
Définitions
-
Quartier prioritaire (QP) de la politique de la ville : territoires en difficulté, cibles prioritaires de la politique de la ville, définis par la part de la population ayant un revenu inférieur à 11 250 € par an.
-
Communes englobantes : pour un quartier prioritaire, l’unité urbaine (une ou plusieurs communes) à laquelle le quartier appartient.
-
Population municipale : comprend les personnes ayant leur résidence habituelle sur le territoire de la commune, dans un logement ou une communauté; détenues dans les établissements pénitentiaires de la commune ; les sans-abri recensées sur le territoire de la commune ; résidant habituellement dans une habitation mobile recensée sur le territoire de la commune.
-
Population étrangère : toute personne résidant en France qui n’a pas la nationalité française.
-
Part parmi la population : calculé par rapport à la population municipale du QP.
-
Personnes couvertes par au moins une prestation CAF : allocataire + conjoint + enfants et autres personnes à charge.
-
Taux de pauvreté au seuil de 60% : part de la population sous le seuil de 60% du niveau de vie médian métropolitain. Les revenus sont calculés depuis les revenus fiscaux.
-
Taux de bas revenus : part de la population sous le seuil de 60 % du revenu déclaré par unité de consommation médian métropolitain. Les revenus sont issus des fichiers de la CAF. En savoir plus sur la différence entre le taux de pauvrété et de bas revenu : DOSSIER D’ETUDE N° 107 Août 2008 CAF, pp24-25.
-
Emploi précaire : contrat d’apprentissage, placé par une agence d’intérim, emplois-jeunes, CES, contrats de qualification, stagiaires rémunérés en entreprise, autres emplois à durée limitée
-
-
Note sur la source des données
- Le comptage de la population municipale (colonne ‘pop_com’) est une estimation de l’Insee et de la Caisse nationale des allocations familiales (Cnaf) en 2015. Ces valeurs diffèrent de celles du recensement INSEE effectué en 2016.
- Les données sont calculées pour la période 2015-2020. Elles ont été publiées par l’INSEE pour l’année 2019, sauf pour les données concernant l’insertion professionnelle. Pour ces dernières, l’année 2020 est considérée, le fichier de l’année 2019 étant corrompu.
Cette description est disponible sous forme de fichier .csv
meta_qp.csv.
colonne | description | type_valeur | exemple |
---|---|---|---|
code_qp | Code du quartier prioritaire (QP) | chaîne de caractères | QP082003 |
nom_qp | Libellé du QP | chaîne de caractères | Centre Ville |
nom_commune | Libellé géographique de la (des) commune(s) englobante(s) | chaîne de caractères | Moissac |
pop_mun | Population municipale du QP | entier | 2470 |
pop_com_qp | Cumul de la population municipale de tous les QP de la (des) commune(s) englobante(s) | entier | 3672 |
pop_com | Population municipale de la (des) commune(s) englobante(s) | entier | 12564 |
ind_jeune | Indice de jeunesse : population de 0 à 19 ans / population de 60 ans et plus | nombre rationnel | 0.9 |
tx_tot_et | Part des étrangers parmi la population | nombre rationnel | 25.4 |
tx_f | Part des femmes parmi la population | nombre rationnel | 50.6 |
tx_f_et | Part des étrangères parmi les femmes | nombre rationnel | 22.8 |
percou | Nombre de personnes couvertes par au moins une prestation CAF | entier | 1307 |
pmimp | Part des ménages imposés | nombre rationnel | 24.7 |
part_chomprinc | Part des ménages dont l’origine principale du revenu déclaré repose sur des indemnités de chômage | nombre rationnel | 8.1 |
decuc_q2 | Médiane (en euros) du revenu déclaré par unité de consommation | entier | 10136 |
decuc_d1 | Premier décile du revenu déclaré par unité de consommation | entier | 1404 |
decuc_d9 | Neuvième décile du revenu déclaré par unité de consommation | entier | 26388 |
disp_q2 | Médiane (en euros) du revenu disponible par unité de consommation | entier | 13305 |
disp_d1 | Premier décile (en euros) du revenu disponible par unité de consommation | entier | 6421 |
disp_d9 | Neuvième décile (en euros) du revenu disponible par unité de consommation | entier | 25058 |
tp60 | Taux de pauvreté | nombre rationnel | 43.9 |
brev | Taux de bas revenus | nombre rationnel | 59.1 |
a | Nombre total de foyers allocataires percevant au moins une prestation CAF | entier | 642 |
tx_tot_empl | Part des personnes de 15 à 64 ans actives ayant un emploi parmi les personnes de 15 à 64 ans | nombre rationnel | 47.5 |
tx_f_empl | Part des femmes de 15 à 64 ans actives ayant un emploi parmi les femmes de 15 à 64 ans | nombre rationnel | 41 |
tx_et_empl | Part des étrangers de 15 à 64 actifs ayant un emploi parmi les étrangers de 15 à 64 ans | nombre rationnel | 36.7 |
tx_tot_eprec | Part des personnes en emploi précaire parmi les personnes ayant un emploi. | nombre rationnel | 34.4 |
tx_f_eprec | Part des femmes en emploi précaire parmi les femmes ayant un emploi. | nombre rationnel | 31.9 |
tx_et_eprec | Part des étrangers en emploi précaire parmi les étrangers ayant un emploi. | nombre rationnel | 59.3 |
abcde | Nombre total de demandeurs d’emploi en fin de mois | entier | 774 |
abcde_f | Nombre total de demandeurs d’emploi femmes | entier | 327 |
abcde_h | Nombre total de demandeurs d’emploi hommes | entier | 447 |
abc_capbep | Nombre de demandeurs d’emploi de catégorie A, B ou C de niveau de formation CAP-BEP | entier | 187 |
abc_bac | Nombre de demandeurs d’emploi de catégorie A, B ou C de niveau de formation BAC | entier | 111 |
abc_supbac | Nombre de demandeurs d’emploi de catégorie A, B ou C de niveau de formation supérieur au BAC | entier | 64 |
ec_mat | Nombre d’écoles maternelles à moins de 100m du QP | entier | 1 |
ec_elem | Nombre d’écoles élémentaires à moins de 100m du QP | entier | 2 |
ec_elem_pri | Nombre d’écoles élémentaires privées à moins de 100m du QP | entier | 1 |
coll | Nombre de collèges à moins de 300m du QP | entier | 2 |
coll_pri | Nombre de collèges privés à moins de 300m du QP | entier | 1 |
nbetab | Nombre d’établissements | entier | 282 |
ens_sante | Nombre d’établissements de service aux particuliers : enseignement, santé et action sociale | entier | 37 |
serv_par | Nombre d’établissements de service aux particuliers | entier | 72 |
serv_tot | Nombre d’établissements de service : services aux entreprise et services aux particuliers | entier | 137 |
auto_ent | Nombre d’auto-entrepreneurs parmi les créations d’établissements | entier | 3 |
Description du fichier foncier_qp.csv
Transactions foncières du 1er janvier 2016 au 31 décembre 2020
- Afin de simplifier les données, nous n’avons conservé que les transactions sur les maisons, les appartements et les locaux industriels. Les dépendances ainsi que les transactions de terrains non bâtis ont été supprimées.
- Ce fichier contient des transactions entre particuliers mais aussi celles effectuées par des investisseurs privés (groupe immobilier) ou institutionnels (office du logement). Selon l’histoire que vous voulez raconter, c’est à vous de trouver un moyen de différencier ou d’éliminer des transactions.
Cette description est disponible sous forme de fichier .csv
meta_foncier_qp.csv.
colonne | description | type_valeur | exemple |
---|---|---|---|
code_departement | Code département INSEE | chaîne de caractères | 09 |
nom_departement | Nom du département | chaîne de caractères | Ariège |
code_commune | Code commune INSEE | chaîne de caractères | 09261 |
nom_commune | Nom de la commune | chaîne de caractères | Saint-Girons |
code_qp | Code du quartier prioritaire | chaîne de caractères | QP009001 |
nom_qp | Libellé du quartier prioritaire | chaîne de caractères | Coeur De Ville |
id_mutation | Identifiant de vente | chaîne de caractères | 2019-100563 |
id_parcelle | Identifiant de parcelle (14 caractères) | chaîne de caractères | 092610000D0167 |
longitude | Longitude du centre de la parcelle concernée | nombre rationnel | 1.1438 |
latitude | Latitude du centre de la parcelle concernée | nombre rationnel | 42.9831 |
nombre_lot | Nombre de lots | entier | 0 |
date_mutation | Date de la vente | date | 2019-11-25 |
jour_mutation | Jour de la vente | chaîne de caractères | 25 |
mois_mutation | Mois de la vente | chaîne de caractères | 11 |
annee_mutation | Année de la vente | chaîne de caractères | 2019 |
nature_mutation | Type de mutation | chaîne de caractères | Vente |
valeur_fonciere | Valeur foncière | entier | 85000 |
code_type | Code de type de local | chaîne de caractères | 1 |
type_local | Libellé du type de local | chaîne de caractères | Maison |
surface_reelle_bati | Surface réelle du bâti | entier | 75 |
nombre_pieces_principales | Nombre de pièces principales | entier | 4 |
surface_terrain | Surface du terrain | entier | 60 |
Description du fichier communes.geojson
Contour des communes
- Toutes nos excuses auprès des Séméacaises et Séméacais. Le contour de la commune a été omis dans le jeu de données. Ce contour de commune concerne le quartier prioritaire “Tarbes Est”, à cheval sur Tarbes et Séméac.
Cette description est disponible sous forme de fichier .csv
meta_communes.csv.
nom colonne | description | type_valeur | exemple |
---|---|---|---|
code_commune | Code commune INSEE | chaîne de caractères | 81021 |
code_departement | Code département INSEE | chaîne de caractères | 81 |
nom_commune | Nom de la commune | chaîne de caractères | Aussillon |
Description du fichier qp.geojson
Contour des quartiers prioritaires
Cette description est disponible sous forme de fichier .csv
meta_contours_qp.csv.
nom colonne | description | type_valeur | exemple |
---|---|---|---|
code_qp | Code du quartier prioritaire | chaîne de caractères | QP066007 |
nom_qp | Nom du quartier prioritaire | chaîne de caractères | Bas-Vernet Nouveau QPV |
commune_qp | Nom de la commune principale du QP | chaîne de caractères | Perpignan |
code_commune | Code commune INSEE | chaîne de caractères | 66136 |
nom_commune | Nom de ou des communes englobantes | chaîne de caractères | Perpignan |
code_departement | Code département INSEE | chaîne de caractères | 66 |
Sources des données
- Caractéristiques des quartiers prioritaires: données produites par l’INSEE, démographie 2015 et revenus 2017.
- Transactions foncières: données publiées et produites par la direction générale des finances publiques. Ces données énumèrent les transactions intervenues au cours des cinq dernières années sur le territoire métropolitain et les DOM-TOM, à l’exception de l’Alsace, de la Moselle et de Mayotte. Les données contenues sont issues des actes notariés et des informations cadastrales. Les données brutes sont disponibles ici. Elles peuvent être explorées par l’application Etalab.
- Liste des communes: liste publiée par l’INSEE ici.
- Contours des quartiers prioritaires: fichier
.shapefile
est disponible ici.
Historique des versions
- Juin 2021: construction du jeu de données avec Python, Pandas et jupyter-lab et création des fichiers
- Juillet 2021: première version de la consolidation des fichiers et étude autour d’aggrégats sous R et Rstudio
- Août 2021: consolidation des fichiers et génération du readme et export sous R et Visual Studio Code