Commit 5afecf90 authored by Philémon POUX's avatar Philémon POUX

Section données et méthodes finie, pas satisfaisant

parent 60caa022
%!TEX root = ../main.tex
% Appendix Template
\chapter{Autres bases de données} % Main appendix title
\label{Appendix_data}
% Table generated by Excel2LaTeX from sheet 'Feuil4'
\begin{table}[htbp]
\centering
\caption{Autres bases de données socio-économiques traitées}
\resizebox{\textwidth}{!}{
\begin{tabular}{C{5.355em}C{8em}C{5.355em}C{5.355em}C{5.355em}C{5.355em}C{3em}C{3em}C{5.355em}}
Origine & Groupe & Lien & Information & Type & Résolution & 2000 & 2010 & Référence\\
\midrule
CensusHub & Household Types & \href{https://ec.europa.eu/CensusHub2/query.do?step=selectHyperCube\&qhc=false}{Lien} & Types de foyer & Vecteur & LAU & NON & OUI (2011) &\\
CensusHub & Age & \href{https://ec.europa.eu/CensusHub2/query.do?step=selectHyperCube\&qhc=false}{Lien} & Distribution par âge & Vecteur & LAU & NON & OUI (2011) &\\
CensusHub & Sex & \href{https://ec.europa.eu/CensusHub2/query.do?step=selectHyperCube\&qhc=false}{Lien} & Distribution par sexe & Vecteur & LAU & NON & OUI (2011) \\
SEDAC & Global Gridded Geographically Based Economic Data (G-Econ), v4 (1990, 1995, 2000, 2005) & \href{http://sedac.ciesin.columbia.edu/data/set/spatialecon-gecon-v4}{Lien} & PIB & Raster & 1 degré & OUI & OUI & \cite{nordhaus_global_2016}\\[1.5cm]
SEDAC & Global 15 x 15 Minute Grids of the Downscaled GDP Based on the SRES B2 Scenario, v1 (1990, 2025) & \href{http://sedac.ciesin.columbia.edu/data/set/sdp-downscaled-gdp-grid-b2-1990-2025/data-download}{Lien} & GDP & Raster & 15min arc & NON & NON & \cite{gaffin_global_2004}\\[1.5cm]
WorldPop & Répartition par âge et sex & \href{ftp://ftp.worldpop.org.uk/GIS/AgeSex\_structures/Global\_2000\_2020/}{Lien} & Distribution par âge et sexe & Raster & 100m & OUI & OUI &\cite{pezzulo_sub-national_2017}\\
Global Risk Data Platform (UNEP) & Gross Domestic Product 2010 & \href{https://preview.grid.unep.ch/index.php?preview=data\&events=socec\&evcat=1\&lang=eng}{Lien} & GDP & Raster & 30sec arc & NON & OUI & \\
NLDI & The Night Light Development Index (NLDI): A spatially explicit measure of human development from satellite data & \href{http://www.soc-geogr.net/7/23/2012/}{Lien} & NLDI & Raster & 0,25x0,25 & NON & NON (2006) &\cite{elvidge_night_2012}\\
\end{tabular}%
}
\label{tab:extra_socio_db}%
\end{table}%
......@@ -81,3 +81,48 @@
\subcaption*{Les valeurs positives correspondent à une sur-exposition des plus pauvres et les valeurs négatives à une sous-exposition}
\label{fig:dif_exp_student_tmax}
\end{figure}
\begin{table}[ht]
\centering
\begin{tabular}{ll}
\hline
Code ISO Alpha 2 & Pays \\
\hline
AT & Autriche \\
BE & Belgique \\
BG & Bulgarie \\
HR & Croatie \\
CY & Chypre \\
CZ & République Tchèque \\
DK & Danemark \\
EE & Estonie \\
FI & Finlande \\
FR & France \\
DE & Allemagne \\
HU & Hongrie \\
IS & Islande \\
IE & Irlande \\
IT & Italie \\
LV & Lettonie \\
LI & Liechtenstein \\
LT & Lituanie \\
LU & Luxembourg \\
MT & Malte \\
NL & Pays-Bas \\
NO & Norvège \\
PL & Pologne \\
PT & Portugal \\
RO & Roumanie \\
SK & Slovaquie \\
SI & Slovénie \\
ES & Espagne \\
SE & Suède \\
CH & Suisse \\
TR & Turquie \\
MK & L'ex-République Yougoslave de Macédoine \\
\hline
\end{tabular}
\caption{Liste des pays inclus dans l'analyse par pays}
\label{tab:list_pays}
\end{table}
......@@ -5,3 +5,69 @@
\chapter{Données et traitement}
\label{ch:Donnees et methodes}
Ce chapitre présente les bases de données utilisées dans notre étude et le traitement que nous avons appliqué afin de pouvoir les exploiter.
\section{Données socio-économiques}
La \autoref{tab:socioeco_db} résume les principales informations sur les bases de données utilisées.
\begin{table}[htbp]
\centering
\caption{bases de données socio-économiques utilisées}
\resizebox{\textwidth}{!}{
\begin{tabular}{C{5.355em}C{5.355em}C{5.355em}rC{5.355em}C{5.355em}C{5.355em}}
Origine & Nom & Information & \multicolumn{1}{C{5.355em}}{Année} & Résolution & Lien & Référence \\
\midrule
SEDAC & Basic Demographic Characteristics, v4.11 & \% < 15 ans, \% < 65 ans et \% de femmes & 2010 & 30 secondes d'arc & \href{http://sedac.ciesin.columbia.edu/data/set/gpw-v4-basic-demographic-characteristics-rev11}{Lien} &\cite{sedac_gridded_2019} \\[1.5cm]
Center for Global Environment Research (CGER) & Estimation of gridded population and GDP scenarios with spatially explicit statistical downscaling & PIB et Population & 2010 & 15 minutes d'arc & \href{http://www.cger.nies.go.jp/gcp/population-and-gdp.html}{Lien} & \cite{murakami_estimation_2016} \\
\end{tabular}%
}
\label{tab:socioeco_db}%
\end{table}%
Nous avons ensuite utilisé \textbf{R} et \textbf{cdo} pour traiter et normaliser ces données. La normalisation s'est faite vers une résolution de $0.5$ degré selon une l'extension spatiale suivante :
\[
\left \{
\begin{array}{rcl}
x_{min} & = & -41.92681 \\
x_{max} & = & -53.07319 \\
y_{min} & = & 19.29244 \\
y_{max} & = & 74.29244
\end{array}
\right .
\]
Pour les données du CGER nous avons précédemment divisé les données de PIB par la population totale pour obtenir le PIB par habitant.
D'autres données, correspondant à d'autres variables ou d'autres années ont également été identifiées et normalisées. Nous avons décidé d'utiliser des données pour l'année 2010 car la elles étaient disponibles à une résolution fine et fiables. Nous avons également pu obtenir de telles données pour 2000 mais il nous a semblé plus judicieux d'effectuer notre étude sur une population la plus récente possible. Un bref descriptif des autres bases de données est présenté
\section{Données climatologiques}
Afin de d'identifier les vagues de chaleurs en Europe, nous avons utilisé la base de donnée E-OBS présentée en \autoref{tab:climato_db}. Afin d'appliquer la méthodologie décrite en \autoref{sec:Detection des vagues de chaleur} nous avons utilisé \textbf{cdo} pour ne garder que les mois d'été (juin, juillet et août) et recentrer les données.
\parencite{cornes_ensemble_2018} qui recense les températures
\begin{table}[htbp]
\centering
\caption{bases de données socio-économiques utilisées}
\resizebox{\textwidth}{!}{
\begin{tabular}{C{5.355em}C{5.355em}C{5.355em}C{5.355em}C{5.355em}C{5.355em}C{5.355em}}
Origine & Nom & Information & Fréquence & Résolution & Lien & Référence \\
\midrule
E-OBS & E_OBS v9.0e & $T_\text{min}$ et $T_\text{max}$ & Journalier (1950-2018) & 0.25 degrés & \href{http://surfobs.climate.copernicus.eu/dataaccess/access_eobs.php}{Lien} &\cite{cornes_ensemble_2018} \\
\end{tabular}%
}
\label{tab:climato_db}%
\end{table}%
Nous avons ensuite appliqué la méthodologie de \cite{stefanon_heatwave_2012} avec les paramètres suivants :
\begin{description}
\item[$\bullet$ Fenêtre temporelle :] Nous avons utilisé une fenêtre temporelle de 21 jours centrée sur le jour étudié.
\item[$\bullet$ Fenêtre spatiale :] Nous avons pris un carré de côté 3.75 degré d'arc centré sur le point de grille étudié.
\item[$\bullet$ Percentile :] Nous avons pris le 95\ieme{} percentile de la distribution des températures sur les 21 jours entre 1950 et 2018 comme seuil.
\item[$\bullet$ Durée :] Nous avons défini une vague de chaleur pour 4 jours consécutifs dépassant le seuil
\end{description}
Les auteurs ont eu la gentillesse de partager leur code avec nous et nous avons donc pu le faire tourner\footnote{il s'agit de code Matlab}. Une fois la détection des vagues de chaleurs effectuée, nous avons pu normaliser les données.
%
......@@ -26,7 +26,7 @@ En Europe, on peut citer les travaux de l'\ac{IAU} de la région Île-de-France
Il résulte de la lecture de ces articles qu'étudier la distribution de l'exposition aux vagues de chaleur en Europe de façon spatialisée en définissant de façon rigoureuse la notion de vagues et chaleurs en caractérisant les tendances spatiales permettrait de compléter la littérature existante de façon pertinente.
\section{Détection des vagues de chaleur}
\label{sec:Détection des vagues de chaleur}
\label{sec:Detection des vagues de chaleur}
Il existe différentes méthodes pour détecter et caractériser des vagues de chaleurs. La composante temporelle est importante dans la définition d'une vague de chaleur qui est souvent caractérisée par une température dépassant un seuil pendant un certain nombre de jours. Ces seuils peuvent être variables et les plus fréquents sont \parencite{raei_ghwr_2018} :
\begin{description}
......@@ -82,7 +82,7 @@ Nous nous intéresserons donc, dans notre étude, au pourcentage de jeunes (de m
À partir des données climatologiques et socio-démographiques dont nous disposons, nous souhaitons effectuer des analyses statistiques afin de détecter d'éventuelles schémas dans la distribution spatiale.
\subsection*{\acf{ESDA}}
\subsection*{Exploratory Spatial Data Analysis}
Il existe pour ce faire l'\ac{ESDA}, qui fournit une méthodologie idoine. Développé par \cite{anselin_local_1995}, l'\ac{ESDA} repose principalement sur l'indice de Moran \parencite{moran_notes_1950}. L'indice $I$ de Moran caractérise l'auto-corrélation spatiale d'une variable spatiale $X$ caractérisé par une matrice de voisinage $W$ entre les observations. Il se calcule de la façon suivante :
\[
I = \frac{N}{\sum_{i}{\sum_{j}{w_{ij}}}} \frac{\sum_{i}{\sum_{j} w_{ij}(X_{i}-\overline{X}) (X_{j}-\overline{X})}}{\sum_{i}(X_{i}-\overline{X})^2}
......@@ -111,13 +111,20 @@ I_i = (X_i-\overline{X})\sum_{j}{w_{ij}(X_j-\bar{X}})
On a donc que la somme des indices locaux est proportionelle à l'indice globale :
\[
\sum_{i}{I_i} = I\times\frac{\sum_{i}((X_{i}-\overline{X})^2\sum_{j}{w_{ij}}}}{N}
\sum_{i}{I_i} = I\times\frac{\sum_{i}{(X_{i}-\overline{X})^2}\sum_{i}{\sum_{j}{w_{ij}}}}{N}
\]
Le \ac{LISA} permet de détecter localement des structures d'auto-corrélation positive et/ou négative tandis que l'indice de Moran ne donne qu'une tendance générale.
\subsection*{\acf{sPCA}}
\subsection*{Analyse par Composante Principale Spatiale}
En complément de l'\ac{ESDA}, \cite{jombart_revealing_2008} propose un analyse par composante principale intégrant l'auto-corrélation. Ainsi, il s'agit encore de trouver trouver une base orthonormée maximisant un critère permettant la réduction de la dimensionnalité en perdant le moins possible d'information. Comme on souhaite conserver une information sur l'organisation spatiale des données, chaque axe maximise non pas la variance le long de cet axe mais le produit de la variance et de l'indice de Moran. Formellement il s'agit de maximiser le critère $C$ :
\[
C(\textbf{v})=\text{var}(\textbf{Xv})I(\textbf{Xv})
\]
$\textbf{v}$ est un vecteur unitaire. Les auteurs montrent que les solutions sont les vecteurs propres de $\frac{1}{2N}\textbf{X}^T(\textbf{W}+\textbf{W}^T)\textbf{X}$.
Contrairement à un analyse par composante standard, les valeurs propres peuvent ici prendre des valeurs négatives car $I$ varie entre $-1$ et $1$. Une \ac{sPCA} doit donc présenter à la fois la composante variance et la composante Moran des valeurs propres. Un score hautement positif indique une grande variance et une forte auto-corrélation positive. Un score très négatif indique une forte auto-corrélation négative et une forte variance.
......
......@@ -42,6 +42,7 @@ La \autoref{fig:bivariate} permet de représenter les zones à haut revenu par h
\centering
\includegraphics[width=\textwidth]{../Figures/bivariate_hw_GDP.png}
\caption{Chloroplèthe bivarié : nombre de vagues de chaleur et revenu par habitant}
\label{fig:bivariate}
\end{figure}
......@@ -82,7 +83,7 @@ La \autoref{fig:sPCA axe tmin} présente l'explication des différentes variable
\section{Comparaison par pays}
Afin de tester notre hypothèse sur les différences entre pays, nous conduisons ici une étude comparative transversale entre les pays. Pour chacun des pays, nous testons l'hypothèse suivante : \textit{l'exposition à des vagues de chaleurs est significativement différente pour les 20\% les plus exposés que pour le reste de la population}.
Afin de tester notre hypothèse sur les différences entre pays, nous conduisons ici une étude comparative transversale entre les pays (liste des pays \autoref{tab:list_pays}). Pour chacun des pays, nous testons l'hypothèse suivante : \textit{l'exposition à des vagues de chaleurs est significativement différente pour les 20\% les plus exposés que pour le reste de la population}.
Nous réalisons donc un test de Student dans chacun des pays les variables suivantes :
\begin{itemize}
......
No preview for this file type
......@@ -79,6 +79,12 @@ headsepline, % Uncomment to get a line under the header
\addto\extrafrenchb{ \def\Appendixautorefname{Annexe}}
\definecolor{gray75}{gray}{0.75}
\usepackage{array}
\newcolumntype{L}[1]{>{\raggedright\let\newline\\\arraybackslash\hspace{0pt}}m{#1}}
\newcolumntype{C}[1]{>{\centering\let\newline\\\arraybackslash\hspace{0pt}}m{#1}}
\newcolumntype{R}[1]{>{\raggedleft\let\newline\\\arraybackslash\hspace{0pt}}m{#1}}
%% Hyphenation
\tolerance=1
\emergencystretch=\maxdimen
......@@ -346,7 +352,7 @@ Mes petits remerciements...
\include{Chapters/Introduction}
\include{Chapters/LiteratureReview}
\include{Chapters/Data_methods}
%\include{Chapters/Climato}
\include{Chapters/Climato}
\include{Chapters/Resultats}
\include{Chapters/CaseStudy}
\include{Chapters/Discussion}
......@@ -361,10 +367,9 @@ Mes petits remerciements...
% Include the appendices of the thesis as separate files from the Appendices folder
% Uncomment the lines as you write the Appendices
%\include{Appendices/AppendixA}
%\include{Appendices/AppendixB}
%\include{Appendices/AppendixC}
\include{Appendices/Acronyms}
\include{Appendices/AppendixData}
\include{Appendices/Appendix_resultats}
\include{Appendices/AppendixParPays}
\include{Appendices/AppendixCluster}
......
Markdown is supported
0%
or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment