Méthode basée sur l'innovation

Cette méthode a été introduite en météorologie à la fin de années 80 (Hollingworth et Lönnberg, 1986). Elle est basée sur l'utilisation de l'innovation ( ${\mathbf d}={\mathbf y}^o-H{\mathbf x}^b$) d'un réseau d'observations suffisamment grand et dense tel qu'il puisse fournir des informations sur les différentes échelles présentes dans la physique du système. Cette méthode permet d'obtenir des statistiques moyennes permettant de construire des matrices de covariances d'erreur statiques. Deux hypothèses importantes sont émises : les erreurs d'ébauches sont indépendantes des erreurs d'observation et les erreurs d'observation ne sont pas corrélées spatialement. Le principe est ensuite assez simple (Fig. 6.1). Il suffit de construire un histogramme représentant les covariances de du vecteur d'innovation en fonction de la distance de séparation. Pour une séparation nulle, l'histogramme fournit une information moyenne sur les variances d'erreurs d'ébauche et d'observation. Pour une distance non-nulle, l'histogramme ne fournit plus qu'une information moyenne sur les corrélations d'erreur d'ébauche.
Figure: Représentation de la méthode basée sur l'innovation. Les statistiques de covariances de l'innovation ( ${\mathbf y}^o-H{\mathbf x}^b$) d'un système d'assimilation sont rangées dans un histogramme en fonction de la distance séparant les deux points. L'histogramme à l'origine permet d'estimer les variances d'ébauche et d'observation moyennes.
\begin{figure}\centering
\centering\mbox{ \epsfig{file=innovation_method.eps}}\end{figure}

Soit deux points d'observation $i$ et $j$, la covariance d'innovation $c(i,j)$ s'écrit

$\displaystyle c(i,j)$ $\textstyle =$ $\displaystyle E\left[({\mathbf y}^o_i-{\mathbf H}_i{\mathbf x}^b)({\mathbf y}^o_j-{\mathbf H}_j{\mathbf x}^b)^T\right]$  
  $\textstyle =$ $\displaystyle E\left[\left(({\mathbf y}^o_i-{\mathbf H}_i{\mathbf x}^t)+({\math...
...f x}^t)+({\mathbf H}_j{\mathbf x}^t-{\mathbf H}_j{\mathbf x}^b)\right)^R\right]$  
  $\textstyle =$ $\displaystyle E\left[({\mathbf y}^o_i-{\mathbf H}_i{\mathbf x}^t)({\mathbf y}^o...
...mathbf x}^t-{\mathbf x}^b)({\mathbf x}^t-{\mathbf x}^b)^T\right]{\mathbf H}_j^T$  
  $\textstyle +$ $\displaystyle E\left[({\mathbf y}^o_i-{\mathbf H}_i{\mathbf x}^t)({\mathbf x}^t...
...mathbf x}^t-{\mathbf x}^b)({\mathbf y}^o_j-{\mathbf H}_j{\mathbf x}^t)^T\right]$  
  $\textstyle =$ $\displaystyle {\mathbf R}_{ij}+{\mathbf H}_i{\mathbf B}{\mathbf H}_j^T$ (6.1)

En utilisant l'hypothèse que l'erreur d'ébauche n'est pas corrélée à l'erreur d'observation, l'Eq. 6.1 ne conserve que deux termes : le premier est la covariance d'erreur d'observation entre les points $i$ et $j$ ; le second est la matrice de covariances d'erreur d'ébauche interpolée (si l'opérateur d'observation n'agit qu'en tant qu'opérateur d'interpolation) en ces points. Ceci en supposant que ces deux termes sont homogènes sur l'ensemble des observations.

Si les points $i$ et $j$ sont identiques ($i=j$), alors la corrélation du vecteur d'innovation au point $i$ est la somme des variances d'erreurs d'ébauche et d'observation ( $c(i,j)=s^o_i+s^b_i$). Si les points $i$ et $j$ sont différents ($i\neq j$) et que l'erreur d'observation n'est pas corrélée spatialement, alors la corrélation du vecteur d'innovation entre les points $i$ et $j$ est la covariance d'erreur d'ébauche entre ces points ( $c(i,j)={\mathbf H}_i{\mathbf B}{\mathbf H}_j^T$). À noter que la décorrélation spatiale d'erreur d'observation est fondamentale, car seule cette hypothèse permet de séparer l'information provenant de la matrice de covariances d'erreur d'observation ${\mathbf R}$ et d'ébauche ${\mathbf B}$.

A partir de ces hypothèses, si les points $i$ et $j$ sont très proches l'un de l'autre sans jamais être égaux, alors la corrélation du vecteur d'innovation entre les point $i$ et $j$ tend vers la variance d'erreur d'ébauche au point $i$ ( $\lim_{i\to j}c(i,j)=s^b_i$). En prolongeant la courbe formée par la corrélation du vecteur d'innovation vers une séparation nulle, il est donc possible d'obtenir la variance d'erreur d'ébauche. La variance d'erreur d'observation est alors la différence entre la corrélation du vecteur d'innovation pour une séparation nulle et la variance d'erreur d'ébauche obtenue ( $s^o_i=c(i,j)-s^b_i$). Il est aussi possible d'obtenir les corrélations d'erreur d'ébauche en fonction de la distance de séparation en prenant le rapport de la corrélation du vecteur d'innovation sur la variance d'erreur d'ébauche ($c(i,j)/s^b_i$). Ce résultat n'est possible que si les variances d'erreur d'ébauche sont homogènes sur tout le jeu d'observations.

Si les covariances d'erreur d'ébauche ne tendent pas vers zéro pour une grande distance de séparation, c'est le signe de la présence d'un biais dans l'ébauche et/ou les observations. Dans ce cas, cette méthode ne fonctionnera pas correctement.

La méthode basée sur l'innovation est la seule méthode directe permettant de diagnostiquer les statistiques d'erreur. Cependant, elle ne fournit des informations que dans l'espace des observations et donc que dans les régions observées. Pour obtenir de bons résultats, il faut un réseau d'observations uniforme et pas trop dense pour ne pas biaiser les statistiques. Cette méthode n'est donc pas toujours très pratique pour spécifier les statistiques des erreurs. De plus, elle ne fournit que des valeurs moyennes ne permettant que de construire des matrices de covariances d'erreur statiques.

Nicolas Daget 2007-11-16