数据同化(Data Assimilation):在地球物理学领域,数据同化就是利用物理特性以及时间演变定律的一致性约束将观测信息加入到模式状态中的一种分析技术。简单的说:数据同化就是利用一系列约束条件将观测信息加到模式中,更改模式的初始状态和观测更为接近(即尽可能接近真实大气状态的真实状态),来达到更好的预报效果。
同化预报系统框架
上图是常规的同化预报系统框架。其中主要涉及到三个过程:前处理阶段,同化预报阶段和后处理。
前处理阶段:主要获取观测数据,并对观测数据进行解码和编码过程,就是将观测数据准备成同化系统能够接受的格式
同化预报阶段:将上述准备的数据通过分析,得到最优的大气状态,优化初始场,然后利用数值模式进行预报
后处理:预报结果的统计分析,验证和优化过程
重点说一下同化预报阶段的分析过程。在分析过程中,会利用模式的背景场(模式/背景向量),大量的观测数据(观测向量),来找到最可能的真实大气状态(分析向量)。
分析过程解析
如上图所示,整个分析过程的目的就是确定最终的分析向量。分析向量等于背景向量与分析增量的和。对于数值预报而言,背景向量通常是已知的,所以分析过程的目的就是计算分析向量。分析增量通常是由观测增量和权重系数的乘积计算得到。
明白上述的计算流程后,我们对上述过程涉及到的定义/术语进行简单的解释:
观测向量:由一些列观测数据构成的向量
背景向量:模式预报的大气状态向量
观测算子:可以理解为将模式变量从模式空间转换到观测空间的函数,简单点可以理解为插值函数,负责将模式格点变量插值到观测格点
观测增量(innovation):观测向量和经过观测算子计算后的背景向量之差,就是将背景向量插值到观测格点后的结果和观测向量的差
代表性误差:由于模式离散化,模式分辨率低于实际情况等诸多原因所导致的误差
观测误差:由于测量设备问题所导致的误差,在数据表达中,通常也会将代表性误差划为观测误差,等于观测向量和经过观测算子转换后的真实状态的差
背景误差:由于模式物理过程等简化所导致的误差,等于背景向量与真实向量之差
背景误差协方差:模式变量之间的总体误差矩阵
观测误差协方差:观测变量之间的总体误差矩阵
权重矩阵:根据观测误差协方差矩阵和背景误差协方差矩阵通过代数计算得到的权重系数矩阵
分析增量:观测增量和权重系数矩阵的乘积