《水文统计思维导图》
一、 水文统计基础概念
1.1 统计学基本原理
- 1.1.1 描述统计:
- 定义: 描述性地总结和呈现数据特征,但不进行推断。
- 常用方法:
- 集中趋势度量:
- 均值(Mean)
- 中位数(Median)
- 众数(Mode)
- 离散程度度量:
- 方差(Variance)
- 标准差(Standard Deviation)
- 变异系数(Coefficient of Variation)
- 分位数(Quantiles): 四分位数,百分位数
- 直方图(Histogram), 散点图(Scatter Plot)
- 集中趋势度量:
- 1.1.2 推断统计:
- 定义: 利用样本数据推断总体特征。
- 常用方法:
- 参数估计:
- 点估计
- 区间估计
- 假设检验:
- 显著性水平(Significance Level)
- P值(P-value)
- t检验
- F检验
- 卡方检验
- 参数估计:
1.2 水文序列的统计特性
- 1.2.1 序列的随机性:
- 自相关系数(Autocorrelation Coefficient)
- 游程检验(Run Test)
- Mann-Kendall检验
- 1.2.2 序列的平稳性:
- 均值平稳
- 方差平稳
- 协方差平稳
- ADF检验(Augmented Dickey-Fuller test)
- 1.2.3 序列的独立性:
- 相关系数矩阵
- 偏相关系数
- Bartlett检验
1.3 水文统计分布
- 1.3.1 常用分布类型:
- 正态分布(Normal Distribution)
- 伽马分布(Gamma Distribution)
- 指数分布(Exponential Distribution)
- 皮尔逊III型分布(Pearson Type III Distribution)
- Gumbel分布
- Log-Pearson III型分布
- 1.3.2 分布参数估计:
- 矩估计(Method of Moments)
- 极大似然估计(Maximum Likelihood Estimation)
- L-moment估计
- 1.3.3 分布拟合检验:
- 卡方检验(Chi-Square Test)
- Kolmogorov-Smirnov检验
- Anderson-Darling检验
二、 水文频率分析
2.1 频率分析基本原理
- 2.1.1 重现期(Return Period):
- 定义: 超过或等于某给定值的平均时间间隔。
- 计算方法: T = 1/P (P为超过概率)
- 2.1.2 风险率(Risk):
- 定义: 在特定时间段内至少发生一次的概率。
- 计算方法: R = 1 - (1-P)^n (n为时间段长度)
- 2.1.3 经验频率:
- 定义: 基于历史观测数据的概率估计。
- 常用公式:
- Hazen公式
- Weibull公式
- Cunnane公式
- 2.1.4 理论频率:
- 定义: 基于统计分布模型的概率估计。
- 需要选择合适的分布类型和参数。
2.2 频率分析流程
- 2.2.1 数据收集与整理:
- 数据来源的可靠性
- 数据质量控制 (异常值处理,缺失值处理)
- 数据系列的代表性
- 2.2.2 分布类型选择:
- 根据水文要素的物理特性
- 根据经验和文献
- 根据拟合效果检验
- 2.2.3 参数估计:
- 选择合适的参数估计方法
- 评估参数估计的合理性
- 2.2.4 频率曲线绘制:
- 基于经验频率绘制
- 基于理论频率绘制
- 2.2.5 结果验证与评估:
- 灵敏度分析
- 不确定性分析
- 与其他研究结果对比
2.3 特殊情况下的频率分析
- 2.3.1 混合分布:
- 当数据呈现多峰特性时,可能需要采用混合分布。
- 常用的混合分布模型:Gaussian Mixture Model (GMM)
- 2.3.2 区域频率分析:
- 当站点数据不足时,可以利用区域内的多个站点数据进行分析。
- L-moment法常用于区域频率分析。
- 2.3.3 非平稳频率分析:
- 当水文序列不满足平稳性假设时,需要进行非平稳频率分析。
- 时变参数模型
三、 水文时间序列分析
3.1 时间序列基本概念
- 3.1.1 时间序列的组成:
- 趋势成分(Trend Component)
- 季节成分(Seasonal Component)
- 循环成分(Cyclical Component)
- 随机成分(Random Component)
- 3.1.2 时间序列的分解:
- 加法模型
- 乘法模型
- 3.1.3 滞后(Lag):
- 当前值与过去值之间的关系。
3.2 时间序列模型
- 3.2.1 自回归模型(AR):
- 当前值与过去值的线性关系。
- 模型阶数确定:自相关函数(ACF)和偏自相关函数(PACF)
- 3.2.2 滑动平均模型(MA):
- 当前值与过去随机误差的线性关系。
- 模型阶数确定:自相关函数(ACF)和偏自相关函数(PACF)
- 3.2.3 自回归滑动平均模型(ARMA):
- 结合AR和MA模型。
- 模型阶数确定:自相关函数(ACF)和偏自相关函数(PACF)
- 3.2.4 差分整合移动平均自回归模型(ARIMA):
- 对非平稳序列进行差分处理后,再进行ARMA建模。
- ARIMA(p, d, q)模型
- 3.2.5 季节性ARIMA模型(SARIMA):
- 用于处理具有季节性特征的时间序列。
3.3 时间序列预测
- 3.3.1 模型参数估计:
- 最小二乘法
- 极大似然估计
- 3.3.2 模型检验:
- 残差分析
- Ljung-Box检验
- 3.3.3 预测评估:
- 均方误差(MSE)
- 均方根误差(RMSE)
- 平均绝对误差(MAE)
- 纳什效率系数(Nash-Sutcliffe Efficiency, NSE)
四、 多元水文统计分析
4.1 回归分析
- 4.1.1 线性回归:
- 简单线性回归
- 多元线性回归
- 回归系数的显著性检验
- R-squared
- 4.1.2 非线性回归:
- 多项式回归
- 指数回归
- 对数回归
- 4.1.3 变量选择:
- 逐步回归
- 最佳子集回归
- 岭回归
- Lasso回归
4.2 主成分分析(PCA)
- 4.2.1 降维:
- 将多个变量转化为少数几个主成分。
- 4.2.2 主成分提取:
- 特征值分解
- 方差解释率
- 4.2.3 应用:
- 水文要素之间的关系分析
- 水文模型的输入变量选择
4.3 聚类分析
- 4.3.1 K-means聚类:
- 将数据分为K个簇。
- 簇内相似性高,簇间相似性低。
- 4.3.2 层次聚类:
- 建立数据的层次结构。
- 凝聚式聚类
- 分裂式聚类
- 4.3.3 应用:
- 水文区域划分
- 洪水事件分类
五、 水文统计的应用
- 5.1 水资源规划与管理:
- 径流预测
- 水库调度
- 供需平衡分析
- 5.2 防洪减灾:
- 洪水频率分析
- 洪水风险评估
- 堤防设计
- 5.3 水环境评价:
- 水质监测数据分析
- 污染源识别
- 环境影响评估
- 5.4 气候变化影响评估:
- 气候变化对水文循环的影响分析
- 极端水文事件的频率和强度变化评估