目标:预测序列,形式化地,如何有效估计 P(xt|xt−1,…,x1)
策略1:放弃很久之前的序列数据,即把 P(xt|xt−1,…,xt−τ) 作为预测值。这种模型称为 τ 阶马尔可夫模型。
策略2:保留一些对过去观测的总结 ht,每一步模型同时产生 x^=P(xt|ht) 和 ht=g(ht−1,xt−1) . 由于 ht 从未被观测到,这类模型也被称为 隐变量自回归模型(latent autoregressive models)