embedding

embedding:把一个样本映射到一个 n 维向量 (a1,a2an)

embedding 的本质是“压缩”,用较低维度的 k 维特征去描述有冗余信息的较高维度的 n 维特征,也可以叫用较低维度的 k 维空间去描述较高维度的 n 维空间. 和 one-hot 相比,embedding 能通过较少的维度表示出每个类别,并且还可以一定的表现出不同类别变量之间的关系

embedding 有以下 3 个主要目的:

  1. 在 embedding 空间中查找最近邻,这可以很好的用于根据用户的兴趣来进行推荐。
  2. 作为监督性学习任务的输入。
  3. 用于可视化不同离散变量之间的关系。

https://zhuanlan.zhihu.com/p/46016518