Reservoir Sampling 蓄水池采样算法
> 长数据流的随机采样可以使用蓄水池采样算法,本文记录相关内容。 ### 简介 {#简介} **问题描述** :给定一串很长的数据流,对该数据流中数据**只能访问一次**,使得数据流中所有数据被选中的概率相等。 解决类似这样的问题,就可以利用 **蓄水池算法**(Reservoir Sampling)。 ### 基本原理 {#基本原理} 假设需要采样的数量为 $...
> 长数据流的随机采样可以使用蓄水池采样算法,本文记录相关内容。 ### 简介 {#简介} **问题描述** :给定一串很长的数据流,对该数据流中数据**只能访问一次**,使得数据流中所有数据被选中的概率相等。 解决类似这样的问题,就可以利用 **蓄水池算法**(Reservoir Sampling)。 ### 基本原理 {#基本原理} 假设需要采样的数量为 $...