Beam Search 算法
我们经常需要预测一个句子,预测时第 2 个词依赖于前 1 个词,预测第 3 个词时依赖于前面的 2 个词,当预测第 n 个词时依赖于前 n-1 个词,我们需要找到一个这样的词的序列,使得概率值最大,或者至少能够被人接受。 我们马上就可以想到可以使用穷举的方法,把所有可能的序列都罗列出来,从里面选个概率最大的就可以了。这样可以吗? 我们写下它的过程(假设:词典有1024个词):...
我们经常需要预测一个句子,预测时第 2 个词依赖于前 1 个词,预测第 3 个词时依赖于前面的 2 个词,当预测第 n 个词时依赖于前 n-1 个词,我们需要找到一个这样的词的序列,使得概率值最大,或者至少能够被人接受。 我们马上就可以想到可以使用穷举的方法,把所有可能的序列都罗列出来,从里面选个概率最大的就可以了。这样可以吗? 我们写下它的过程(假设:词典有1024个词):...