Beam Search score function

2024-04-24 02:32

文章标签 function search score beam

本文主要是介绍Beam Search score function，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

一般情况下，beam search 通常用于翻译等句子生成任务中。 beam_size 用来在翻译所所需时长和翻译准确度之间进行权衡。当beam_size = 1时，beam search 则退化为 greedy search。

另一方面，当 n_best 的取值大于1时，由 beam search 可以得到一个 approximate n-best list，而不是只输入一个最优值。

Hypotheses filtering

可以通过控制 (unkown words) 数量来对 beam search 生成的 hypotheses 进行 filtering. 当一个 hypothese 包含太多时可以将其 drop 掉。需要注意的是，drop hypotheses 会暂时降低 beam size.

Normalization

令 $X$ 表示 src sentence, $Y$ 表示 current tgt sentence，score function 可以为：
$\frac{\log P(Y|X)}{lp(Y)} + cp(X, Y) = \frac{\sum\log P(y_i|X, y_{1,...,i-1})}{lp(Y)} + cp(X, Y)$

下面对上式中 $lp(\cdot)$ 和 $cp(\cdot)$ 分别为 length penalty 和 coverage penalty.

Length normalization

$\frac{(5 + |Y|)^{\alpha}}{(5 +1)^{\alpha}}$

其中， $∣ Y ∣$ 是当前 tgt sentence 的长度， $\alpha$ 是 length normalization coefficient.

Coverage normalization

$\beta \sum_{i=1}^{|X|} \log \left( \min\left(\sum_{j=1}^{|Y|} p_{i,j}, 1.0\right) \right)$

其中， $p_{i,j}$ 是第 $j$ 个 tgt word $y_j$ 关于第 $i$ 个 src word $x_i$ 的 attention probability. $∣ Y ∣$ 是当前 tgt sentence 的长度， $\beta$ 是 coverage normalization coefficient.

End-of-sentence normalizaiton

$\gamma \frac{|X|}{|Y|}$

其中， $∣ X ∣$ 是 src sentence 的长度， $∣ Y ∣$ 是当前 tgt sentence 的长度， $\gamma$ 是 end-of-sentence normalization coefficient.

Decoding with auxiliary language model

Beam search 还可以利用一个辅助的 language model 来定义 score funcition. 例如 “Shallow Fusion”:

$s_{TM}(Y, X) + \beta \cdot s_{LM}(Y)$

参考：openNMT beam search

这篇关于Beam Search score function的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

Beam Search score function

Hypotheses filtering

Normalization

Length normalization

Coverage normalization

End-of-sentence normalizaiton

Decoding with auxiliary language model

相关文章

HTML5 搜索框Search Box详解

Java function函数式接口的使用方法与实例

C++11的函数包装器std::function使用示例

AI基础 L9 Local Search II 局部搜索

AutoGen Function Call 函数调用解析（一）

(function() {})();只执行一次

js私有作用域(function(){})(); 模仿块级作用域

856. Score of Parentheses

JavaScript正则表达式六大利器：`test`、`exec`、`match`、`matchAll`、`search`与`replace`详解及对比

rtklib.h : RTKLIB constants, types and function prototypes 解释