默认冷灰
24号文字
方正启体

第67章 你们能比我更懂机器翻译(5k) (7 / 17)

作者:鸦的碎碎念 最后更新:2025/7/8 16:09:16
        “о”对应“about”

        “мире”对应“peace”

        然后我们需要对这种对齐的频率进行统计。

        统计每个俄语词或短语在英语中的对应翻译出现的频率。

        例如,在语料中,“говорим”在80%的句子中翻译为“speak”,20%翻译为“talk”。

        这样对于我们就可以构建概率表了。

        将这些概率整理成表格,供机器进行查询。由于内存空间有限,我们暂时只存储高频词对,像出现次数前1000的词对,忽略低频情况。

        当翻译某个词的时候出现多个选择,就参考概率表选择最可能的翻译。

        另外就是统计相邻词的共现频率。мы经常与говорим一起出现,对应Wespeak,机器在翻译的时候则优先选择这个组合。

        通过规则优先处理和统计方法处理模糊情况的方式,来弥补规则的不足!”

        内容未完,下一页继续阅读
(←快捷键) <<上一章 举报纠错 回目录 回封面 下一章>> (快捷键→)

大家都在看?