Ptextpad + 双语对齐工具网页版 mlbee(任意语言对) + 其他bee系列对齐工具

我试着解释一下。以微软术语 data link layer 为例 https://www.microsoft.com/zh-cn/language/Search?&searchTerm=data%20link%20layer&langID=124&Source=true&productid=undefined,这个术语并不是独立的三个单词,而是一个整体。就是说这个词组出现时肯定固定地翻译成“数据链路层”。

现在再设想一下,我们并不知道data link layer是个术语。我们只有原文和译文。如何才能提取 data link layer/数据链路层 这个术语对呢?

可能的做法是,先将英文和中文分词(或者说分词组),再进行词组对齐。再做些处理等等,希望最后拿到了所有的 术语对。