【pdf】史氏汉英翻译大词典

desperado · 2020 年8 月 19 日 03:26

好像存在没公开分享的切图，图片版本。
大概2000余条，前面有汉语检索词表，有高手有空时能做成图片版词典方便一下大众就更好了。

W2K · 2020 年8 月 20 日 06:56

这个PDF质量很不错

Arlin · 2020 年8 月 20 日 10:14

很不错！就是有几张曲度歪斜很严重，切片不行，高亮定位版可以有。
@W2K 做噢，我打辅助，负责ocr词头以及最后整合数据。
还有谁想学切词，准备好软件一起来吧。

王绍军 · 2020 年8 月 20 日 10:45

dqg · 2020 年8 月 20 日 12:22

我我我我我我

Arlin · 2020 年8 月 20 日 12:35

你还用学嘛？
你可以给@ W2K帮忙，或者整合数据交给你？词头索引我差不多已经弄好了。

dqg · 2020 年8 月 20 日 14:26

切词的正则替换没找到呀，整页的是Excel‘’

Arlin · 2020 年8 月 20 日 14:42

什么？没看懂

dqg · 2020 年8 月 20 日 15:10

chigre切词部分替换的正则表达式没找到，实在不行就自己写一个了，

Arlin · 2020 年8 月 21 日 00:27

你说这个?

改一下不就是了。

^(.*?)\t(.*?)\t(.*?)\t(.*?)\t(.*?)\t(.*?)$
magick \1 -crop \5x\6+\3+\4 -transparent white \2

dqg · 2020 年8 月 21 日 00:29

不是，这个是抠图的，我直接软件切，出来的那个wword有没有现成的正则替换为mdx那样子呢

Arlin · 2020 年8 月 21 日 00:38

有的(1)(2)排序是对的，你正则厉害，可以想一个。
我都是将页码结合（1）（2）（0-1）等生成序列作为排序依据，按该列数据升序排序完再删掉。
最后把除（1)外的所有归到（1）后。

qqdopod · 2021 年8 月 11 日 06:54

这个词典看起来挺好。没人做成MDX呢