这个词组版面做成mdx该如何处理为好

如题。参见图片及文本。

above
above all (things) 首先,最重要的是,第一是
above ground 在地上,未死
above measure 非常,过度
above price 无价之宝
above suspicion 没有怀疑,无可怀疑
above the rest 特别,格外
above water 脱出烦恼
as above 如上(所述),如同上述(那样)
be such as above 如同上述(那样)
from above 身上(方),由上所述
over and above 此外,而且,在上面,超过
the above 以上所述,上述
well above 高出[超出]…很多,大大超过
abreast
keep [be] abreast of [with] 与…幷进,跟着…跑
abroad
at home and abroad 在国内外
both here and abroad 国内国外(都)
from abroad 从国外
absence
absence from 缺席,不在
in (+ one’s) absence 当(…)不在的时候
in the absence of 无…时,缺…时
absent
be absent from 缺席,不在…(地方)
absorb
be absorbed in 全神贯注于,专心于
be absorbed by 为…所吸收
abstain
abstain from 戒除,避开
abstract
in the abstract 抽象地,理论上
make an abstract of 把…的要点摘录下来
abundance

原样照抄现有的就挺好:词头 + 正文

更进一步就提取一下词组,并给每个词组一个see also 主题词

谢谢!能麻烦您做个示例吗?

能提供excel文本吗,感觉适合做成anki

可以,不过正在校对中文。

英和词典转的英汉词典吧,看到那个方括号了。
正则处理时候注意方括号

比如:

above price
   无价之宝
   参见:above

别人给的一本旧书,《现代英文实用词组》1977年于香港。网上找了很久,未见到电子版。书的纸张都发脆了,想做成mdx便于保存。用手机拍的,繁体识别错误多,转成简体又挺麻烦的。估计要耗费不少时间才能做成。

多谢!又给您添麻烦了。

楼主既然用了下 Markdown 的表格
那为啥不用Markdown的列表格式呢
编辑起来应该还简单点
搞完后应该可以导出为html

进一步制作mdx还需要替换一些标签吧
按我理解Markdown转化为html,列表格式应该可以设置出一些用来替换的标签字节之类,也就是可以为制作mdx提供方便的元素

  • above
    • above all (things) — 首先,最重要的是,第一是
    • above ground — 在地上,未死
    • above measure — 非常,过度
    • above price — 无价之宝
    • above suspicion — 没有怀疑,无可怀疑
    • above the rest — 特别,格外
    • above water — 脱出烦恼
    • as above — 如上(所述),如同上述(那样)
    • be such as above — 如同上述(那样)
    • from above — 身上(方),由上所述
    • over and above — 此外,而且,在上面,超过
    • the above — 以上所述,上述
    • well above — 高出[超出]…很多,大大超过
  • abreast
    • keep [be] abreast of [with] — 与…幷进,跟着…跑
  • abroad
    • at home and abroad — 在国内外
    • both here and abroad — 国内国外(都)
    • from abroad — 从国外
  • absence
    • absence from — 缺席,不在
    • in (+ one’s) absence — 当(…)不在的时候
    • in the absence of — 无…时,缺…时
  • absent
    • be absent from — 缺席,不在…(地方)
  • absorb
    • be absorbed in — 全神贯注于,专心于
    • be absorbed by — 为…所吸收
  • abstain
    • abstain from — 戒除,避开
  • abstract
    • in the abstract — 抽象地,理论上
    • make an abstract of — 把…的要点摘录下来
1 个赞

我好像有这个PDF,明天找找

谢谢你的指点。从未用过markdown。OCR后可直接转存为多种格式,包括html等。我用excel格式,用填充方式方便标签标注。

但愿您能找到。手机拍的识别错误较多。

链接:百度网盘-链接不存在
提取码:sbpl

非常感谢!就是这本。

OCR可以试试百度的AI,准确率比传统OCR强。推荐 千百图片文字识别,傻瓜软件,调用百度