哪位大侠能拨冗制作《广碑别字》《碑别字新编》《可洪音义异体字表》,可提供pdf

提供两种字头索引做参考:

1.Excel版:
新华字典字头索引

这个连内容文本都做出来了。但是做图像版,有字头索引就可以了。

2.Unicode纯文本:
XH7切词版2022年元旦版
xh7index.rar:内为xh7.xml,Utf8文本,是XH7的词头及汉语拼音字头索引。

找难字,可以用部件检索找:

部件檢索辭典

电脑没有的字,可以用拼字替代。

1 Like

谢谢赐教,如果是第一种excel,其中有几列:字头,页码,位置,拼音,字级,笔画,释文
做成图像,需要做到第几列?是否只作字头,页码 即可?将其他列都删除?下面是《广碑别字》的正文。

Add images

只要有字头和页码就可以,不过字在书中的顺序要对。

现在已经有两种可以按照字头页码制作mdict源码的程式:一种是隔壁的Vbaapp,一种是在本坛可找到的VIM程式。

假如有字头和页码的索引,有程式又会用的人,其实跑一下程式就做出来了。

你的索引假如只做最上面的正体字,我想还好,可以打得出来。

是的,只作正体字就可以了,那就只要磨时间把索引做出来就好了,这个工作我可以做,但程式就不懂了,不知道有没有老师出手?不知兄会不会跑程式?

是这样吗?
微信图片_20220206181325

我没做过,不过这里能做而做过的人太多了。

你贴了图像pdf和字头索引求助,我估计很快就有人会做出来。

乙|1

乙|0001

这两种格式我想都可以,都没有问题。

第一种在Ecxel里做比较方便。

多谢惠告,我先慢慢把索引做出来。

假如兄台想自己动手,可以参考以下帖子:

用字头索引自动产生mdx源码的工具:

隔壁的vba工具

一键制作图片词典 MdxSourceBuilder

有了mdx源码后,用EmEditor打开源码文本,看是否需要手动微调。然后用MdxBuilder把mdx源码编译为mdx,把图像编译为mdd。

【阿彌陀佛】词典制作工具备份
02、 TXT源文件转MDX工具 附教程MdxBuilder3.0.zip (2.5 MB)

03 将 MDict 词典的 mdx 格式转为 txt 格式工具 MdxExport3.5-MDX与MDD资源导出小工具.zip (64.2 KB)

04 TXT编辑工具EmEditor.Pro.19.3.0.7z (18.6 MB)
TextPro超级记事本.zip (2.4 MB)

多谢兄,我学着自己做试一下,不行再请老师们出手!

自己能动手的人越多,当然越好,假如做了又分享,论坛就会越来越兴盛。

有人诟病本坛的伸手党多——那是完全不提供资源也不出力的(提供pdf和字头索引是资源,帮忙打字校对是出力),纯粹等着下载。

伸手党再多,也不能促进论坛的兴盛。

其实,我觉得伸手党不是最糟糕的,更糟的是伸脚党——用了别人的资源,还踢资源提供者一下,随便乱批评。

还有人想把资源拿去卖,这是最糟糕的。

我想字头索引,尤其是那个excel的索引,还是可以做下的,只不过要费些时间。我看有些老师似乎也不是计算机专业的。

做字头索引需要的只是时间和耐心,不需要什么技术。

这里真正的大神是计算机专业的。

但是做中文工具书的,大概率是自学的电脑技术。

做个mdict,其实不需要编程。

刚做完《国际标准汉字》的图片版。
你可以参考一下。
需要用的工具:
1,pdf转图片工具。此类工具网上多的是。
2,文本处理器。推荐 emeditor。
3,MdxBuilder,必备。

标汉-字头索引-图.7z (11.4 KB)
标汉-字-页码.7z (7.4 KB)

1 Like

感谢,我现在正在做索引,真是费时间,越来越觉得做词典老师们的无私付出值得尊敬。我想用阿弥陀佛和 tsiank两位老师的工具和上面shaoshi老师介绍的方法先试试能不能自己做,如果不成功,再请坛里的老师们出手。

索引先ocr在校订可以节省一些时间

关键是制作字条索引。其它的说白了就是,制作一个网页,在里面添加一张图片,随便添加上一页,下页链接。

MdxBuilder这工具里面有个说明文档,manual_Chn.txt,建议看看。

我习惯用finereader直接打开pdf,然后把页面存为图像。

这样做的好处之一是:finereader可以矫正有点歪斜的图像。

正文的图像需要重新按页码命名,这个用acdsee最快,用ifranview也可以。

假如原书有专门的字头索引,而图像够清晰,把字头索引这部分做了ocr再校正,会比完全自己打字快。

我是用Adobe Acrobat 9 Pro 拆分的,命名也学会了。尝试用 tsiank老师的工具做了一下《碑别字新编》的前几页。有一个问题,就是放到词典里页面太大了,下面的图是整个电脑屏幕的,如果调整得小一点之后,别的词典也跟着小了。
可能是Adobe Acrobat 9 Pro导出的分辨率太高了,我再试一下其他软件导出的情况。

我估计你用Adobe Acrobat 9 Pro存的图像页面设置太大,这个可以用老马的ComicEnhancerPro批量调整。

假如图像有别的地方需要处理,例如需要锐化等等,可以用ComicEnhancerPro一起做。

兄台上手挺快啊!如此何劳求人。你可以写一个详细一点的自助帖,其他想自己动手的新手就可以跟着依样画葫芦。

是的,重新导出后,大小正常了。还在摸索,比如有的页码需要翻页,可能还不会,上面JCZ777兄的文件中有翻页,还不知道怎么回事,笨办法就是在索引时直接做2页。感谢shaoshi兄!