现代汉语词典第7版整页版索引

若有按书籍顺序排列的索引就更好了

看了一下,这个是图像版字头导出的索引,所以包含了原版所有的错误。

我准备等修改完图像版后,再重新导出索引。

图像版字头用了一些非规范Unicode字(私用区字),这些有古怪的字得一个一个研究,才能修改,所以很耗时间。

3 Likes

我已经把修正过字头的《现代汉语词典》7版图像切词版发出来,有兴趣的书友可以参考:

请改用2022年元旦修订的mdx

现在根据这个版,把切词图像的页码编号抽出来,上载于此,供大家参考。格式为Unicode 8 xml文本。

简单说明格式:

序号|字头|页码及字头位置
1|a1|0001-001
2|吖〖U+5416〗|0001-002

序号依照页码及字头位置排序。0001-002为第1页第2字。

字头为单字、词或汉语拼音。1、2、3、4分别代表四声,0为轻声。

单字后面加了〖U+XXX〗。可以用别的方法查到U+XXX,再用U+XXX找到该字在《现汉7》中的页码。不过要注意,为了尽量显示所有字,我用可见或可检索的繁体字,替代了一些类推简化字,所以〖U+XXX〗也跟着改变了。

假如发现有错误,欢迎大家跟贴反映。

请改用2022年元旦修订的索引

少实斋

多虚不如少实

3 Likes

那样顺序也是頁内乱的,你在我给你的那个整页的里改顺序就对了,也是@vim要的“书籍顺序排列的索引”。


那样也不对,你没有整页的图 :rofl: :rofl: :rofl: :rofl: :rofl: :rofl: :rofl: :rofl: :rofl: :rofl:,算我没说、哈哈哈哈

我是用这个索引搭配自己整理的《现汉7》使用的。

没有比对,字头在本页内的位置也许有错乱,但做了几个实验,可以用得起来。

这个顺序显然不只是汉字的顺序,是包括汉语拼音字头的讯息。

所以第一页排第一的是a1,最后一个是“腌臜”。

我个人觉得很好用,没问题。

书友觉得不好用而不想用,那当然悉听尊便。

晒一张我的Access资料库的界面,证明我的索引数据是实战的装备,并非象牙塔里的装饰。

当然,各人各有需求,各从所好。不是说我这个方法比别人的好,只是说这个比较适合我的需求。

我自己有数据库和图像,用自己的软件比较顺手。不过没有《现汉7》图像的书友也许可以利用兄台的软件。

只是好奇,问一声:兄台用的是什么软件?

1 Like

我只會 mdict 的 mdx 哈!哈哈哈哈哈!,謝謝你提供整理過且排序好的索引啦!,你自己搞的數据庫一定是更好的,我也很想學學 Access 的東西來處理一些資料,但最近光看 excel vba 就想睡覺,腦袋轉不太動,抽根煙後就昏昏欲睡

大和尚的问题就是太花心。

狗熊掰棒子 vs 条条大路通罗马 + 熟能生巧。

本想弄成粗略定位,但這個圖的邊一直切不順,於是作罷…圖片詞典切邊真的很麻煩,一直找不到可以滿意的切邊方式

1 Like

经济学中有个 Second best 的理论,大致意思是,从 Second best 到 best 所花费的成本,很多时候远大于 best 相对于 Second best 的效益提升。

其實還好,整個過程只有切邊是花最多體力活,其它的就1-2hr可完成

去下载了fruition兄的整页版mdict,感谢分享。

之前没用过Wormhole,这个下载速度奇快啊!

fruition兄的这个设计挺新奇,起初以为是别的软件。听你说是Mdict,我还纳闷是否是新版,不知道在Goldendict中能不能用,

试了一下,是可以在Goldendict中使用的。

校对的版本真是越多越好啊,这下子又发现切词版的新错误了。这次慢慢再改一轮,然后才发布新资料吧。

把同页的所有词汇和图像并列,我觉得这个整页版的设计对校对很有用啊!校对必备版!

應該是謝謝仁兄才是,在下無法排序中文,因為實在太複雜了,你都排好序了,我只是轉一下而以,並沒有處理什,連圖片都沒切邊…

有了C的切词,在那个之上再完善,应该更好呀。

fruition兄可谓虚怀若谷,功成不居。

我对mdict所见不多,不知这个设计是fruition兄的原创,还是有所师承?

这个单词高亮的技巧,用的大概是Js?或者整个查图片的程式都用Js,不必分词条,所以才能做得这样快?

你说的大概是付费版?付费版是不能自由改进再发出来的。

商业软件只能等原创者自己改进,开源软件才有人改进了再发出来。

实际上我没见过你说的那个付费版。我假如购买了,改进了,也不会再发出来。

仁兄誤會了,真的是 VBA 轉一下,3分鍾的事而以,哈!哈哈哈哈哈!被你說的太高大上了,真的不好意思

感谢楼主和 fruition兄分享。

1 Like

粗略定位这个好呀。

1 Like