现代汉语词典第7版-20240219更新

谢谢大佬 按照你的办法弄好了 用手机上的深蓝词典直接就能导入 :rofl:弄了一上午结果最后五分钟搞好 我哭死

谢谢大佬 这个词典真的很貌美

1 个赞

谢谢楼主的分享,感谢你的劳动!!

1 个赞

感谢辛苦付出!

在20240112修改的数据基础上编译了一个版本:

  1. 修复部分词条在原版GoldenDict上出现闪退的问题;
  2. 修正了若干词条的拼音错误;

后面的工作就是添加词条的发音文件了,在某芬的页面上薅了一遍共获得5万余条音频文件,但由于(可能是链接失效)等原因仍有个别词条无法获取到发音,如有逆向工作经验的大佬可以尝试从原版APP中提取:

簸弄bǒnòng
尔诈我虞ěrzhàwǒyú
𫓧锧fūzhì
揭秘jiēmì
弩箭nǔjiàn



G字形的下面是一点,为避免其他夹带私货的人被误导,这里就不使用CJK码位了

5 个赞


这样一看有点搞不懂了。

QQ截图20240217230206

现汉6就是下面是一点的版本,当时校对6版还是直接用9eaa这个码,后面第7版改成捺的版本,包括新华12、现汉规范4等一众新词典都更新该字形,才把它挪到私有区。如此一来除非G源也改成捺的字形,否则暂时就不改回去了。
QQ截图202402172

2 个赞

大神,某芬的新时代汉英大2能否薅下来啊?

缺失的发音试了下原版APP,都有发音,但是不会提取。。也许可以录下来? 发现内录的不准确。

网上的app中都带有所有词条的发音?原以为是在线发音呢!

自己不会,每次下载别人的,非常感激无私奉献的人!!!

𱸇(簩)的索引是不是用的 “簩",包括𥯨𱸇竹。
虽然有简繁跳转,但……不得劲啊。 :joy:

version_20240219 功能增强条陈

  1. 字头的词语列表中的词头,其儿化音标签small未做处理

    • 比如字头;擦,117页。其词语列表中的“擦黑儿”
    • 释义以及单独词条的“擦黑儿”都有 small 标签
  2. 拼音未加粗处理。

    • 例如“猜谜儿”,拼音在释义中是普通大小,在词头或字头中是加粗的。拼音中还有”//“符号是不加粗的。
  3. 词性标注:如动词的“动”在复制时失去了样式,需要复制的用户可以把 ps 标签里的文字修改成“[动]”,想兼顾显示效果和复制功能的,可以参照以下修改mdx

<span class="lvl0"><span class="lvl1_padding">[</span><span class="lvl1_pos">动</span><span class="lvl1_padding">]</span></span>
<style>
    span.lvl0 > span.lvl1_pos {
        border: 0.1px solid black;
    }
    span.lvl0 > span.lvl1_padding {
        color: transparent;
    }
</style>
  • 显示时:image

  • 复制时:image

  1. css 排版个人喜好:
    1. 词头只放大,未加重 font weight。
    2. 词性标注的边框是细的,未处理。
    3. mdx 所用的两个ttf字体
      1. 中文括号不居中,导致”擦屁股“等词中的括号和拼音挤在一起。括号和冒号空格太大。
      2. 逗号、分号、顿号占空很小,顿号、句号、问号占空大。mdx默认字体全是全角符号。
      3. 释义中的中文字符 | 显得很粗,自身作为分隔符,应该与例句区别大。
    4. ex 例句、例词:font weight 更细,与释义区分。
    5. 排版空格的处理不一致。释义黑底数字后、释义前的排版空格处理为字符空格,而词性标志前后空格未处理。
    6. 儿化音 添加 vertical-align: baseline; 使其对齐,字体大小:font-size: 0.7rem;

只粗校对了第117 页,这个mdx版本文本很优越,没找到硬伤。

使用技巧:现汉7查不到的比如“风雨无阻”,用汉语大词典和新华成语大词典。

2 个赞

好人一生平安

  1. 词头使用非衬线字体,由于其本身特性已经承担了加粗的功能,因此无需再修改font weight。如果是衬线字体可以考虑加粗字重。
  2. 辞书中看到括号和冒号挨在一起,那是为了节省空间考虑,将全角标点挤压成半个字宽,在电子产品中无需考虑空间问题因此就直接占整个字宽了。实际上的全角标点符号的表现就是有的靠左有的靠右的,如果全部居中就变成湾湾的味道了,不适合大陆出版物的排版风格。不过这两枚ttf也不是一点毛病没有,比如单书名号不够大,双引号是西文风格。
  3. 楼上的意见可以考虑一点,

这里需要修改,不是插入空格而是使用样式表来调整圆圈数字与释义之间的间隙

楼主要是对空格有兴趣,还有相关的:

1. 跳转的缩进层次不同(“全角空白字符”实现的缩进)

2. 个人css

有些需要改动mdx,不敢动,比如

  1. 先音后义的词条分层(跳转是异音的跳转(也就是第一层实际是读音,比如“采”:cai3 + cai4,第二层才是同一个读音下的异义。而当前不是读音并列,而是词条并列。
  2. 去除异体字繁体字的词头显示,以及释义中的跳转、旧义(毕竟“现代汉语”词典)
  3. small 标签的重提取
  4. 多层序号的标签的标记
1 个赞

词语匹配逻辑似乎有问题:“大黄”的词语列表有“大黄鱼”。

纸质书上是并列关系。

机器判断只能做到哪些词是哪些词的前后缀,无法根据语义判断。
欢迎有能力者自行搞一套判断逻辑

多谢楼主大神!
转换拼音格式时无意间发现一处错误:
图片
另外,不知兄台对发音处理得怎么样了?我这儿如果不出意外,今天或明天应该能把商务的那个网上的《现汉》发音抓完,到时还得麻烦兄台合成 :pray:

1 个赞