这个文件要怎么用?
等楼主更新,要是等不及,可解压后放到mdx同目录即可。
好的,我按您说的试试。
有技兄这,
有这个技术,兄弟不如把古代汉语常用字典也做了,还有中华字海,方言大词典… ![]()
修复“道”的图片
修复“打”的abcd,以及全字典的字母序号对齐问题(字母和“.”启用等宽更纱黑)
全字典就“打”有abcc的问题,顺带修复44个词条字母义项缩进的问题
sequence_errors.txt (11.4 KB)
把无箭头提升为第2级,但是必然存在把无箭头的第0级也提升为第2级的可能,仅从css标签无法100%区分,除非人工阅读图片,辨析,豆腐盘成肉价,告辞,
老马CEP,您值得拥有 ![]()
(ComicEnhancePro
文本缩进问题这么多,可以考虑基于苹果词典或者kindle数据(记错了,kindle是现代汉语词典第五版)重制,苹果词典的xml标签信息我记得最全面(发现也没有区分)。据说还有新增词条。
添加@ Fince提供的订补一和订补二,补充缺失的文本,样式为空
感谢说明。 ![]()
对比了一下from macOS的 版本,我的版本不缺词头,就缺一个Internet,没改
上次从切词版摸了跳转词头,这次把缺失的54个词头也补上了,没样式
就差订补一二的跳转词头了
订补一二.txt (132.8 KB)
这些跟css相关的问题,可以尝试使用大模型寻找解决方案
既少麻烦contributor,也提高了自己应用大模型的能力
macOS的主词头为73850,文字版仅为71940,虽然昨天说词头不缺,但是主词头数量有纰漏,看来要排查一下
去重之后前者减后者
Internet
勣
鑪
頫
驩
(实为𮧴)
𡂿
都已跳转,没毛病
有个不情之请,能不能把前头没有用的圈圈也去掉?
圈圈是有意义的符号。详见 #13。
在纸版书上确实有实用价值,方便定位查找。电子版有缩进的情况下,圆圈的实用价值是什么呢?
干1 gān
①名〈文〉盾牌。
大动干戈
○②名姓。
先确认一下我没误会你的意思。
你是指 ②名姓。前面的 ○ 吧?

亲自把现规中繁体字,异体字抽取并写好跳转,未去重,说不定以后可以用来作为繁简异对照表
variants_dict.txt (95.2 KB)
算法仅考虑</x-pr>拼音后面()括号内的繁体异体字,
def test_patterns():
"""测试正则表达式匹配"""
test_cases = [
'<x-pr id="huān">huān</x-pr>(歡*懽*讙*驩)',
'<x-pr id="gàn">gàn</x-pr>(幹<x-sn>①</x-sn>*榦)',
'<x-pr id="gān">gān</x-pr>(乾*乹*亁)'
]






