接https://forum.freemdict.com/t/topic/8550
链接: 百度网盘-链接不存在 提取码: qcui
问题终于解决,是我在正则提取时出了问题。但对于高区的unicode汉字的处理仍莫名其妙,为避免这类问题,在遇到有高区字时写正则不能懒省事(这类懒正则在python也会出问题),简单来个.+?
,一定要用[^]+
。
上传更新包。包括遗漏的图片、 Mastameta修改过的样式,以及他发现的正文中的�。
链接: 百度网盘-链接不存在 提取码: 9ad6
6 Likes
因为正则处理不够严谨造成的那些方块字,真的很神奇,有时复制也没问题,但一保存就变成了�。一直还以为程序写得有问题。
这些字甚至发不到论坛,一发网站就功能紊乱,提示另有一处在编辑等等。
无法粘到论坛,上传文件又变样……
原来提取时用的说文解字:([^\s]+?).+?異體.+?<span style="font-size:180%;line-height:1.2">(.+?)</span>
,后来改为说文解字:([^\s]+?)\s*<font.+?異體.+?<span style="font-size:180%;line-height:1.2">([^<>]+)</span>
。问题就出在([^\s]+?).+?
这个烂写法,把\u29601在emeditor中变成了\ud865,然后复制到evereditor就乱了,复制一个字是\u2c50a,和其它字一块复制就变成了\u2b806,一保存就都变成了�,其实这是半个字。
不会添加呀,大哥
好人做到底,那个再传一次吧
2 Likes
国学大师网站的说文资源吗?谢谢
来源见第一行。
突然发现排版还有点问题,关键地方没动呀。哪位大神帮忙改下吧。
楼主果然是好人
1 Like
等大神来来来来
图片无法显示
兄弟,你没用第一个链接中的mdd吧。
1 Like
我也是深蓝字典,图片可以显示
文件重新下载了一遍,还是不行,不知道什么原因
用第一个压缩包里的mdd和css和楼主更新的mdx不行?要不清理缓存重启app试试。
清理了缓存,重启后,可以了,谢谢
你应该用第二个链接里的mdx,九兆那个