Tld词典重新排版,加入记住默认设置功能

lille不得不说是一部经典中的经典,但是我个人习惯用欧路软件,发现在查词时,像cutting和cut-ting这种词头会连在一起显示,而如果同样的单词同时存在大写和小写,又只会显示小写,不得已,强迫症的我把mdx重新排版了下,打包成eudic格式(欧路上只有这种格式支持每页只显示一个单词),然后加了类似朗文5那种多功能的js,css的排版走极简主义风格,中心思想是降低一切阅读负担,让读者一眼抓住所需要的重点信息。

目前仍然存在以下问题,但因个人原因,实在没有时间和精力完善下去了,希望论坛里的大神能够接力完善:

  1. COCA词频中的详细词频,在展开时,下面一行会闪动以下,应该是css哪里没调好,但我检查了很久没检查出来;

2.COCA词频的排序在原版中也不是冒泡排序的,应该是作者用js调整了冒泡排序,但是我不想用js来调整,js调整我总会担心如果多个词典联合查词时会出现卡顿现象(我十分厌恶这个),很想通过修改mdx来达到冒泡排序的效果,但是我bs4想了一天也想不出怎样冒泡排序,这点真的很希望论坛里的大神能帮忙解决一下,或者提供给我一点思路也行;

3.我本来想把文件打包成一份mdx,但是mdx打包时每次都闪退,不知道是什么原因,源文件已经上传到百度云里,需要的伙伴可以自己下载试着打包一下,看看会不会遇到我的问题,如果没有的话,希望也能上传一份到帖子里

功能啥的参考我朗文5排版的帖子,用法基本大同小异




链接:百度网盘-链接不存在
提取码:r148

10 个赞

不建议在手机等场景使用,不仅空间占用大,而且对性能要求高,曾经在虚拟机中使用,转了半天没出来,彻底放弃。

它里边的东西都有对应的独立词典,而且版本还可以选择、升级。

2 个赞

我现在想借鉴隔壁精简版的单词表弄一个精简版的

对了,为什么会对性能要求高呢,按理说它每次只展示一个单词,意味着只读取一行的文件文本,为啥会耗性能呢

1 个赞

我使用GoldenDict,第一次安装该词典时,GD需要建立索引,不知道是什么原因,这一步卡壳很久还是过不去。

1 个赞

我百度云上传了个精简版的,你可以改成mdx打包试试,我用的是这个的

我看关于goldent的版本的说法有很多,我现在还搞不清楚除了官方版外别的版本之间的关系,但是我用这个链接里的goldent很流畅,你试试看

3 个赞

不了解词频。写了一段代码,将 .coca 子元素按 rank 值排序。没用冒泡排序法。

for coca in soup(class_='coca'):
    for pos in coca(class_='pos'):
        pos.insert_before(soup.new_tag('sepp'))
    coca.append(soup.new_tag('sepp'))

    ranks = [int(rank.string) for rank in coca(class_='rank')]

    for rank in sorted(ranks):
        spra =coca.find(class_='rank', string=str(rank))
        sepp = spra.find_previous_sibling('sepp')
        for sepn in sepp.find_next_siblings():
            if sepn.name == 'sepp':
                break
            coca.append(sepn.extract())

for sepp in soup('sepp'):
    sepp.decompose()
3 个赞

多谢!我试试看!

部分跟我的思路有点像!

1 个赞

更正:加了个判断,选择 .coca 时,把 .coca.iweb 排除掉。

1 个赞

感觉不用排除,可以一起改

1 个赞

不过我的要换一下class,因为我把pos这些标签全部改成了表格标签,这样子对齐很方便

1 个赞

为啥你们的golden都好慢哦,我这个索引最多是little,大概二十秒左右,是我下错了版本吗…

2 个赞

明显不是一个。

1 个赞

我的机器是拯救者r7000具体啥配置忘了,几年前刚刚买的游戏本,但买回来就没空打过游戏…

海词词典还有个饼图,我想还原出来,无奈能力不够

饼图实现可参考“CSS 揭秘”一书第三章第14节。

论坛里的大神是真的多!

这个是啥意思,,我有点不理解,还有你说的海词的释义词频,再加上各种场景的概念所选择的最佳词汇活用的词频,地区发音分布的频,这些词频论坛有数据吗,还是要自己抓取,,如果论坛有数据的话合并起来就是一顺手的事,,如果要抓取的话估计我目前能力还做不到

这本词典的缺点是有了太多无用的词条,唯一的价值就是词频.
我希望能把所以没有词频的词条都删除,留下有词频的词条, 不知道谁能办到?