前些天在本站下载了
(外教社)学科词汇手册合集(包含77部词典)2.13更新
國家教育研究院學術名詞(有分類)
这种专业词查起来很有意思。
后见到 random 有分享 国家教育研究院学术名词 2023.2.6数据 ,就起了心思。
这几天得闲,开始转TXT > 提取数据 > 分类 > 合并,发现(暂时)《法律學名詞-民法》无英文数据,一路查到国家教育研究院, 樂詞網 : 下載專區 (naer.edu.tw) 。
心里一万头草里马踏过,这里就有分好类的 .ods 文件下载。
那我这两天是干了个啥????????????????????
144个分类(两个PDF还没开始),怕出错,都是手动做的。。。。
random 你得赔我青春损失 (虽然青春不在)
3 个赞
你这两天是磨练了研究和整理原始数据的能力,没有损失。
必须磨练过才知道:假如能找到第一手的原始数据,应该先看过原始数据,才决定要不要用第二手的、整理过的数据。
2 个赞
没看懂… 我之前传的html文件就是分好类的.ods转换的啊(考虑到html更便于制作mdx)。
p.s. 只需要将html文件名,写入html内容里的对应位置,即可添加分类。
1 个赞
”洗“ 具体是说的什么?html内容应该没有标签问题?
我只是想得到干干净净的数据而已,排版方面有自己的想法,所以,标签就需要重来。
另外,一楼对你的冒犯,只是句玩笑,不要当真。
1 个赞
None taken.
学科分类数据打算加进去吗?
p.s. 之前错略看了下html源码,感觉直接提取tr标签应该就行。
1 个赞
提取、分类完成。
还在是合并、分类,打算所有数据全部保留。(所以说排版有自己的想法。)
1 个赞