国家教育研究院学术名词的制作,每天上一当,当当不重样。

前些天在本站下载了

(外教社)学科词汇手册合集(包含77部词典)2.13更新
國家教育研究院學術名詞(有分類)

这种专业词查起来很有意思。

后见到 random 有分享 国家教育研究院学术名词 2023.2.6数据 ,就起了心思。

这几天得闲,开始转TXT > 提取数据 > 分类 > 合并,发现(暂时)《法律學名詞-民法》无英文数据,一路查到国家教育研究院, 樂詞網 : 下載專區 (naer.edu.tw)

心里一万头草里马踏过,这里就有分好类的 .ods 文件下载。

那我这两天是干了个啥????????????????????
144个分类(两个PDF还没开始),怕出错,都是手动做的。。。。

random 你得赔我青春损失 :joy:(虽然青春不在) :goutou:

3 个赞

你这两天是磨练了研究和整理原始数据的能力,没有损失。

必须磨练过才知道:假如能找到第一手的原始数据,应该先看过原始数据,才决定要不要用第二手的、整理过的数据。

2 个赞

没看懂… 我之前传的html文件就是分好类的.ods转换的啊(考虑到html更便于制作mdx)。

p.s. 只需要将html文件名,写入html内容里的对应位置,即可添加分类。

1 个赞

不洗出来不行啊,会把握不住原始数据更低的错误率。

”洗“ 具体是说的什么?html内容应该没有标签问题?

我只是想得到干干净净的数据而已,排版方面有自己的想法,所以,标签就需要重来。
另外,一楼对你的冒犯,只是句玩笑,不要当真。 :grinning:

1 个赞

None taken.

学科分类数据打算加进去吗?

p.s. 之前错略看了下html源码,感觉直接提取tr标签应该就行。

1 个赞

提取、分类完成。
还在是合并、分类,打算所有数据全部保留。(所以说排版有自己的想法。)


1 个赞