●国家出版基金项目
●18887个汉字字头
《汉语古音手册》是一部反映中国学术界汉语上古音研究最新成果的著作,包括前言、凡例、正文、附录及索引。前言中阐释了古音构拟的理论框架和操作方法。正文收录从先秦两汉的古籍中整理出的18887个上古用字,包括主要的异读用字,字头基本上按《广韵》收录,《广韵》之外的字酌收《集韵》《说文》和《玉篇》用字(于附录集中标注),以声符统摄字头,声符以拼音排序。字头编有流水序号,后列中古音和上古音,中古音列有反切、声、韵、调、等、呼,上古音包括韵部和构拟音标。每个声符中的上古音按上古韵部及其主元音、松紧、韵尾相聚。需要说明的问题作为字头的脚注。后附笔画索引,便于读者查检。
数据来自古音小镜,由midzuki_yuka分享。我用正则粗略地洗版并加上了表格格式,还没有仔细校对过,错误可能还很多。小镜的数据有两种记音,一种是原作者的,一种是站长整理后的。我只保留了原作者的记音。
古音小镜的站长为《汉语古音手册》的编制提供了技术支持,应是潘悟云本人让其把数据放到网站上公开的。数据的词条数(18879)与纸本《汉语古音手册》的字头数(18887)基本吻合,可确定就是《汉语古音手册》的半完整数据(古音小镜剔除了原书的中古拟音,但其余信息一个不少)。可能是为了避免出版社找麻烦,小镜没有说明所谓“上古擬音電子版”基本是《汉语古音手册》的数据。
《汉语古音手册》的出版只是郑张尚芳-潘悟云拟音体系的一个阶段性的成果,古音小镜声称潘悟云的上古拟音会随研究进度不断更新(但如果日后真有更新,恐怕也很难再爬取,小镜和爬虫的对线如今已经发展到影响网站使用的地步了,真人想查询资料都要被反爬程序硬控。)。
未洗版数据:date.txt (7.1 MB)
原材料:
汉语古音手册.txt (13.9 MB)
mdx:
汉语古音手册.7z (1.1 MB)
2024-12-25
- 修复异读表格全部变为粗体的问题。
我最后有一个请求。上古音新三家之一的斯塔罗斯金把自己对古汉语的拟音数据放到了他自己的The Tower of Babel (starlingdb.org)网站上,但是网站上供下载的big china数据集是残缺的,没有上古前期到中古音之间的拟音数据。我对爬虫一窍不通,希望有懂爬虫技术的大佬能把这个网站上的几千条数据爬下来(网站甚至没升级到HTML5,爬起来应该相当容易)。这样上古音新三家的研究成果在本站就齐全了,对于音韵学研究有极大的便利(白一平-沙加尔汉语拟音)。