汉语词典拼音连写转为分开的正则式

有不少词典的注音 是连写的,极其不方便,严重影响读者的阅读体验。不知道所谓的砖家是怎么想的。

商务系列有一些词典就是这样编的。

bùshìdōnɡfēnɡyāliǎoxīfēnɡ,jiùshìxīfēnɡyāliǎodōnɡfēnɡ
bùshìdōngfēngyāliǎoxīfēng,jiùshìxīfēngyāliǎodōngfēng
ɡèrénzìsǎoménqiánxuě,mùɡuǎntājiāwǎshànɡshuānɡ
huàlónɡhuàhǔnánhuàɡǔ,zhīrénzhīmiànbùzhīxīn
tǔbānɡtǔchénɡqiánɡ,qiónɡbānɡqiónɡchénɡwánɡ
tàpòtiěxiéwúmìchǔ,suànláiquánbùfèiɡōnɡfū
huàhǔhuàpínánhuàɡǔ,zhīrénzhīmiànbùzhīxīn
zhǐxǔzhōuguānfànghuǒ,bùxǔbǎixìngdiǎndēng
zhǐxǔzhōuɡuānfànɡhuǒ,bùxǔbǎixìnɡdiǎndēnɡ
bǎojiànzènɡyǔlièshì,hónɡfěnzènɡyǔjiārén

这是要人命啊?!
密集恐惧症 都要犯了。。。
人为制造认读困难,故意与人民为敌。

我在做古代汉语词典2 时,修正过这一问题。现在把 批量替换的正则表达式分享出来,方便大家替换有同样毛病的词典。
这个表是提取数本大型词典制作的,然而不能保证覆盖了所有词组,所以有些 词组 还是需要人工审核分开。

正则式:

on 【chánggōng】 cháng gōng
on 【bàngtāi】 bàng tāi
on 【bàonüè】 bào nüè
on 【bàoxíng】 bào xíng
on 【báihóngguànrì】 bái hóng guàn rì
on 【báicáng】 bái cáng
on 【bàoxīnjiùhuǒ】 bào xīn jiù huǒ
on 【báshè】 bá shè
on 【báqiā】 bá qiā
on 【báqiánzhìhòu】 bá qián zhì hòu
on 【chángshé】 cháng shé
on 【bàozuì】 bào zuì
on 【bèiluàn】 bèi luàn
on 【bèijǐn】 bèi jǐn
on 【bìjī】 bì jī

在EmEditor中测试通过

拼音转分开tsv.7z (2.5 MB)

使用方法:在EmEditor 批處理替換中,導入 正則,即可。

7 个赞

感谢阿弥陀佛兄提供正则

按照现行国标,这属于编校错误。
截取 《汉语拼音正词法基本规则》 GB/T 16159-2012中的一段内容,以供诸位参考。

這個規則本身就有問題。

对于xiān和xi’ān及其类似的结构如何处理的?

1 个赞

不是所有國標都那麼容易使人信服的。 :joy: