请教:繁体字“两可词”,能否“二选一”,挑选出其中较常用者,作为简繁转换的“优选词”?

统计了一下,在《教育部國語辭典簡編本》中,有将近120组“两可词”:

=======“两可词”列表=======

揹黑鍋 背黑鍋 備注 備註 編制 編製 不准 不準 剷除 鏟除 沖犯 衝犯 沖擊 衝擊 窗帘 窗簾 捶打 搥打 詞匯 詞彙 呆滯 獃滯 盪漾 蕩漾 電焊 電銲 電線杆 電線桿 荳芽菜 豆芽菜 荳蔻 豆蔻 荳蔻年華 豆蔻年華 噁心 惡心 番薯 番藷 彷彿 髣髴 仿傚 仿效 倣效 撫卹 撫恤 乾貝 干貝 甘薯 甘藷 鼓錘 鼓鎚 鼓噪 鼓譟 刮風 颳風 拐杖 枴杖 后座 後座 胡同 衚衕 迴盪 迴蕩 回響 迴響 回轉 迴轉 匯報 彙報 匯集 彙集 伙伴 夥伴 伙計 夥計 計劃 計畫 鑑定 鑒定 鑑賞 鑒賞 膠卷 膠捲 儘快 盡快 儘量 盡量 精煉 精鍊 侷促 局促 舉荐 舉薦 扣子 釦子 餽贈 饋贈 捆綁 綑綁 拉鍊 拉鏈 老板 老闆 老板娘 老闆娘 累累 纍纍 厘米 釐米 鍊子 鏈子 了解 瞭解 烈焰 烈燄 痲疹 麻疹 矇蔽 蒙蔽 矇混 蒙混 彌漫 瀰漫 面皮 麵皮 唸白 念白 怒氣沖沖 怒氣衝衝 排泄 排洩 品嘗 品嚐 悽慘 淒慘 悽楚 淒楚 箝制 鉗制 秋千 鞦韆 繞境 遶境 人參 人蔘 山岳 山嶽 捨我其誰 舍我其誰 升天 昇天 剩餘 賸餘 手表 手錶 疏浚 疏濬 水表 水錶 搜羅 蒐羅 痠痛 酸痛 它們 牠們 臺風 颱風 托詞 託詞 托兒所 託兒所 托福 託福 屋檐 屋簷 下擺 下襬 閑暇 閒暇 小伙子 小夥子 泄洪 洩洪 泄露 洩露 泄泄 洩洩 雅緻 雅致 煙斗 菸斗 煙灰 菸灰 岩石 巖石 慇懃 殷勤 佣人 傭人 游民 遊民 游刃有餘 遊刃有餘 游手好閒 遊手好閒 踰越 逾越 語匯 語彙 慾望 欲望 雜沓 雜遝 糟蹋 蹧蹋 折疊 摺疊 侄子 姪子 朱筆 硃筆 朱砂 硃砂 注定 註定 自制 自製 剽悍 慓悍 彷徨 徬徨 嫋娜 裊娜 嫋嫋 裊裊

=======以上共235个词=======

恳请网友们指教:能否逐一挑选出日常生活中较为常用者,以便于简繁转换。非常感谢!

其中有些词,其实是完全不同的两个词,不可互换。如“編制(名词,如“行政編制、正式編制、臨時編制”) / 編製(动词,如“編製年度預算、編製各種家具”) ,不准(如“不准張貼廣告、閒雜人不准隨便出入”) / 不準(如“發音不準、時鐘不準”)”。

还有一些历史词,几百年前是这么用,而到了现代,不知是否已换用了更简单的写法呢,如:“秋千 / 鞦韆”,“胡同 / 衚衕”,这些我纯靠猜,是无从猜得出来的,只能恳请台港澳的网友指教啦。

谢谢!

您指的是《國語辭典》嗎?

1 个赞

假如你愿意一个一个研究,加了英文引号""放到谷歌里检索。结果多的,就是词频高的,作为优选。

“揹黑鍋” 找到约 49,500 条结果

“背黑鍋” 找到约 281,000 条结果

假如你想用程式做,去找个词频表吧。

用 Wiktionary 词头数据批量比对就行了。志愿者编辑几乎全来自大陆以外。

https://en.m.wiktionary.org/wiki/衝擊#Chinese

1 个赞

唉,最近我的梯子全部失效,一时也无法“科学上网”访问谷歌和Wiktionary。
数量不算多,不知网友们能否用脚本爬一下这235个词组。
或者,有无相对权威的繁体字、词频数据,直接就能用的?
感谢指教!

1 个赞

Wiktionary本坛似乎有。

CJK-English Wiktionary 2021

科学上网推荐 (我没用过,有兴趣可以看看)
https://forum.freemdict.com/t/topic/10953/9

不准 不準

这两个应该没问题吧。“不准”是禁止。“不準”是不精确。

最近也对繁体字犯迷糊,比如:“迴天”与“回天”(无力回天),“打鬨”与“打哄”。为什么“下坂走丸”用“坂”,“阪上走丸”却用“阪”?
“推燥居濕”(国语)还是“推燥居溼”(辞源)?“兼容并包”(国语)还是“兼容並包”(辞源)?

“推燥居濕” 找到约 85,700 条结果

“推燥居溼”找到约 79,200 条结果

“兼容并包”找到约 1,270,000 条结果

“兼容並包”找到约 322,000 条结果

1 个赞

那看来“推燥居濕”、“推燥居溼”都在用。“兼容并包”多这么多应该是因为简繁体相同。

“濕” 找到约 47,300,000 条结果

“溼” 14,400,000 条结果

“并” 找到约 874,000,000 条结果

“並” 找到约 409,000,000 条结果

1 个赞

若直接参考谷歌搜索结果,恐怕存在“漏洞”。
比如这个词“兼容并包”,简繁体字恰好完全相同,那么它的搜索结果,必然远超“兼容並包”——因简体的搜索结果也一并包含在内了。
类似地,但凡存在简繁体相同词形者,谷歌搜索结果必然远远占优,如:“窗帘、捶打、豆芽菜、豆蔻、仿效、老板、伙伴、鼓噪、厘米……”,如此一来,谷歌搜索结果数据,对于简繁体研究,恐怕就不足为据了。

若能找到台湾版或香港版的权威字、词频,可能会有用些。

OpenCC简转繁的结果是:兼容幷包。

兼容并包 -> 兼容幷包

我也发现了,好多带“并”的词语转成了“幷”。

你可以参考一下2000年以前的《国语》老版本,台湾写作台灣的。

是的,可以参考一下以前的版本

似乎问题不小心又给“绕”回来啦,哈哈。
这些“两可词”,原本就是从《國語辭典》中摘出来的。
我想遴选的,并非20多年前的常用词形,而是今时今日台港澳网友们正在用的常用词形。
此外,顶楼可能有些“误导”了朋友们——
这些词皆为“两可词”,是《國語辭典》官方认可的通用词、正确词,而不是“非此即彼”的正误词,也不是“你死我活”的必须“二选一”的单选词。
这意味着,若实在不好选,只需闭上眼睛,随便点到哪个就哪个,随机选一个即可——绝对不会是错词!(当然,編制/編制、不准/不準那一类“两可而非同一词”者除外!)

话说,楼主有些吹毛求疵啦,呵呵呵呵。