我做的類似「科學實驗」,從2300個樣本詞語中,以電腦機械方式「子集化」,將有可能存在問題的詞語,縮減至300多個,然後逐一人工核查這些「可疑詞」。當然,這一切基於一個不十分嚴謹的斷言:
假設,這三种不同的簡繁體轉換程式,不會同時轉錯任意一個問題詞。
然而,三种程式,確實是有可能同時誤將一個詞簡繁轉換出錯的。比方說,簡體詞「阿奶」,轉換為繁體,應當是「阿嬭」(稱阿母、母親。)——很遺憾,三种程式同時出錯了!於是,這個問題詞就成了漏網之魚,至少,以我的機械方法,無法將其成功捉出。
無論如何,我打算先將這300多個「可疑詞」子集中,可能存在的錯誤,逐個逐個地捉出來,如此可統計出一個大致的準確率,或者說,錯誤率——這也是極好的。
說到台灣通同字,恰好遇到兩組字:「岩巖」與「台臺」。
據網友整理的資料,「岩」只用於「岩石、沉積岩、岩漿」等與地質相關的意義,其餘則用「巖」,如「巖壁、中空成巖、千巖萬壑」等等。查《重編國語辭典修訂本》,亦是同樣結果。不過,我看繁化姬的轉換結果,似乎許多地方用「岩」?
又,與「平地」有關用「臺」,「台」爲罕用字。查《重編國語辭典修訂本》,亦是同樣結果。而繁化姬似乎全用「台」?
我猜測,這是民眾的習慣(習俗)用法嗎?