《拉鲁斯法汉双解词典》 文本数据(OCR)

这个是为了处理比较复杂的中法文混合问题才这么写的,但是还是不能覆盖完全,有的句子有特殊数学符号和在unicode非BMP的中文字符这种就要改正则。