【资源求助】搜集一波中英双语资料

计划部署一套 Tio词典(中英、中日) | 登樓古籍全文檢索 在 hua 提供的服务器上,这样以后只要你能访问论坛,那TIO也一定是可用的。正好借着这个机会,最后搜集整理一波中英双语资料。

要求的话:

  1. 来源相对权威可靠,一句英文+一句中文
  2. 格式最好是txt纯文本,或者是doc、mdx、epub这种可以简单转换为txt的格式。比如有一些专业的英汉词典可能只有epub格式。

当前已有数据:

21世纪英汉
MTI互译词典
中国特色语汇
剑桥国际
剑桥高阶
商务英语
外研社新世纪
外研社现代
当代英汉
文馨英汉
新世纪汉英
新冠疫情词汇
新牛津
朗文写作活用
朗文当代
柯林斯高阶
牛津中阶
牛津双向
牛津同义词
牛津商务
牛津搭配
牛津短语
牛津高阶
牛津高阶v4
纽约时报
维基百科
网络双语
美国习语
美国传统
职业卫生学词汇
联合国语料
英汉大词典
译典通
译文社汉英
远东新世纪
远流英汉
金融时报
韦氏高阶
颜氏美语
麦克米伦高阶

17 个赞

可以考虑下,
部署 牛津 a dictionary of 叉叉 么

1 个赞

叉叉是什么。hua大说服务器资源够用,所以大家如果有资料想包含在TIO里面,提供一下就可以。

2 个赞

供参考:

汉英对照中国古代名言辞典

中国思想文化术语

z-lib:

中华思想文化术语:中英对照(1-9辑合集)
外语教学与研究出版社 2021

1 个赞

17本txt.zip (13.4 MB)

image

3 个赞

牛啊,太期待了。

读外刊查词的时候很有用,有些在词典苦找不到的结果却在网页版TIO发现意外惊喜,考虑加经典影视剧 纪录片的字幕资料吗?这些在字幕网站上比较容易获取,然后用字幕软件处理一下就是非常不错的语料

1 个赞

记得之前网上有双语字幕的语料库,后来没找到了。可以做成一个扩展包,用户查询时可以选择启用或不启用。

1 个赞

扩展包选项:Ted演讲词、《圣经》,这都是可以英汉逐句对照的。

“扩展包”的概念很好,就给一些可以打勾的框,全选、全去(然后一个一个添加)等选项。

Ted演讲词

Web Inventory of Transcribed and Translated Talks

1000s of Other Language Bible Resources

扩展包不错,干脆再激进点,搞成模块化,每本词典都可以选择启用或不启用。默认选项是将主流的词典都打开。

字幕 原文件:
老友记全十季字幕.rar (4.0 MB)
生活大爆炸字幕.zip (5.0 MB)

等我有空的时候处理一下,或者哪位伙计有现成的TXT;
或者帮忙处理处理;

补充:
新视野大学英语 原文与翻译合并.zip (1.1 MB)
张培基散文佳作108篇.zip (93.1 KB)

3 个赞

搜集了一些TED的字幕,以前保存了一个影视字幕包也找不到了,TED,BBC纪录片,经典影视剧的字幕质量都很好,还请坛友一起来搜集。
链接: 百度网盘-链接不存在 提取码: yinp

1 个赞

字幕的问题是经常会因为太长而被切成两三句,这时候中英文未必是对应的。即便是对应的,只有半句的话也可能不知所云。

2 个赞

这个要支持的。

建议在zlib上面搜索“中英双语”“中英对照”“汉英对照”

很多正式出版物,不过是文学类居多

这个问题不难解决,设置截取长点就行,你看视频字幕显示的时候是一行,做成词典的时候当然会取整个句子

搜集了一些TED的字幕,以前保存了一个影视字幕包也找不到了,TED,BBC纪录片,经典影视剧的字幕质量都很好,还请坛友一起来搜集。
这个分享过期了,能再续吗?

1 个赞