更新(2024-03-12)
- http://forindo.net:28501/ 0.1.0a2版, 端口改成28501,支持中、英、法、德……韩、俄、阿拉伯语等15种语言。国内服务器。
- https://huggingface.co/spaces/mikeee/mlbee 0.1.0a3版,比0.1.0a2更快,支持50+语言,例如尼泊尔语。服务器不如forindo强大,闲置会进入休眠,唤醒约需几分钟。(可惜需架提子才能访问)
- https://beestudio.streamlit.app/ 同上,但服务器貌似更慢一些,访问无需提子。
更新(2022-12-24) ptextpad-electron github下载: Releases · ffreemt/ptextpad-electron · GitHub 或 freemdict云下载v0.0.3-0 (FreeMdict Cloud) , 目前仅提供Windows 64位安装包(Linux、macOS可clone源码在node环境下运行)、中英对齐(ezbee对齐引擎有远程服务器提供)。详情参看 GitHub - ffreemt/ptextpad-electron: A parallel text editor using electron
更新(2022-6-16) mlbee 同步升级到 0.1.0a2: 加了分句功能。三个网页同步更新:
- http://forindo.net:8501/ 推荐,快 (
暂时离线回归[2022-09-19确认]) - https://huggingface.co/spaces/mikeee/mlbee 也快,但网页地产被hf占了一部分
- https://share.streamlit.io/ffreemt/mlbee/main/app_mlbee.py 慢,但独占全部网页
更新(2022-6-10) mlbee 0.1.0a1 开发测试版 https://share.streamlit.io/ffreemt/mlbee/main/app_mlbee.py
https://huggingface.co/spaces/mikeee/mlbee huggingface spaces 版, 快二十倍的样子,Later by Stephen King 的英德整本书对齐只需5分钟。但只能嵌在hf界面里,左面的仪表盘收不起来。
http://forindo.net:8501/
一位网友提供的,速度和 huggingface 不差上下,但自成一体(没huggingface的网页头),左边的仪表板可以收起来
任意语言对(无需指定语言),对齐速度:1-2秒/对。即是说, 300对约需5-10分钟。
效果好像还不错,可惜有点慢。欢迎试用反馈。
更新(2022-6-3) litbee 0.1.2a3 整合 ezbee(中英),dzbee(中德)和debee(英德)https://share.streamlit.io/ffreemt/litbee/main/app.py
英、德、中 段段对齐基本可以用了,可上传,粘贴文本、直接从网址取文本,提供信心颜色码、xlsx下载 (tsv下载待修)
更新(2022-4-3) ezbee: 命令行中英对齐工具
安装(仅限python3.8):pip install ezbee==0.1.0a2
或 poetry add ezbee==0.1.0a2
使用帮助: ezbee --help
或 python -m ezbee --help
其他安装选项参看 https://bumblebee.freeforums.net/thread/2/ezbee-cli-related?page=1&scrollTo=3
更新(2022-3-7) Huggingface Space好像出了点状态——radiobee输出乱套了(本地Linux运行正常)。论坛上发了贴求助,不知道有没人跟进。修好后我再在这更新。
网络版更新(2022-1-13):
- 加入了支持多语种的慢对模式(约千段几十秒的样子),快对模式(约千段几秒)仅限中英、英中语言对
- 限制了文本长度(单文件4000非空行,两个文件加一起6000非空行)
- 对齐后少于200行会显示一个一览表
更新(2022-1-10):仅限网络版https://huggingface.co/spaces/mikeee/radiobee-aligner (单机版等整好句句对齐功能后一起发beta版),自动分离对齐 单文件 中英 混合, 用法:上传到 file 1再点击 Submit
试用:选 Example 表里的最后一行(纽约时报的一篇文章),点击 Submit
更新(2021-12-30):单机浏览器测试版( Win10 64位版,其他Windows 64位机应该可以走起来) 链接: https://pan.baidu.com/s/1jNDXV7X_I_KCDOsqBk9saA?pwd=g634 提取码: g634
解压后点击 start-radiobee,在浏览器地址栏输入 127.0.0.1:7860 回车
=================
不是字典制作,也不是搜索,权且放这里吧。
《呼哮山莊》第一章对齐结果片段
也可以直接去https://huggingface.co/spaces/mikeee/radiobee-aligner 点击Examples里第一行,再点Submit看结果。
radiobee 工具仍处在开发初期,但基本可以用了,个人认为效果不错,而且速度很快,几千段几秒钟可以出结果。目前仅支持 中英 英中 文本上传文件(以后可能考虑docx、pdf格式或其他语言对)。可预览(上图),可以下载对齐后的 csv、xlsx 格式文档。
界面是英文的,但很简单,点击FILE 1, FILE 2 处上传或将文件拖到FILE 1、FILE 2处。点击 SUBMIT。(参数微调无需理会)几秒钟后就有结果。点击 CLICK TO DOWNLOAD CSV 下载文本文档或点击 CLICK TO DOWNLOAD XLSX下载 xlsx文档。
也可点击 Examples 里的文档做对齐看效果:含《呼哮山莊》第一章、莎士比亚全集前500段以及《红楼梦》第一章。
网页由机器学习公司Huggingface托管,我并不能看到或保存用户上传的内容。但使用时仍需注意去掉文件里的敏感信息。
radiobee aligner全部源码(除了一个文件外)可以在Files and versions(戳我)查看。