[网站] News In Simple - 基于 Gemini 的分级阅读语料库 (Level 1-3)

各位坛友大家好。

混迹论坛挺久了,平时在这里收了不少词典资源(MDict 是真爱)。

这几年为了学英语,囤了几个 G 的 mdx 词典,也背了不少 Anki 卡片。但我发现一个痛点:脱离了真实语境(Context),单词记得快忘得也快。

直接去啃 BBC/CNN/Economist 的原版新闻,生词密度太大,查词查到手软,阅读体验很割裂。

为了解决这个问题,也为了让自己能坚持“Daily Reading”,我开发了一个基于 AI 的分级新闻阅读网站:News In Simple

目前网站刚上线 MVP 版本,完全免费,无广告,想邀请各位坛友试用一下,顺便求一波关于阅读体验的建议。

【主要功能】

网站的核心逻辑是抓取每日热点(Youtube/主流媒体),利用 Gemini Pro 模型进行分级重写

  • 3-Level Graded Reading( 分级阅读
  1. Level 1:极简模式,去除了长难句,适合快速了解新闻大意(类似 VOA Special English)。

  2. Level 2:进阶模式,保留了部分常用搭配,适合中级水平。

  3. Level 3:高阶模式,接近原版难度,适合配合高阶词典进行精读。

  • Vocabulary Insight(词汇提取)
  1. 每篇文章下方自动提取了 Key Vocabulary。

  2. (这里想请教大家:目前的释义比较简单,未来计划接入更专业的英英释义,大家觉得有必要吗?)

  • 多模态输入
  1. 配备了真人/AI 朗读音频(练听力)。

  2. 关联了原始的 YouTube 视频素材。

  3. 纯净阅读体验

  4. 没有乱七八糟的弹窗和广告,排版尽量模仿了电子书的样式,希望能让大家专注于文本本身。

【后续开发计划】

我知道坛子里大家对 Context(语境)Frequency List( 词频 表) 很看重。

接下来的版本(Word Insight),我计划做两件事:

  1. Context-First Dictionary:不再只是罗列释义,而是结合新闻语境生成助记卡片。

  2. Core Lexicon:基于 Longman 3000 / GSL 等高频词表,结合新闻内容进行高亮标注,帮助大家优先掌握高频词。

【地址】

:backhand_index_pointing_right: https://newsinsimple.com/

【求反馈】

因为是独立开发,UI 还有点简陋。

特别想听听大家对于**“AI 改写后的文本质量”**的反馈?有没有觉得哪种难度读起来不够自然?

或者大家觉得作为一个“阅读辅助工具”,还需要哪些功能(比如划词翻译、导出 PDF 等)?

感谢各位大佬!:folded_hands:

4 Likes

挺不错的。

英语因其历史原因已经成为世界性语言,对外开放和交流需要更多更好的英语水平。而国人学英语难,我认为一大原因是英语学习的强度、长度不够,被中小学考试这个指挥棒人为地拉长了,在课堂之外缺少语言环境。

运用AI工具创造更多更有针对性的语料是个好办法。建议对阅读材料作更多分级(如果目标受众含中小学生的话)和分类(商业、科技、体育等等)。至于AI 改写后的文本质量,我相信主流语言大模型的改写能力超过人类的平均水平,而且作为语言练习材料,少量错误或者幻觉无伤大雅。

1 Like

感谢反馈,我也是基于自己的一些需要,不断的去调整产品。我自己觉得新闻的语料很自然,也和真实世界链接的很紧密,篇幅也不长,读起来压力不大,有这个产品还可以有一些关键词汇的提取,quiz 这样互动的题目也很不错,整个过程轻松了

已注册 试用。挺好的。
关于重点新词这块,我个人感觉里面的有难度的单词貌似没标注,反而常用词汇放在下面备注。

任何学习包括语言学习,其实跟LLM训练一样,最终都要形成神经元连接网络。如果难度太大,大脑就会分泌激素、发出痛苦信号催促放弃;如果太简单(类似用同样的语料去反复训练LLM),则不利于刺激神经元形成新的连接。这也是分级阅读的初衷,根据自身语言水平和兴趣点去选择难度刚刚好的分级语料。

建议可考虑逐步扩大原始语料的来源面。比如美国中小学教材Wonders系列等等各类教材(某乎上有诸多介绍),就是天然的分级阅读材料。还有托福雅思的阅读题等等。当然需要AI进行改造。

1 Like

这个我会调整一下算法的,后面会引入「ESS4000」这样的词单机制,重点标注这样的词

这个想法很棒,我先想想;但是精力有限,我先把计划内的一些功能先开发完,谢谢啦