间隔重复到底怎么起作用(以及为什么多数 App 做错了)
从 Ebbinghaus 遗忘曲线到现代 FSRS,看清间隔重复词汇学习的科学,以及为什么大多数 App 还是没真正实现它。
最近更新:2026 年 3 月
速读
- 遗忘曲线是真的:除非你在精确的时间点复习,新词汇约三分之二在 24 小时内丢失。
- 间隔重复词汇系统通过「在你即将忘记前」安排复习,把短跑变成长跑。多数 App 在模拟它,但没真正做它。
- 一个好 SRS 算法和一个差算法的差距,是「保留 90%」与「保留 30%」的差别。
你忘了昨天 70% 的词。原因在这里。
普通学习者在首次接触新词后的 24 小时内会忘掉约 70%。不是因为懒,不是因为词太难,而是因为人脑的设计本就在丢弃没收到「请保留」信号的信息。
这不是个人缺陷,是机制。大脑维护着估计 100 万亿个突触连接,没有「修剪机制」就会被自身重量压垮。未使用或弱化的连接通过「突触修剪」过程被系统性地削弱并清除。对语言学习者来说,问题在于:「请保留」恰恰是多数学习方法没能传递的信号。
App Store 上大约有 150 个词汇 App,几乎都在表层理解了这个问题。Duolingo 有连胜,Quizlet 有卡片堆,Anki 有能与学术研究软件比肩的算法。但多数学习者仍然停滞、仍然遗忘、仍然放弃。
这篇讲清楚间隔重复词汇学习的真实科学——从 19 世纪一位通过反复背无意义音节来理解记忆本身的德国心理学家说起,然后告诉你怎么用它把词汇永久留住。
第一节:遗忘曲线 —— Ebbinghaus 1885 年发现的事
1885 年,Hermann Ebbinghaus 出版了《Über das Gedächtnis》(《论记忆》),一本认知心理学被引最多的著作之一。他的实验简单而略带强迫:他背一连串无意义音节(如「WID」「ZOF」「BAK」),等不同的时间,再测「重新学会」时省下了多少努力。
他发现的,就是后来被称为遗忘曲线的东西。
数据很直白:
- 20 分钟后,约 42% 的新材料被忘了。
- 1 小时后,56% 没了。
- 1 天后,约 67% 消失。
- 6 天后,75% 丢失。
- 31 天后,留存率稳定在约 21%。
(这些是 Ebbinghaus 的「节省分数」——衡量「随时间保留下来的复学努力」。)
曲线不是直线,前几小时陡降,之后渐渐平缓。这一点很关键:第一个复习窗口最重要。24 小时后才复习的人已经是上山推车;20 分钟后复习的人正在曲线最陡处接住它。
对语言学习者,挑战比 Ebbinghaus 的无意义音节还糟,原因有两点。量大: 一个 TOEFL 考生每周学 50 个词,回忆负担远超 Ebbinghaus 测试过的范围。干扰大: 真实词汇彼此竞争(「affect」vs「effect」、「comprise」vs「compose」),形成顺向与逆向抑制,加速遗忘。
记忆巩固与睡眠
Ebnighaus 在神经科学还没工具解释「为什么遗忘按这条曲线」之前就工作。我们现在知道:新学的信息先存在工作记忆里,必须通过称为「记忆巩固」的过程被搬到长期记忆。巩固耗能,主要发生在睡眠中——尤其是慢波和 REM 周期。
这有一个直接的实操含义:睡前复习词汇不是迷信,是生理学。睡前复习的词在巩固窗口最活跃的时刻进入。关于陈述性记忆(用于词汇的那一类)的研究反复显示,临睡复习能把第二天回忆率提升 20—40%。
换句话说,遗忘曲线有一个天然的「漏洞」:把复习时机卡在下降处,再用睡眠放大效果。间隔重复就是同时做这两件事的系统。
第二节:间隔重复究竟是什么
间隔重复怎么起作用?
间隔重复是一种学习技术,把对每一项的复习安排在逐步拉长的间隔上,校准在每一项的记忆即将消退之前。
它不是每天复习全部 50 个词(集中练习,或「填鸭」),而是单独跟踪每个词,问:这个具体学习者大概什么时候会忘掉这个具体的词?然后把下一次复习安排在那个临界点——不早(浪费时间在还很新鲜的记忆上),也不晚(让遗忘赢)。
填鸭的类比是短跑:紧张、快速、不可持续。间隔重复是马拉松:稳定、复利、永久。填鸭可能让你第二天的考试得 90 分,一周后同一个考试得 20 分。间隔重复第二天得 70 分,一个月后还是 70 分——而且差距随时间越来越偏向间隔重复。
SM-2 算法
最广泛实现的间隔重复算法是 SM-2,由 Piotr Wozniak 1987 年为 SuperMemo 开发。SM-2 这样工作:
- 复习一张卡时,你按难度评定自己的回忆。
- 算法基于你的评分计算一个间隔(到下次复习的天数)和一个易度因子(如果你持续轻松回忆就放大、如果你挣扎就缩小的乘子)。
- 一张新卡上一次自信的回忆可能把下次安排在 4 天后;完全失败把它重置为 1 天。
- 每次成功复习后,间隔乘以易度因子。一张你正确回忆 5 次的卡可能间隔为 30 天。一张你一直忘的卡几乎一直停在 1—2 天。
结果是简单词(一个 B1 学习者面前的「table」「city」)很快被安排到每月或更稀的复习,几乎不占日常时间。难词(「sycophant」「ameliorate」「perfidious」)保持高频率轮转直到牢固。
FSRS:2022 年的升级
SM-2 在 1987 年很出色。2022 年,研究者 Jarrett Ye 发布了 FSRS(Free Spaced Repetition Scheduler)——基于机器学习、用数百万真实 Anki 复习日志训练的算法。FSRS 在三方面对 SM-2 关键升级:
- 把记忆建模为二维状态:稳定性(多久不忘)和可提取性(当前正确回忆的概率)。SM-2 只跟踪间隔。
- 按个体重新校准预测,不只是按卡片。你的个人遗忘率被纳入。
- 更准确地处理失败(重学忘掉的卡),避免 SM-2 常见的「易度地狱」——反复失败的卡积累压垮性的日常负荷。
FSRS 自 Anki 23.10(2023 年 11 月)起可用,被广泛认为是截至 2026 年公开可得的最佳 SRS 算法。用户需要手动启用,但采用率快速上升。
视觉化:图上想象两条线。填鸭线在考前急升,然后崩塌。SRS 线爬得更慢但从不掉到 70% 以下,会话叠会话复利成接近永久的留存。
第三节:为什么它起作用 —— 背后的科学
提取练习:测试胜过重读
2006 年,认知心理学家 Henry Roediger III 与 Jeffrey Karpicke 发表了一项里程碑研究,比较「只学习」(重读)和「反复测试」两种条件。一周后的最终测试上,被反复测试的学生留存率显著高于只重读的。仅重读组忘掉了原本学过的一半以上,反复测试组则少得多。
机制是:提取练习——把信息从记忆里拉出来而不只是再放进去——产生的记忆痕迹比被动复习更强、更持久。每次你回答一张卡,你不是在简单核对自己是否会这个词,而是在加固提取它的神经通路。
这就是为什么主动回忆词汇练习系统性地胜过荧光笔标记、重读,甚至做笔记。提取时的努力才是建立记忆的力量。
合意难度
加州大学洛杉矶分校的 Robert Bjork 提出了「合意难度」的概念:稍微更难的学习条件会产生更好的长期留存——哪怕当下感觉「没那么有效」。
对间隔重复词汇而言,这意味着在你即将忘记的时候复习一个词,而不是在它仍新鲜、容易的时候。「在遗忘的最后一天勉强想起 perfidious」的难度,正是让那次提取强而有力的原因。把间隔安排得太进取(太频繁复习)会杀掉这个效应;安排得太松会产生更多遗忘事件,自有其代价。
甜蜜点是 SRS 间隔——不舒服,但精准校准到「刚好够难」。
交错练习
「分块学习」意味着先把所有「交通词汇」一起复习,再把所有「学术动词」一起复习。「交错学习」意味着随机混合。交错短期表现更差但长期更好——又一个合意难度。
实现良好的间隔重复词汇系统天然产生交错:因为每个词都有自己的间隔,你的日常复习队列把几十个语义类别和接触年龄的词混在一起。这不是意外,而是相对于任何按主题分组的学习方法的结构性优势。
睡眠:巩固窗口
神经科学已经证实 Ebbinghaus 当年只能推断的事:海马体会标记新记忆以待巩固,并在慢波睡眠中重放并强化记忆痕迹。在睡眠前几小时学过的词受益于更长的海马重放。其他条件相同时,睡前 15 分钟的词汇复习胜过中午的 30 分钟。
Rhythm Word 的离线能力在这里恰恰重要,因为「睡前复习时段」也正是 Wi-Fi 最可能关闭、设备开启免打扰、最佳巩固窗口打开的时段。
第四节:为什么多数 App 没做对
不是每个声称用「间隔重复」的 App 真的在用,而差异对长期留存影响巨大。下面是对主流玩家的诚实拆解。
Duolingo
Duolingo 有大型且资金充足的研究团队,自己也发表过有效性研究。但其核心产品为「参与度指标」(日活、连胜、通知打开率)优化,不是为词汇留存。
Duolingo 里的间隔重复部分从属于课程结构。词汇按课程进度再次出现,不是按每条的遗忘曲线。没有难度评分,没有按词级别的自适应安排。游戏化层(爱心、连胜、排行榜)是行为驱动的主机制,被设计来最大化每日打开数,不是最优复习时机。
这不是对 Duolingo 用作通用英语接触的批评。但单论间隔重复词汇,它的实现很轻。
Quizlet
Quizlet 的「Learn」模式通过在你答错时让题项更频繁出现来模拟间隔重复。方向上对,结构上有限:间隔是固定的、基于会话内行为,不是跨日调度。没有跨会话的记忆模型——周二「学过」的词到周四不享有特殊地位。
Quizlet 的优势在内容创建:几百万张用户共建的、各种学科的卡片集。SRS 实现不匹配底层科学。
Anki
Anki 是 SRS 算法质量的金标准。如前所述,它的 FSRS 实现是公开可得的最复杂调度算法。对愿意投入的词汇学习者,Anki 产出极佳的长期留存。
被广泛报道的摩擦点(Reddit、语言学习论坛和效率社区都频繁提到「第一个月内高弃用率」)不在算法。在上手体验。用户必须自找或自建牌组、配置界面、理解算法设置、围绕一个自 2000 年代中期起几乎没在 UX 上投资的工具建立日常习惯。Anki 的学习曲线对学习者构成真实障碍,对技术不那么倾向的人尤其如此。
Anki 完全离线,且在这点做得非常好。但对一个想要「现成系统」而不是「研究工具去配置」的学习者,门槛是真实的。
对比
| 特性 | Duolingo | Quizlet | Anki | Rhythm Word |
|---|---|---|---|---|
| 真正自适应 SRS | 部分 | 部分 | 是(FSRS) | 是 |
| 按词调度 | 否 | 否 | 是 | 是 |
| 难度自评 | 否 | 部分 | 是 | 是 |
| 实时句子生成 | 否 | 否 | 否 | 是 |
| 可离线 | 有限 | 否 | 是 | 是 |
| 上手配置 | 无 | 低 | 高 | 无 |
| 现代俚语/时新词汇 | 否 | 看用户 | 看用户 | 是 |
| 免费试用 | 免费增值 | 免费增值 | 免费 | 是 |
Rhythm Word 的「六个引擎」在解决什么
Rhythm Word 的「6 个学习引擎」不是营销话术。它们反映了「多数词汇 App 如何处理记忆通路」上的真实空缺。
人类词汇习得使用多条认知路径:看到一个词能识别,和写作时能调出来,和在语境中自然使用,是三件不同的事。一个只训练识别(多选识别)的系统会培养出能过阅读理解但开口产出不来的学习者。
Rhythm Word 的六个引擎覆盖:
- 识别 —— 看到词、识别意义(被动回忆)
- 产出 —— 看到定义、产出词(主动回忆)
- 语境中回忆 —— 词出现在个性化句子里;学习者确认理解
- 语境判断 —— 这句话用对了这个词吗?强制语义精度
- 间隔提取 —— 核心 SRS 调度层,逻辑同 FSRS
- 交错复习 —— 主题混合的日常队列,避免分块停滞
合在一起,这六条路径从认知科学已识别的所有承重角度攻击词汇。任何单一引擎都不够。
第五节:好的间隔重复长什么样
如果你在评估任何间隔重复词汇系统(包括 Rhythm Word),下面这些标准把真实实现和表层模拟分开。
必须有
自适应调度。 复习间隔必须基于你的实际回忆表现而变,不是固定日程。如果你某个词一直挣扎,系统必须增加复习频率;如果你掌握了,必须把复习推得更远。这是 SRS 的核心。
难度自评。 你必须能告诉系统这次回忆有多难。这不是「诚实表演」,而是算法用来校准未来间隔的信号。把这步去掉(仅自动检测对错)的 App 失去了关于回忆质量(不只是结果)的关键信息。
语境丰富的内容。 词汇不是「词—定义」对的清单。词有搭配、有语域(正式 vs 非正式)、有常见错误、有语义细微差别。只显示「perfidious = treacherous」的系统漏掉了完整图景。把词放进句子——尤其是按学习者当前水平校准的句子——会在「最接近实际使用方式」的神经语境里编码词汇。
加分项
个性化、按水平自适应的句子。 字典里的静态例句聊胜于无。按学习者当前水平和兴趣生成的句子显著更好:可懂、好记、与个人相关。Rhythm Word 动态生成它们;展示给一个备考学术词汇的 B2 学习者的「ephemeral」例句,会和给一个备考 GRE 的 C1 学习者的不同。
离线可用。 围绕 Wi-Fi 建立的复习习惯是有「单点故障」的习惯。通勤、出差、睡前复习都受益于完整离线功能。联网恢复时再同步。
视觉化进度反馈。 留存曲线、连胜数据、到期卡数不是虚荣指标,是反馈回路,帮学习者校准学习投入。看到一个词被复习了 8 次、现在间隔 30 天,比看一摞原始卡更有动力。
Rhythm Word 如何对应
Rhythm Word 的自适应调度按词动态调整间隔。每次复习,句子里的目标词默认粗体,意味着你记得。如果回忆不自信,你可以点这个词改它的状态:橙色意味着模糊,红色意味着完全忘了。这个简单交互在不打断阅读流畅度的前提下,给算法精确的难度信号。
例句是个性化、按水平匹配的:备考 TOEFL 的初学者看到的是把目标词放在易接近语境里的更简单句子;备考 GRE 的高级学习者看到的是同一个词在更高语域里。
App 的离线模式把所有卡片内容和调度数据本地化下载。没 Wi-Fi 不打断。对一个早晨 7 点在首尔地铁里、信号断断续续的学习者,这不是小功能,是「保住习惯」和「断掉习惯」之间的差别。
第六节:今天怎么开始
研究已经盖棺。间隔重复词汇有效。差距永远在实施——具体说,是搭起一个不会两周后崩掉的日常习惯。
下面是一份对任何严肃 SRS 系统都适用的五步协议,并直接对应 Rhythm Word 设计的使用方式。
第 1 步:选一个对应你目标的词表。 不要学「全部英语词汇」。选一份:TOEFL 学术词汇表、GRE 高频词、IELTS 7 分搭配、当代日常英语。聚焦输入在每个阶段都胜过分散。Rhythm Word 预装跨这些类别的词表。挑你的考试或目标对应的那一份,从那开始。
第 2 步:每天新词限制在 15—20。 这不是动力问题,是队列管理。今天加 50 个新词,4 天后会创造一个 45 分钟才清得完的复习负荷——多数人会跳过。可持续的「每天 15 个新词」复利 30 天,能产生一个稳定保持在 20 分钟以内的可控队列。连续性胜过数量。
第 3 步:先复习全部到期卡再加新词。 每天第一动作是清掉昨天的复习队列。一边跳过到期复习一边加新词,是制造不可控债务最快的方式。算法把那些复习安排在最优窗口;绕过窗口会增加未来复习负荷,不是减少。关于每日量的策略,参见 如何每天学 30 个词。
第 4 步:诚实评分难度。 不调状态地点完所有卡感觉很快,但会产生「间隔通胀」:词被安排得比该有的更远,导致忘掉的词以「失败卡 + 重置间隔」的方式回到队列。只在回忆即时且毫不费力时把词留为粗体;犹豫了就点橙色;真没想起来就点红色。算法在诚实数据上跑得最好。
第 5 步:每天 15 分钟,不是每周两次 90 分钟。 集中会话毁掉间隔效应。一周两次 45 分钟显著比一周七次 15 分钟留存更差。每日连续性不是纪律问题,是记忆巩固的运作方式。短的每日会话与生理学一致。备考 GRE 的学习者,Rhythm Word 含一份内置的 GRE 词表 和结构化学习协议。
结语:科学不是难的部分
间隔重复已经被理解了 140 年。实现它的算法自 1987 年起公开可用,2022 年起被机器学习精炼。提取练习、合意难度、睡眠巩固的研究都没有争议。
难的部分是关上「知道」和「做」之间的差距,而这道差距正是 App 设计住的地方。
Duolingo 用连胜和游戏化来关上它,代价是 SRS 保真度。Anki 用算法精度关上它,代价是日常习惯的可达性。其他大多数 App 在这两线都没认真试。
Rhythm Word 想解的设计挑战正是这个:做一个有真实 SRS 机制、语境丰富的个性化句子、六条认知学习通路、完整离线支持的系统,并让它像社交媒体 App 一样易上手。无配置,无设置。免费试用,六个学习引擎,一键开始。
在 iOS 免费下载 Rhythm Word:没有复杂设置,只有科学。
常见问题
Duolingo 用间隔重复吗?
Duolingo 在复习里融入了间隔重复元素,但其核心学习回路围绕「课程完成」和「游戏化」(连胜、爱心、XP)建立,不是按词的自适应调度。词汇按课程结构再次出现,不是按个体遗忘曲线。对一个真正聚焦词汇留存的 SRS 系统来说,Duolingo 的实现相比 Anki 或 Rhythm Word 是有限的。
Anki 比其他间隔重复 App 好吗?
Anki 的 FSRS 算法(2023 年 11 月 23.10 起可用)是公开可得的最复杂的 SRS 词汇实现。对技术上从容、愿意投入设置和牌组维护时间的学习者,Anki 交付优秀的长期留存。但其界面陈旧,上手摩擦高;社区讨论持续提到早期高弃用率是反复出现的模式。对想要「FSRS 级调度」但不想承担配置开销的学习者,Rhythm Word 提供一个现成方案,并加上句子生成。
间隔重复多久才起效?
第一周内你就会注意到留存改善。复利效应——因为词汇被牢固编码而复习变得不那么频繁——大约在 30—45 天后变得可见。在每天 15 分钟稳定下,多数学习者到第 90 天有 500—800 个词、留存率超过 80%。间隔重复不产生隔夜结果,它产生被动方法无法匹敌的持久结果。
用间隔重复每天能学多少词?
对多数学习者,假设每天 15 分钟会话预算,真实 SRS 系统下每天 15—20 个新词是可持续上限。这个节奏下复习队列保持可控,留存率高。冲到每天 50+ 新词的学习者通常制造大到让会话变成压垮的复习队列,导致跳天和到期卡的级联。编码质量比输入数量重要。
SM-2 算法是什么?
SM-2 是 Piotr Wozniak 1987 年为 SuperMemo 开发的间隔重复调度算法。它基于两个变量计算复习间隔:间隔乘子(复习间天数)和易度因子(按回忆难度调整的卡级乘子)。正确回忆增加易度因子并延长下一间隔;失败回忆重置间隔并降低易度。SM-2 作为 SRS 标准持续了 30 多年,已大体被 FSRS(2022)超越——后者把稳定性和可提取性作为独立的记忆维度,并按个体学习者重新校准。
Rhythm Word 已上架 iOS。如果我们对词汇学习的思考方式触动了你,欢迎来试试。
Download on the App Store