技术解读 14小时前 95 阅读 0 评论

从搜题到教练:面向达线的分段脚手架与再练闭环

作者头像
人人都是产品经理

AI技术专栏作家 | 发布了 246 篇文章

本文主要讨论如何把“学会”“发题”的教育产品通过AI的赋能晋升成为“得分”“达线”产品的一种可能性,其中重点是采用实际参与教研工作后从中抽象出的“分段脚手架 + 再练闭环”的最小讲练循环,让学生真正跨过考试分数线。

一、从“学会”到“达线”

1.1 付费教育的暗线

让我们试着把“AI教学”“智能教育”这些术语都暂时放下,回到一个产品的最本质问题——用户的真实需求

在教育这个场景中,尤其是带有付费属性的商业化教育场景之中,用户真正的需求是什么?

是掌握某项技能?还是理解几本书的知识?其实都不是。

在我亲身参与教学数月、与大量基层销售、家长、学生及基础教师深度沟通之后,真实的答案质朴到被大家嫌弃功利,那就是:

他们想要的,不是“学会”,而是“达线”。

1.2 什么是达线

当然,“达线”这个说法在很多人视角下仍显模糊,但它其实并不陌生。在几乎所有带有付费属性的学习场景中,“那条线”始终存在且真实可感

  • 要留学的学生,需要达到雅思或托福的目标分数
  • 想考上重点中学或大学的孩子,需要跨过录取线
  • 考公、考证、考职称的学员,也必须通过明确的分数线门槛

在这些一个个明确目标构成的场景中,真正支撑学生坚持学习、促使家长持续付费的,并不总是“热爱学习”或“技能成长”,而是跨过那道“达线”的现实需要。

那么,当我们将教育的观察视角从“知识传授”转向“达线达标”,我们会发现,对学习过程的理解也必须随之改变:

这不再是一个信息单向传递的过程,而是一个目标导向、任务驱动、节奏敏感的路径构建行为。

接下来我们一起来尝试着将市面上绝大多数的考试达线看作一个任务进行拆解时其所涉及的内容通常可以分为三个维度,在我们产品的视角下也可以看成是三类需求:(见下图)

1.3 达线三层需求

主需求:内容测(能不能考?)是达线任务的核心。

所有考试,说到底都考两件事:你有没有掌握对应的知识点,你能不能搞定对应的题型。 所以教育产品的核心价值,就在于能不能帮助学生在这两点上真的建立起能力,即教会他人与提供练习,也正因我们的主线是“教”与“练”我们才能称呼我们的产品为教育产品。

而如何去定义学生是否达到标准或者说确认学生是否再进步,其中主要涉及的衡量标准,我们可以用两个大指标来去做分析:

  1. 学生的知识点学习的覆盖率—考生掌握了多少考试会考的内容
  2. 解题的题型熟练度/正确率—考生是否具备把题做对的能力。

辅需求:技能测(怎么去考?)是达线任务的躯干。

在实际教学中,我们常常会遇到这样一类学生:课上表现稳定,练习题完成度高,思维清晰、基础扎实。但一到考试,尤其是大考,他的分数却总与平时实力不匹配。

很多时候,这种问题不在知识本身,而在于“技能”——应试技巧、考试节奏、心理调控、答题表达这些看不见但决定输赢的部分。

考试不是纯粹的“你会不会”,而是“你能不能在限定时间、特定情境下把它写出来”。

试卷规划能力、对高压场景的心理适应力、答题书写规范,都是影响分数最终“落地”的关键变量。

所以,如果教育产品真的要帮学生实现达线,就必须构建对这些技能层面的系统训练。

比如我们可以设计:

  • 模拟高压场景的答题训练(如大眼睛盯视模式)→锻炼心理耐受度
  • 答题步骤规范小游戏→提升表达规范性
  • PK式计算准确率挑战→提高答题专注度与速度

通过这些机制,帮助学生将能力“释放”成得分,让实力真正落在分数线上。

额外需求:考外辅助(以什么状态考?)是达线任务的毛细血管。

在真实教学过程中,我发现不少学生和家长在临近考试时容易陷入“状态混乱”:堵车、物品忘带、前一晚失眠、考试时频繁想上厕所……这些看似琐碎的问题,往往直接影响考试发挥,甚至错失考试本身。

考试从不是考场上的事,它从你起床、出门、进场那一刻就开始了。

这部分需求虽然不是常驻型的学习目标,但在考试前夕极具“爆发式价值”。产品可借此推出一系列场外服务:如【考前提醒】【物品清单】【路线规划】【陪考建议】等,既能提升体验温度,也能作为拉新裂变和家长沟通的重要节点。

虽是外围功能,却常在关键时刻决定成败。达线体系的完整,也离不开这些隐秘却关键的“毛细血管”。

这三种需求随着其优先级与使用的频率逐级递减,却又都不可或缺,任何一个环节都存在着发力的需求点,任何一个环节出错又都会影响学生的一次达线,由于技能测与额外需求相对其主需求而言更为琐碎,所以接下来我们一起来将视角聚焦在教育的最基础部分“教”与“练”之上。

二、一节课的构成:教与练

2.1 最小的学习过程是怎样的?

在接受授课前培训、与资深教师交流以及亲身教学实践中,我逐步梳理出一线教师在课堂中普遍遵循的教学流程:新知引入 → 题目练习 → 错题讲解 → 最终回顾

这一四阶段结构不仅高度贴合真实课堂节奏,也在教育学经典理论中有所对应:如加涅的九大教学事件所强调的注意激发、学习指导、表现反馈等环节,或布鲁姆认知分类学中“理解—应用—分析—评价”的认知路径。

为了便于产品视角下的理解与建模,我将一节典型的数学一对一教学流程,转化为结构化流程图,以图示方式展现教学过程中的关键阶段与信息流动。

对应一个知识点的教学路径,其中每个大环节都存在其所归属的功能性:

  • 新知讲解:引导学生进入学习状态、框定一节课的学习授课范围(知识点的信息传达)
  • 课堂练习:对新知讲解的效果检测(知识点的应用练习)
  • 题目讲解:通过讲练循环对知识点围绕内容的查漏补缺(知识点的巩固与内化)
  • 总结回顾:对知识点的印象加深、根据整节课的学生状态进行效果判断(知识点的提炼与架构化)

* 其中我们可以发现新知讲解的功能性中有一部分是对应整个学习内容的范围框定,而框定的范围是从何而来的呢?来源其实是有两个部分:一是整个学习计划的road map,二是上节课总结回顾后的判断

在整个课外辅导教学的过程中其实目标是由老师这个角色来把控,所以在来源中其实从计划的制订到下节课的内容判定很大程度都是由上一节课的反馈来作为输入源,所以四大部分很多时候其实是以一个循环的形式进行,如下图:

整体来说这就是一节常规课的全流程(仅以市面上主流教培机构为代表,个性化教师请见谅),而整个我们达线的终极目标就是由这样一个小循环不断地滚动前进最终完成全知识点与题型的学习。

2.2 AI小循环授课前言

在进行深入的循环搭建之前我先叠一个甲,在本文中暂未对知识点的教授这部分进行深入的讨论,具体原因如下:

  • 在传统的教育学中一个优秀的知识点授课大概可以拆分成:新奇引入→内容探索→总结归纳(此处总结归纳大多为给出定义或公式),其中新知讲解的定义与学生体感之间的对应为,新奇的引入负责引导学生进入学习状态,内容探索对应理解基础、总结归纳对应范围涵盖。
  • 由于新知之中的这个新字,我们其实是很容易发现整个新知的过程其实是一个由教师方对学生方进行有节奏且范围较大的强输出过程,不论是一个新的内容的提出在包括整个交互过程中的方向感与对话的节奏把我都是由教师给予的。
  • 在整个新概念的输入过程中交互内容包含了太多新构建与高强度的灵活性对话,而在目前市面上主流的这类基于Transformer架构的LLMs其实并不太擅长这种主动推演的且对话范围大精度要求高的任务,更多时候大模型在一个新知识的引入过程中承担的类似于课间设置或者笔记的梳理等等的辅任务效果会更为出色。

关于这部分任务我觉得暂时不太好介入的原因主要有三点:

  1. 过于依赖学生自驱力:作为一个模型如果学生没有很强大的自驱力和理解力的话,很难保证学生自己可以就课上内容进行一问一答式的在框架下完成一个其自身之前没接触过的新知识纳入环节。
  2. 信息传达精度与广度:整体来说一整个知识点的引出、举例、内容提炼整个过程会使整个对话变得格外的大,即便是现在各大厂家的上下文已经可以拓展到很宽的地步了,但是不可否认的模型在很多时候会幻觉出现的频率是会随着对话token量的增加而增加的。
  3. 业务本身的价值:其实不论是K12还是市面上的一些职考等等,其考试部门的本身通常都会拥有属于自己的授课过程,不论是学校的义务教育还是各类的教辅材料与视频课,都是学生们无法避开的部分。而且市面上的教育类产品单纯的信息网课类与搜题的工具类之间巨大的用户差也可以展示出两者的商业价值区别,所以我们没有必要在一个相对成熟痛点不强的部分做太多的投入。

当然我也坚信,随着多模态感知、知识检索和自适应学习技术的不断进步,AI也会以一种重构的方式介入并迭代新知的教育过程。

2.3 AI小循环

这里我这种讲法不免会让很多人产生一些疑问了:为什么很多厂商强调“遇到问题就去问 AI”,而我却认为它不适合作为授课核心?

原因很简单:授课答疑,本质上是两种完全不同的交互模式。

在授课场景,学习路径是:

接受新信息 → 理解 → 建立记忆 → 笔记记录

这是一个强教师主导、节奏明确的过程,信息量大且缺乏固定边界。AI 在这个环节要做到有效引导,几乎意味着要先预测用户认知,再动态调整内容,难度极高。

更重要的是,授课内容没有唯一答案,教学节奏需要灵活切换,而大模型的交互逻辑偏被动:它依赖用户提问驱动,缺乏主动维持节奏的能力,更难从零构建知识框架。

相比之下,答疑则不同

在答疑场景,学习的路径是:

遇到问题 → 提出问题 → 获取解答 → 应用知识

在这个过程之中用户对于自己所需要获取的内容是存在一定的认知的,在遇到问题后,用户的需求非常明确,在场景上可以最大化的减少因用户自身的对话信息输入不明确导致的信息偏差。

并且一旦我们将视角锁定在某一道题的某一个环节后,整个对话的范围就会变得极为可控,不论是文科类题目的得分点还是理科类题目的步骤与公式运用其自身都是有着极强的标准化属性,对话内容就会很容易通过提示词工程或产品化来进行把控。

所以我理解其实并不是AI不能讲课,而是AI应该去讲它应该讲的课,因此在我的理解力AI在教育场景下的若是想要发挥最大化的价值其应该锁定在摒弃了新课讲解后更加偏向辅导班类型的,定调、练习、答疑、反馈的以题目为主的循环路径上。

如下图:

*非常培训机构或学校在考试前都会采用这种练讲循环的授课方式

现在一个知识点的小循环内容我们已经比较明确了,接下来在进行深入讲解之时为了便于大家理解我会根据功能所解决的需求将整个内容拆分成为两个模块进行,其中练习与讲解作为主流程模块,范围和反馈作为辅流程模块。

三、小循环详解

3.1 主流程:练习与讲解

(练习出题这点市面上已经较为成熟暂不过多赘述)

“尽管市面上有大量 AI 解题工具,但在我的教学实践中,却很少看到它们对辅导机构业绩造成冲击。许多家长和老师甚至反对学生用 AI 做题——那么是什么造成了这一现象呢?

3.1.1 讲解与解释的区别:

不可否认的是现阶段很多的厂家在其自身的知识库或者通过联网的方式上进行了很多的尝试,在将一道常规题目进行解答输出上已经做的相对成熟了,那么我们接下来就要思考既然答案和逻辑都是正确的那为什么用户还是更加偏向于教师这种讲解方式呢?

这里就要以一个简单的例子来进行参考了;

而一节正常的授课上我们讲解题目的时候我们的对话会是这样:

教师:好的,我们来看这道题,首先我们从题干中直接映入的表格还有X、Y、W这些内容我们是不是可以先定位出来这道题是一道什么样的题目?

学生:二次函数的利润

教师:非常棒,那么既然已经确认了题目的内容归属了,我们是不是第二步就读读题划一下题目中给了哪些条件啊

学生:给各个数都提前设好了未知数,然后还给了一个表格表格里面有对应的售价时候的销量和利润,还给了利润的计算方式

教师:很好,信息找的很全,那我们接下来就来看看问题吧,看看这些信息如何帮助我们解题吧。

第一小问:求关于Y和X的函数表达式是什么?这里提到了Y和X 对吧,题干中的哪些条件给我们描述Y或者描述了X?

学生:Y和X之间是一次函数关系,然后表里还给了两个数可以用来代入

教师:对了,非常棒,那么现在是什么函数知道了,还有两个数,两点确认一个函数关系式,我们是不是用待定系数法就可以算出来了?待定系数法还记得么?

学生:就是先写个标准的代数式然后把数带进去求K和B就可以了。

教师:对的,基本功不错,那你来算一下吧,看看得出来的式子是多少

学生:y=-10X+700

……

(迫于篇幅和时间原因仅以第一小问作为示范)

关于这两者之间的差别我们其实是可以很直观的发掘的,其中最为突出的两个差别点: 一是直接罗列出结果还是一步步的输出带领而,二是单纯的答案+注解(很多厂商甚至会答案无注解)还是方法答案互相交融。

这两点差异,看似简单,却能带来实实在在的提升:

1)“一步步输出带领” vs. “直接罗列结果”

  • 教育学元分析表明,采用脚手架式(分步引导+即时反馈)的教学策略,能带来g≈0.53的中等偏上学习增益。
  • 这正印证了,有节奏地分段提示、引导学生一步步思考,远比一次性给出整块解法更能帮助他们内化知识。

2)“方法答案互融” vs. “单纯答案+注解/无注解”

  • 在另一项关于元认知提示(在关键节点给出思考性问题)的研究里,提示组比对照组的学习成绩提高了g≈0.40
  • 说明将解题方法与答案交织呈现,既给出正确结果,又让学生理解“为什么这么做”,能显著提升他们的自我调节学习能力和解题效果。

因此,这两个看似“细枝末节”的设计点,其实是将“解答”转化成“教授”的关键杠杆,也是将题目搜索器升级为答题教练的关键升级点。

老规矩,我们还是叠甲先行,首先对于市面上绝大多数的搜题解答类型的产品我们肯定是不可以一竿子打死的,其快速给出结果的特性自有其自身存在的需求场景。盲目的将搜答案这一场景进行拆分拉上链路这件事本身的风险自是不需我过多讲解的,如果用户在一个只想获悉结果的场景内部,任何一点让过程麻烦的行为都会导致产品竞争力的下降,我理解这可能也是绝大多数的搜题产品将答案放在讲解的上层的原因。

可是我们又能够清楚的理解,一次性吞吐的全量讲解,实践证明,它对分数提升的帮助很有限。所以我们初期最好在根本上将两者的场景进行区分,毕竟买面包和学烘焙这两者的其实从根源上就是两种需求。而至于说如何划分场景这部分是辅需求模块“新知与反馈”部分的主要功能,所以甲先叠完我们还是一步步来先将主需求讲解部分进行一定的梳理,而后在辅需求部分对这里进行讲解(如有需要可直接跳跃至辅需求部分)。

好的现在我们可以将刚刚提出的两点进行深入的拆分思考看看,既然我们希望达到的效果是方法与结果互融与逐步带领的话,与常规的情况相比我们要改变的点一共有这样三点:

  1. 根据逐步的特性,首先我们要做的就是将内容从整段过渡到细分结构。
  2. 根据带领的特性,切分后对应的节点处应当进行围绕所需知识的讲解。
  3. 隐藏在前两个特性之下的是,我们需要一个迅速获取用户反馈的输入机制,这样才能确认节点是否应该继续、当前知识点是可以略过还是需要精讲。

根据我们所遇到的三个问题我们可以抽象出我们所需要的是一个可以根据知识点进行分段式引导交互的讲题产品。

3.1.2 切分理念:

其中贯穿整个解决方案的最核心点已经浮出水面了,那就是如何做切分?

关于如何和去切分这件事其实是一个非常贴业务的内容,细心的读者应该已经发现了,切分的方式其实就是一道题的解答思路体现。

我知道很多机构或者教师都有着自己独特的解题方法这里我仅以我的教学内容作为参考,这里仅以我的常规讲题逻辑做一个示范:通常教导我的学生要将一道题通过阅读→提炼→定位→推演→计算这几个方式进行。(各类题目各地风格可能不同,作为较为重要的商业化卖点其中内容各位可深度思考下)

所以如果是以我的讲题方法融入到我所在的K12数学教学的内容之中,我会将一道题目以这五部分进行切分,至于切分的方式为了保证整个产品足以进入生产环境,这里其实我的是不太建议纯纯使用模型来进行把控的,毕竟大模型的不稳定性还是存在的,教育尤其是理科或者数学的教学场景下最好还是以最小化失误为准。

所以怎么切其实取决于解题方法,而如何实现切我觉得在这种类型的功能上用流程化的传统软件交互设计更好。

3.1.3 AI教师的角色切入:

现在第一个问题已经解决了,我们就要面对第二个问题:切分之后怎么讲题

这里就要回顾我们在最初时候的那个对比的例子里了,有问题问AI的场景是什么?

没错!当学生在某个拆分节点卡住时,就是我们让 AI 介入的最佳时机。

在没有AI的时候我们如果想要尝试将题目以切分的状态去交给用户的话,那我们就需要一份可以通过一段描述就能够让所有人都能明白的文稿。而现在只需要尝试着将当前问题时刻点时用户所处的背景,他所面临的卡点是哪里,他是怎么错的等等信息包在prompt里,就可以通过大语言模型生成出对应的内容讲解,最关键的是,如果学生没有听懂的话,他们可以围绕当前所遇到的卡点进行讨论式的教学。

具体的对话其实稍微有点反现阶段热门逻辑的是我们其实并不需要常规AI常常出现的过分对信息的堆叠逻辑性,如果我们在用户遇到一个大结构中的细化问题时给其另一个关于信息的结构式回复,具体效果往往七绕八绕就把学生绕晕,所以如果我们不是拓展的信息讲述授课,讲题就要专题。所以对于当前的业务我们对输出的要求更多是在匹配度以及带有正向鼓励的强情绪价值和引导拓展的基座回答基调。

是的,如果我们的目标是帮助用户学会知识点,要将制作一款类似教练式的教育产品,我们所需追求的就不再是“秒对率”“覆盖量”。我理解在市面上绝大多数的题目我们都可以进行收录的情况下,解题解对根本不重要,重要只有一点:能否教会!

3.1.4 交互理念:

那么现在我们来到了我们的最后一个问题了,怎么进行交互?

在我授课的K12教学场景中,一些数学题目的计算和推演常常涉及一些数学符号,而在一些文科题目中所涉及验证的回答内容又常常涉及到非常多的输入,如果我们希望用户通过文字或者语音等方式进行录入,在不排除对话会因为输入错误被带偏的情况下,单纯的文字或语音复述录入的麻烦程度都足以让学生们头疼不已了。

我理解技术的突破总是让人兴奋的,我也很希望现在的OCR等等技术可以完美的支撑我们面临的场景,但很遗憾,起码在我的视野内并没有看到这样一劳永逸的解决方案。那么就让我们回归一个产品人的视角,以我们所要面对的业务场景来尝试着以现有的方式搭建对应的交互吧。

举例:

在以我讲题的思路作为基调的场景中一道常规题目我分为五步:阅读→提炼→定位→推演→计算。

1/2、阅读+提炼这一部分的交互由于输入内容较多,且更多内容是在题目自身上。所以在题目讲解开始之后,我理解可以手动进行涂画的交互界面,让用户画完了之后进行匹配确认,如果出现失误我们将当前的语境包括用户的失误去采用之前预制好的提示词进行发问,调用出AI进行专门知识的讲解。

示例图:

3、定位知识点一部分,我理解最好是采用选择题的方式进行,毕竟让谁在诸如手机或者电脑上打出一个数学公式都是一种折磨,同理在出错后进行针对点的AI讲解。

示例图:

4、推演内容使用知识点这部分,最大的难点是步骤通常内容较多,且承担着标准化学生答题能力的关键步。我理解这里最好采用带缺失的步骤框架让学生进行补充,这样我们就可以在日常训练中潜移默化学生答题的标准性,更重要的是学生的解题步骤内部存在各种各样细小的错误点,而这种细小的错误点如果我们可以精准捕捉的话,后续就可以精准的定位当前所需讲解的部分。

示例图:

5、计算的话,结果进行输入这点就不是太大问题了。(如果遇到长答案或内容不好输入的话,同理定位)

相信诸位也能看出,其实我并不是一个纯纯的自动化追求狂魔,而且我对于现阶段很多AI产品中的那种如果不已对话框作为起始就不算AI产品的“强迫症”有点抵触,我坚信所有交互都是要以服务业务作为核心。

在整个第一部分的练与讲结束之后,对应的学生在这一次学习过程中所产生的数据我们也可以获取,接下来我们只需要针对其错误点部分再次生成题目完成练习即可。这里我们要注意的是我们这部分的目标是为了让学生掌握该知识点所产生的各种题型而非单纯的练习,所以不要选择市面上常见的一组之后再来一组,我要做的只是定点突破。这样既能巩固刚纠正的错误,又能避免学生因为题海而疲劳,进一步提升练习效率与迁移能力

(起码以我所在的教培机构来看,系统题库内标签足以在不需要大范围标注的情况下完成这部分推题内容的支撑)

*在我授课的过程中我发现其实一道错题再讲解后直接再练一道相似题目其实比全都讲完后再练的效果更好,但鉴于对比分析的样本量,这里还需要进行一些调研确认

如此,一个针对当前学习目标进行讲练循环的 AI 教练闭环便已成型,保证了‘教会’而不仅是‘解题’的核心价值。

3.2 新知与反馈

基于前文中我们所埋下的问题,如何让用户从当前的一步答案搜题行为过渡到基于模块练习的训练行为呢?答案其实就藏在我们的开篇,在教育而非搜题的场景中,我们所面对的用户需求不是找到答案,而是帮助用户完成达线。

在前面的主需求中我们主要是以讲练的方式对基础动作进行了一定的拆解,而讲题教练并非是一个可以帮助学生达成目标的教练,在这两者之间的所缺失的内容其实就是我们辅需求所需要进行补足的。

辅需求三大必须:

3.2.1 新知引入—状态引导、范围框定:

诸如传统课堂“新知引入“过程中的功能性,状态的转变对于学习其实是必不可少的。如果我们希望学生在这个过程中走完这个流程,就必须在一开始的时候给其行为一个合理的解释,让其明白自己是在学习成长。所以在题目出来之前我们必须经过新知的容让用户清晰自己在学习,而且只要学习了就会有对应的收获。

关键内容:价值感、内容范围

3.2.2 效果反馈—成就感获取、宏观优化:

新知的作用我们在此刻已经清晰了,那第二部分的自然就是反馈了。不要小瞧反馈的作用,任何工作性行为背后的推动力就来自于反馈,让学生在每次学习的过程后都能有所成长,甚至哪怕只是感受到有所成长都会极大的增加用户黏性。

并且分阶段的,根据常错环节的反馈可以定期的在宏观视角指导学生和家长及时修正。作为产品的我们都知道只有定期的复盘业务,对业务的理解才会更深,而学习这件事也一样。

关键内容:所学内容、学习表现、成长鼓励、待补足、大范围所完成进度

3.2.3 路径地图—把握节奏、串联内容:

最后回看前面我们主需求所必须帮助学生完成的指标,我们可以看出我们在一节课的循环内部只能对于一个单一的知识点进行学习,而不是对主需求的指标的完成。所以我们新知与反馈其实在很多时候承载着一定的串联作用,只有以点连线汇成面才能完成达线。

还有一点较为特殊的,在职业教育中通常需要根据各个科目的考试时间进行内容的把握,哪怕是在K12的教育工作中,月考与期中期末考对应的考试内容差别也很大,一个仅针对某一单元的深度一个针对整个学习的广度,所以日常的学习内容其实是很吃对应节奏的,我们需要让地图中以各个不同的维度为学生建立练习计划。

示例:

3.3 综述小循环

如此,一环扣一环,让学生既明白“为何而学”,又能通过“知—练—评—调”保证他们在整个学习路径上必有所得。

落地制作结构可参考该简版结构图:

四、关于循环的补足思考

4.1 落地建议

什么样的业务适合切入这样的循环

在前文中我多次提到过,这种以达线作为最终目标的循环拆解其实是适配市面上绝大多数的付费教辅场景的,但是其实不同的方向其实在落地的过程中其实是有比较大的差异点的。

这里我建议将以下几点作为一个自己业务适配的参考维度:

4.1.1 成本向:

落地第一期,最影响成本的不是模型算力,而是路径是否可复用、题型是否易切分。我用四个维度来定性评估:

  1. R复用度:题型/得分点在地区与年份间的一致性(越高越省钱)。
  2. S拆分复杂度:平均关键节点数、分支与依赖层级(越高越费标注)。
  3. V语料多样度:题干用词跨度/新词率(越高越费维护与话术模板)。
  4. G地域异构度:大纲/题型的省市差异(越高越需要“省市化”策略)。

具体的思考维度可以参考:

  • 高考理科(函数/三角/解析几何):R高|S高|V低|G中→步骤长但可模板化,是首批切入的“性价比赛道”。
  • 中考:R中|S中|V中|G高→省市差异大,适合第二阶段按地区滚动推进。
  • 国考/省考(行测-言语/资料):R高S低V高|G低→步骤短靠策略与话术,标注轻但需要强提示库与检索。

初期的成本估算可以套用:

MVP 投入 ≈ 单位题成本× 需覆盖的模板样本数/ 预期覆盖率

R 影响样本数 N,S/V 影响单位题成本,G影响预期覆盖率

具体是采用深耕专项还是使用大面积宽广平推的方式可根据公司现阶段状态结合公式进行评估。

4.1.2 用户维度:

用户的接受度在这里其实是一个比较容易被忽略的话题,我们不得不去直面的是我们不同的业务之间其实学生的差异是很大的。举个最简单的例子,国考和K12教育之间的学生差异非常大。

在业务初期我们不得不考虑的就是不同学生对与我们的业务会产生什么样的影响,其中我们可以以三个主要维度作为评估点:

  • 学习动力(对于达线的需求度)
  • 学习时间(对于讲练的练习频次)
  • 目标节奏:(单峰/多峰)
  • 信息接受能力(对于模型初期文字输出的接受能力)

通过这四者我们可以评估出:

  • 国考生:学习动力低、学习时间高、目标节奏单峰、信息接受度高
  • 落地建议:因此我们初期落地时需要更多考虑对学生的目标激励和地图的清晰度上,对于模型甚至初期题目的拆解都可以相对做的简化,
  • K12学生:学习动力高、学习时间低、目标节奏多峰、信息接受度较低
  • 落地建议:因此我们在落地的初期需要考虑到整体学生的课后时间以及练习的精准度,而且在学习路径上也要考虑到月考以及期中等维度,在对话内容和题目拆分的维度上也要尽可能的去贴合学生的理解能力。

具体的目标与推广方式可以根据自己的业务进行评估,不同学生之间的评估都可以套用此框架,例子相对还是比较粗糙,像是不同K12科目,以及职业教育和雅思考生之间都存在着各种的不同由此产品的侧重也会有所不同。

4.2 意义:特别的数据沉淀

最后我想补充的一点时,我们除了可以计算出的相对市场大小和经济收益之外,我们还可以通过整个过程沉淀一些现阶段没被精准量化的一些教育相关的数据,而这些数据可以帮助我们去做到更多更多的事。

大循环数据:

在大循环的过程中,我们可以得到大量不同分段地区的学生在进行什么样的频率的练习后得到什么样的结果,其中可以二级拆分的练习方式、学习路径,学习时长等等对于学生的成绩变动一旦被归因抽象成功,我们就可以获取到各种维度下不同学生(地区/年级/分数段等等)的各类型数据、

  • 学习曲线:P(correct|attemptn)、节点停留时长、提示调用次数、首次正确率、改正率
  • 路径效率:步数/时间到掌握、回退率(从节点k退回k-1的比例)。
  • 错因画像:错因分布(概念/公式/推演/计算)、错因复现率(7/14/28天)。
  • 记忆曲线:复习间隔→成绩保持率(个性化遗忘曲线参数)。
  • 参与度:活跃天数、任务完成率、连续打卡

这些数据可以在我们后续不论线上的产品更新方案,还是线下教研方向乃至运营或者业务侧的活动与商业性行为上提供方向与支持。

小循环数据:

之所以在初期我选择将方向更多的引入到教育这个环节,是因为我理解教育是比较标准的将已知信息转化输入后产生业务价值的商业行为。

如果我们非要在这个过程中给教师一个定位的话,我理解更多的像是一个信息的转化器,这和我对于现阶段大语言模型工作的业务价值非常契合。而转化器的价值如果想要量化的话,便是对于信息的转化效率以及转化过后的成功率。

诸如:

  • 讲解接受率(EAR):学生在收到分段讲解后,下一道同构题首次正确的比例。
  • 节点修复率(NFR):在卡点k触发提示后,同一节点再次出错的复现率下降幅度
  • 时间到掌握(TTM):从第一次卡点到连续n次正确所需的步数/时间。
  • 迁移正确率(TA):从原题→变式题的首次正确率。
  • 提示依赖度(PD):完成一题平均调用提示次数;目标是随时间下降。

我们在大量的节点式讲解对话过程中一旦我们将其中的内容沉淀下来,通过微调或提示词工程等方法将效果好的内容进行复现,使我们的产品在针对不同的学生时可以采取不同的语气和信息输出的话,在这个大家都在冲击最会做题AI的时刻,我们讲话最被学生接受的AI所能产生的价值一定是不弱于前者的。

结束语

在我认知里教育这个业务是很特别的,其常常以止疼药的身份出现,又常常作为维他命陪伴了用户走向很长的周期,所以虽然我全文在讲如何达线,而真正我希望看到的却是AI产品在脱离了买课营销号之后依旧可以成为学习的基础设施那一天,我相信这样的未来

本文由@Maru同学 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!