COMPSCI 713 · Part 2 Mock Questions

我的作答 vs 老师范例

给妈妈看的学习情况说明:不是只看“对不对”,而是逐项说明已经掌握了什么、差在哪里、下一步怎么补。

约 9 / 15按老师 rubric 粗估,非正式成绩
6道大题
13个独立得分点
5个优先补强点
说明:估分仅用于复习定位。老师实际评分可能因表达完整度而上下浮动约 1 分。

先看结论

已经掌握能认出 DFS、Greedy、UCS;理解 concept drift、replay 和灾难性遗忘。
主要失分方式很多术语判断是对的,但理由只写了联想,没有写评分点要求的机制。
需要尽快补GMM 的作用、Q4 选择题、permutation invariance、SSL downstream evaluation。

Q1 · 根据行为辨认搜索算法3 个匹配,每个 1 分

约 2 / 3
(a) 一条路走到底
我的答案
DFS:不是尽量打开更多门,而是尽可能向深处走。
老师答案要点
DFS:沿同一分支走到叶节点才回溯;内存低,但可能在无用分支耗时。
结论和核心理由都对。补上“遇到死路才回溯”会更完整。
(b) 靠“方向感”接近目标
我的答案
Greedy,因为 sense = greedy。
老师答案要点
Greedy Best-First:只根据启发式 h(n) 判断离目标多近,不考虑已走路径成本。
算法选对了,但理由太短。必须把“方向感”明确对应到 heuristic,并说明它忽略 path cost。
(c) 总是选择累计伤害最低的路线
我的答案
UCS,像为道路支付费用。
老师答案要点
UCS:每次扩展累计成本 g(n) 最低的路径,因此找到总伤害最低的解。
算法选对了;还缺“累计成本最低优先”和“因此保证最低成本解”两个关键词。

Q2 · Concept drift 与 replay3 个小问,共 4 分

约 3 / 4
(1) 系统解决什么挑战
我的答案
Concept shift,例如同一个字母的写法可能变化。
老师答案要点
Concept drift:数据分布随时间变化;系统在学习新概念时还要减少 catastrophic forgetting。
例子合理,基本答到点。术语应写 concept drift,并最好补一句“避免遗忘旧知识”。
(2) 伪数据属于哪一类方法
我的答案
Replay:给模型伪数据/旧模型的输出,让新模型在适应漂移时减少 catastrophic forgetting。
老师答案要点
Replay-based methods:训练新任务时重新使用储存或生成的旧样本,维持旧任务表现。
类别和核心目的都正确,是这一题最完整的回答。
(3) GMM 的作用
我的答案
“GMM 在哪里?它甚至没有计算。”——未作答。
老师答案要点
GMM 建模旧概念在 embedding space 中的分布,再从该分布采样代表性 pseudo-data,避免保存真实旧数据。
这是明确缺口。记忆句:GMM 记住旧概念的分布,用来生成旧概念的假样本。

Q3 · BFS 与 UCS探索方式 + 不同边成本下的最优性

约 2–2.5 / 3
(1) 如何探索搜索树
我的答案
UCS 会评估每条路径的成本,先走成本较低的未探索路径;BFS 会尽量“打开更多门”,不考虑成本。
老师答案要点
BFS 按深度逐层展开;UCS 不看深度,每次展开从根节点起累计路径成本最低的节点。
方向对,但 UCS 不是“预见未来成本”;它只比较已经累计的 g(n)。BFS 要明确写 level by level。
(2) 边成本不同时是否最优
我的答案
BFS 不最优,因为不考虑成本;UCS 最优,因为会 look ahead。
老师答案要点
BFS 在边成本不同时不保证最优;UCS 在所有边成本为正时保证最优,因为始终优先扩展累计成本最低的路径。
两个结论都对。UCS 的理由要改:它不 look ahead;关键条件是 positive edge costs + lowest accumulated cost first。

Q4 · Pac-Man 强化学习四要素选择题,1 分

0 / 1
选择 State / Action / Policy / Reward 的完整定义
我的答案
当前 Word 中没有选择任何选项。
老师答案要点
C:state 包含 Pac-Man、豆子和幽灵;policy 从完整 observed state 映射到动作概率;reward 同时包含吃豆、被抓和每步成本。
这是漏答,不是概念判断错误。考试最后应专门留 2 分钟检查所有选择题是否填了。

Q5 · GNN 的 permutation 性质两个概念,各 1 分

约 1 / 2
Permutation invariance
我的答案
节点顺序改变,但同一节点的最终结果 / logits 保持不变。
老师答案要点
节点顺序改变时,graph-level output 完全不变,例如整张图的分类结果不变。
这里把 node-level output 混进来了。Invariance 讲的是整张图的单个输出不随节点排列变化。
Permutation equivariance
我的答案
若 A B C 改为 C B A,对应输出 0.2 0.4 0.8 也改为 0.8 0.4 0.2。
老师答案要点
输入节点怎么重排,node-level outputs 就按同样方式重排,从而保留节点与输出的对应关系。
例子正确。术语是 equivariance,不是 equivalence。

Q6 · Self-Supervised Learning两个小问,各 1 分

约 0.5 / 2
(1) Pretext task vs downstream task
我的答案
Pretext task 是人为设置、和真实任务间接相关、要求模型理解输入的任务;downstream task 的回答没有写完。
老师答案要点
Pretext 是用无标签数据学习有用 representation 的辅助任务;downstream 是真正关心的应用任务,例如分类。
Pretext 的方向基本对;漏写 downstream 的完整定义。另:pretext 不等于 data augmentation。
(2) 评估时哪一个任务更重要
我的答案
因为是无标签学习,所以数据聚合(aggregation)正确很重要。
老师答案要点
Downstream task 更重要,因为它衡量学到的 representation 能否泛化到真实应用,这才是 SSL 的最终目标。
回答偏题。要直接点名 downstream performance,并用“真实应用 + 表征泛化能力”解释。

最划算的补分顺序

  1. 先补 Q4 漏答:记住完整 state、完整 reward,答案 C。
  2. 背熟 Q6:pretext 学表征,downstream 用表征;评估看 downstream。
  3. 记住 GMM:拟合旧概念分布 → 采样伪数据 → 减少遗忘。
  4. 区分 GNN:graph output 不变 = invariance;node outputs 同步重排 = equivariance。
  5. 所有搜索题理由强制写关键词:heuristic、accumulated cost、level by level。