COMPSCI 713 模拟题作答对比

约 9 / 15按老师 rubric 粗估，非正式成绩

6道大题

13个独立得分点

5个优先补强点

说明：估分仅用于复习定位。老师实际评分可能因表达完整度而上下浮动约 1 分。

先看结论

已经掌握能认出 DFS、Greedy、UCS；理解 concept drift、replay 和灾难性遗忘。

主要失分方式很多术语判断是对的，但理由只写了联想，没有写评分点要求的机制。

需要尽快补GMM 的作用、Q4 选择题、permutation invariance、SSL downstream evaluation。

Q1 · 根据行为辨认搜索算法3 个匹配，每个 1 分

约 2 / 3

(a) 一条路走到底

我的答案

DFS：不是尽量打开更多门，而是尽可能向深处走。

老师答案要点

DFS：沿同一分支走到叶节点才回溯；内存低，但可能在无用分支耗时。

结论和核心理由都对。补上“遇到死路才回溯”会更完整。

(b) 靠“方向感”接近目标

我的答案

Greedy，因为 sense = greedy。

老师答案要点

Greedy Best-First：只根据启发式 h(n) 判断离目标多近，不考虑已走路径成本。

算法选对了，但理由太短。必须把“方向感”明确对应到 heuristic，并说明它忽略 path cost。

我的答案

UCS，像为道路支付费用。

老师答案要点

UCS：每次扩展累计成本 g(n) 最低的路径，因此找到总伤害最低的解。

算法选对了；还缺“累计成本最低优先”和“因此保证最低成本解”两个关键词。

Q2 · Concept drift 与 replay3 个小问，共 4 分

约 3 / 4

(1) 系统解决什么挑战

我的答案

Concept shift，例如同一个字母的写法可能变化。

老师答案要点

Concept drift：数据分布随时间变化；系统在学习新概念时还要减少 catastrophic forgetting。

例子合理，基本答到点。术语应写 concept drift，并最好补一句“避免遗忘旧知识”。

(2) 伪数据属于哪一类方法

我的答案

Replay：给模型伪数据／旧模型的输出，让新模型在适应漂移时减少 catastrophic forgetting。

老师答案要点

Replay-based methods：训练新任务时重新使用储存或生成的旧样本，维持旧任务表现。

类别和核心目的都正确，是这一题最完整的回答。

(3) GMM 的作用

我的答案

“GMM 在哪里？它甚至没有计算。”——未作答。

老师答案要点

GMM 建模旧概念在 embedding space 中的分布，再从该分布采样代表性 pseudo-data，避免保存真实旧数据。

这是明确缺口。记忆句：GMM 记住旧概念的分布，用来生成旧概念的假样本。

Q3 · BFS 与 UCS探索方式 + 不同边成本下的最优性

约 2–2.5 / 3

(1) 如何探索搜索树

我的答案

UCS 会评估每条路径的成本，先走成本较低的未探索路径；BFS 会尽量“打开更多门”，不考虑成本。

老师答案要点

BFS 按深度逐层展开；UCS 不看深度，每次展开从根节点起累计路径成本最低的节点。

方向对，但 UCS 不是“预见未来成本”；它只比较已经累计的 g(n)。BFS 要明确写 level by level。

(2) 边成本不同时是否最优

我的答案

BFS 不最优，因为不考虑成本；UCS 最优，因为会 look ahead。

老师答案要点

BFS 在边成本不同时不保证最优；UCS 在所有边成本为正时保证最优，因为始终优先扩展累计成本最低的路径。

两个结论都对。UCS 的理由要改：它不 look ahead；关键条件是 positive edge costs + lowest accumulated cost first。

Q4 · Pac-Man 强化学习四要素选择题，1 分

0 / 1

选择 State / Action / Policy / Reward 的完整定义

我的答案

当前 Word 中没有选择任何选项。

老师答案要点

C：state 包含 Pac-Man、豆子和幽灵；policy 从完整 observed state 映射到动作概率；reward 同时包含吃豆、被抓和每步成本。

这是漏答，不是概念判断错误。考试最后应专门留 2 分钟检查所有选择题是否填了。

Q5 · GNN 的 permutation 性质两个概念，各 1 分

约 1 / 2

Permutation invariance

我的答案

节点顺序改变，但同一节点的最终结果 / logits 保持不变。

老师答案要点

节点顺序改变时，graph-level output 完全不变，例如整张图的分类结果不变。

这里把 node-level output 混进来了。Invariance 讲的是整张图的单个输出不随节点排列变化。

Permutation equivariance

我的答案

若 A B C 改为 C B A，对应输出 0.2 0.4 0.8 也改为 0.8 0.4 0.2。

老师答案要点

输入节点怎么重排，node-level outputs 就按同样方式重排，从而保留节点与输出的对应关系。

例子正确。术语是 equivariance，不是 equivalence。

Q6 · Self-Supervised Learning两个小问，各 1 分

约 0.5 / 2

(1) Pretext task vs downstream task

我的答案

Pretext task 是人为设置、和真实任务间接相关、要求模型理解输入的任务；downstream task 的回答没有写完。

老师答案要点

Pretext 是用无标签数据学习有用 representation 的辅助任务；downstream 是真正关心的应用任务，例如分类。

Pretext 的方向基本对；漏写 downstream 的完整定义。另：pretext 不等于 data augmentation。

(2) 评估时哪一个任务更重要

我的答案

因为是无标签学习，所以数据聚合（aggregation）正确很重要。

老师答案要点

Downstream task 更重要，因为它衡量学到的 representation 能否泛化到真实应用，这才是 SSL 的最终目标。

回答偏题。要直接点名 downstream performance，并用“真实应用 + 表征泛化能力”解释。

最划算的补分顺序

先补 Q4 漏答：记住完整 state、完整 reward，答案 C。
背熟 Q6：pretext 学表征，downstream 用表征；评估看 downstream。
记住 GMM：拟合旧概念分布 → 采样伪数据 → 减少遗忘。
区分 GNN：graph output 不变 = invariance；node outputs 同步重排 = equivariance。
所有搜索题理由强制写关键词：heuristic、accumulated cost、level by level。