本文核心观点

NOAI 第一轮水平测试是选拔国家队的第一道门槛。基于 2025 年官方真题，本文详细拆解 NOAI 初赛 4 类题型的考察重点和备考路径。

NOAI人工智能奥赛初赛

考什么？如何备考？

到底考什么？难不难？孩子如何更好应对？

NOAI（全国人工智能奥林匹克）第一轮水平测试，是选拔中国国家队的第一道门槛。今天，我们基于2025年官方真题，为您详细拆解这场考试。

一、考什么题型？四类题目详解

第一类：选择题（30分）

选择题考查的是概念理解和简单计算，涵盖AI应用场景、机器学习基础、模型评估等内容。

【真题案例1】AI伦理与可解释性（2025年第6题）

某金融机构采用深度神经网络对用户贷款申请进行风险评估，上线后拒绝率显著升高。许多被拒客户质疑决策依据不透明，监管部门也要求该机构公开核心决策元素。若该机构希望兼顾模型的高准确率与可解释性，下列哪项措施最符合这一要求？

A. 向公众全面公开模型权重和所有客户数据

B. 采用可解释性技术（如特征重要度分析）来揭示模型判断逻辑 ✓

C. 随机生成若干拒贷理由，用固定模板向所有被拒用户解释

D. 大幅简化模型结构，仅保留极少数特征

这道题考的不是技术细节，而是AI在实际应用中的社会责任——模型不仅要准确，还要能解释。

【真题案例2】Softmax概率计算（2025年第11题）

图像分类任务，模型需要判断输入图像是猫、狗还是鸟。模型最后一层全连接层的输出张量为：[2.0, 1.0, 1.0]。请问，经过Softmax函数处理后，模型对每一类的预测概率分别是多少？

A. 猫: 0.576, 狗: 0.212, 鸟: 0.212 ✓

B. 猫: 0.509, 狗: 0.234, 鸟: 0.257

C. 猫: 0.516, 狗: 0.232, 鸟: 0.232

D. 猫: 0.500, 狗: 0.250, 鸟: 0.250

这道题需要手算：Softmax公式是 e^x / Σe^x，猫的概率 = e² / (e² + e¹ + e¹) ≈ 7.39 / 12.17 ≈ 0.576

选择题考查概念理解和简单计算——有些题可以秒答，有些题需要动笔算。记住常用数值（如e≈2.718）能节省时间。

第二类：概念解释题（20分）

概念题要求用自己的话解释AI术语，并举出实际例子。

【真题案例3】欠拟合（2025年第16题）

Jerry在进行机器学习模型训练时，使用了一个较简单的线性回归模型来预测房价，数据集包含多个特征（如房屋面积、卧室数量、房龄等），但模型在训练集和验证集上的误差都较大。请解释这种现象以及可能造成这种现象的原因。

官方评分标准：

• 回答"欠拟合"概念：2分

• 回答主要原因是"模型复杂度过低"：2分

• 回答其他原因（如特征不足、训练不足等）：1分

概念题要答全——定义 + 原因 + 举例，缺一项就扣分。

【真题案例4】算法偏见（2025年第17题）

请简要解释"算法偏见（Algorithm Bias）"的含义，并分析其可能导致的社会影响。结合实际案例，讨论如何通过技术和政策手段减少算法偏见。

答题要点：

• 含义：算法在训练数据或设计过程中引入的系统性偏差，导致对特定群体的不公平对待

• 社会影响：招聘歧视、贷款歧视、司法判决不公等

• 案例：亚马逊招聘AI歧视女性、美国COMPAS系统对黑人被告预测偏高

• 技术手段：数据去偏、公平性约束、模型可解释性

• 政策手段：算法审计制度、反歧视法规、透明度要求

AI伦理题考查的不是技术细节，而是对AI社会影响的思考能力——要能结合真实案例，从技术和制度两个层面分析问题。

第三类：代码补全题（20分）

给出一段Python代码框架，要求填写关键语句，需要保证语法正确、逻辑正确。

【真题案例5】线性回归房价预测（2025年第20题）

# 数据清洗，去除异常值
data = ___________①___________

# 划分训练集和测试集，80:20
X_train, y_train, X_test, y_test = ___________②___________

# 使用训练集训练模型
___________③___________

# 计算均方误差MSE
mse = ___________④___________

答案：

① data[(data['面积'] > 10) & (data['面积'] < 1000)]

② train_test_split(X, y, test_size=0.2)

③ model.fit(X_train, y_train)

④ mean_squared_error(y_test, y_pred)

【真题案例6】梯度下降实现（2025年第21题）

# 计算损失函数
def loss_function(x, y, w, b):
    for i in range(m):
        error = ___________①___________
        total_error += error
    return total_error / (2 * m)

# 梯度下降更新参数
def gradient_descent(x, y, w, b, alpha, num_iterations):
    for _ in range(num_iterations):
        dw, db = compute_gradient(x, y, w, b)
        w = ___________④___________
        b = ___________⑤___________
    return w, b

答案：

① (model(x[i], w, b) - y[i]) ** 2

④ w - alpha * dw（注意是减号，沿梯度反方向）

⑤ b - alpha * db

代码补全题要求语法正确、逻辑正确——需要熟悉sklearn和PyTorch的常用API，理解梯度下降等核心算法的数学原理，不只是会调库。

第四类：编程题（30分）

给出需求描述，要求手写完整的Python函数。这是分值最高的题型。

【真题案例7】图像模糊/均值滤波（2025年第22题）

实现函数blur，将每个像素点的颜色值替换为周围9个像素（包括自身）的平均值。图像边界处的像素点值保持不变。

这道题考查的是计算机视觉的基础操作。需要写出三层循环（行、列、颜色通道），并正确处理边界条件。

【真题案例8】CNN验证码识别（2025年第23题）

实现一个CNN网络，接收40×40的灰度图像，输出26个英文字母的预测概率。

要求：

• 第一个卷积块：输入1通道，输出32通道，3×3卷积，ReLU激活，2×2最大池化

• 第二个卷积块：输出64通道，5×5卷积，...

• 全连接层：至少一个中间层，最终输出26维

这道题需要：

1. 熟悉PyTorch的API（Conv2d、MaxPool2d、Linear）

2. 能手算特征图尺寸（40→池化→20→池化→10）

3. 正确计算全连接层的输入维度（64×10×10=6400）

编程题是分值最高的题型（30分），要求手写完整函数——需要熟练掌握循环、条件判断等基础语法，能手算CNN特征图尺寸，正确处理边界条件。

二、考哪些知识？

根据NOAI官方大纲（2026年V1.5版），初赛考查A区（Python编程）和B区（人工智能基础）两大板块。

A区：Python编程技能

基本语法算数运算、关系运算、输入输出语句

程序结构顺序、分支、循环

数据结构字符串、列表、字典、元组及其基本操作

函数与模块函数定义、内置函数、标准模块（os、math、random、sys等）

基础算法排序、查找

B区：人工智能基础知识

人工智能概论

知道连接主义、符号主义、行为主义、图灵测试

理解 AI伦理（数据隐私、算法偏见、责任归属），能通过案例分析讨论

机器学习

理解监督学习、无监督学习，能描述区别和联系

知道强化学习的概念和典型应用

理解回归、分类、聚类，知道常见算法

理解线性回归、逻辑回归的基本原理

知道线性与非线性、概率论基础、正态分布、残差、偏差、标准差

理解欠拟合、过拟合、正则化

能计算模型评估指标：混淆矩阵、精确率、准确率、召回率、F1、交叉验证

理解集成学习（梯度提升、Bagging、随机森林）的核心思想

神经网络

理解感知机、神经网络

理解反向传播算法，能描述正向传播和反向传播过程

理解梯度下降、局部最优、全局最优

理解卷积神经网络(CNN)，能简要描述网络结构

能计算卷积层、池化层、全连接层的原理和计算过程

理解决策函数、激活函数、损失函数的作用

知道动量优化方法（Adam、AdamW）与普通梯度下降的差异

知道大语言模型(LLM)的核心思想

数据处理

理解数据清洗的一般过程

理解训练集、验证集、测试集的各自作用

这些知识难吗？与大学课程对比

上述知识点覆盖了清华大学人工智能相关专业的多门核心课程内容：

监督/无监督学习、回归、分类
对应清华《机器学习》（大三）
大学要求：推导损失函数的梯度公式，证明收敛性
NOAI要求：理解概念，能区分应用场景

混淆矩阵、精确率、召回率
对应清华《机器学习》（大三）
大学要求：推导各指标的统计学含义和置信区间
NOAI要求：能根据混淆矩阵手算各项指标

梯度下降、反向传播
对应清华《深度学习》（大三）
大学要求：推导链式法则，手算多层网络的梯度
NOAI要求：理解原理，能写出参数更新公式

CNN、卷积层、池化层
对应清华《深度学习》《计算机视觉》
大学要求：实现完整的CNN架构，调参优化
NOAI要求：理解结构，能手算特征图尺寸

AI伦理
对应清华《人工智能伦理》（选修）
大学要求：撰写伦理分析报告，参与案例研讨
NOAI要求：能用案例分析讨论

简单来说：NOAI考的是大学课程的"概念层"，不考"推导层"。大学生需要证明"为什么这个公式成立"，高中生只需要理解"这个公式怎么用"。

但这不代表简单。对于没有系统学习过AI的高中生来说，这些内容需要专门准备——它不在高中课本里，也不会在普通编程课上教。

三、备考冲刺：如何拿高分？

以下建议适用于已经系统学习过AI课程的学生，在考前进行针对性强化。

1. 答题策略

基于2025年真题分析，选择题中有两类：

快题 Python语法、概念判断（每题1分钟）

慢题需要计算的题：Softmax概率、混淆矩阵指标（每题3-4分钟）

• 先快速过一遍，把能秒答的题先做完

• 需要计算的题标记出来，最后统一做

• 编程题如果一道卡住超过10分钟，先做另一道

2. 必须能手算的内容

Softmax概率

输出 [2.0, 1.0, 1.0] → 概率 = e^x / Σe^x

记住：e ≈ 2.718，e² ≈ 7.39

猫的概率 = 7.39 / (7.39 + 2.718 + 2.718) ≈ 0.576

混淆矩阵指标

　　　　　　预测正　　预测负
实际正　　　TP　　　　FN
实际负　　　FP　　　　TN

精确率 = TP/(TP+FP) ← 预测为正的里面，多少真的是正

召回率 = TP/(TP+FN) ← 实际为正的里面，多少被找出来

准确率 = (TP+TN)/总数

CNN特征图尺寸

卷积后 = (输入 - 卷积核 + 2×padding) / stride + 1

池化后 = 输入 / 池化核大小

例：40×40 → Conv(3×3, padding=1) → 40×40 → Pool(2×2) → 20×20

3. 概念题：按评分点答题

官方评分结构：定义（2分）+ 原因/特点（2分）+ 举例（1分）

❌ 错误示范

"欠拟合就是模型效果不好。"

✅ 正确示范

"欠拟合是指模型在训练集和验证集上误差都较大的现象。主要原因是模型复杂度过低，无法捕捉数据中的规律。例如用简单的线性回归预测非线性关系的房价数据。"

4. 代码题：常见陷阱

陷阱1：除法 vs 整除

✗ mid = (L + R) / 2 得到浮点数

✓ mid = (L + R) // 2 得到整数

陷阱2：梯度下降方向

✗ w = w + alpha * dw 梯度上升

✓ w = w - alpha * dw 梯度下降（减号）

陷阱3：pandas条件筛选

✗ data[data['面积'] > 10 & data['面积'] < 1000]

✓ data[(data['面积'] > 10) & (data['面积'] < 1000)] 每个条件加括号

5. 考前检查清单

Python语法

□ 列表切片：a[1:4] 结果是什么？

□ 列表方法：append vs extend vs insert

□ 字典取值：d['key'] vs d.get('key')

□ 整除运算：// vs /

□ 列表推导式、lambda表达式

人工智能概论

□ 三大学派：连接主义、符号主义、行为主义

□ 图灵测试：什么是图灵测试？

机器学习概念

□ 监督学习 vs 无监督学习 vs 强化学习

□ 回归 vs 分类 vs 聚类

□ 线性回归 vs 逻辑回归

□ 训练集 vs 验证集 vs 测试集

□ 过拟合 vs 欠拟合、正则化、交叉验证

□ 集成学习：随机森林、Bagging、梯度提升

统计学基础

□ 残差、偏差、标准差

□ 正态分布（高斯分布）

□ 距离的定义（欧氏距离等）

评估指标（能手算）

□ 混淆矩阵：TP、TN、FP、FN的定义

□ 精确率 = TP/(TP+FP)

□ 召回率 = TP/(TP+FN)

□ 准确率 = (TP+TN)/总数

□ F1分数 = 2×精确率×召回率/(精确率+召回率)

神经网络

□ 感知机的基本结构

□ 激活函数的作用（引入非线性）、ReLU、Softmax

□ 决策函数、损失函数的作用

□ 梯度下降、局部最优 vs 全局最优

□ 反向传播、Adam/AdamW优化器

□ CNN结构、特征图尺寸计算公式

□ 大语言模型（LLM）的核心思想

AI伦理

□ 算法偏见：定义、危害、应对措施

□ 可解释性：为什么重要、如何实现

□ 数据隐私、责任归属

代码API

□ sklearn：train_test_split、model.fit、model.predict、mean_squared_error

□ PyTorch：nn.Conv2d、nn.MaxPool2d、nn.Linear、nn.ReLU

回到开头的问题

NOAI初赛到底难不难？

从知识范围看，它覆盖了大学AI专业的核心概念；从考查深度看，它只要求"理解"和"会用"，不要求"推导"和"证明"。对于系统学习过AI课程的学生，这是一场可以准备、可以拿高分的考试。

但更重要的是：通过备考NOAI，学生获得的不只是一张证书，而是对人工智能的系统认知。

当同龄人还在讨论"AI会不会取代人类"时，参加过NOAI的学生已经知道：机器学习的本质是什么，神经网络如何"学习"，模型为什么会出错，以及AI的能力边界在哪里。

这种认知，将是AI时代真正的竞争力。

2026年NOAI第一轮考试时间

3月22日（周日）9:00-11:00

NOAI人工智能奥赛初赛：考什么？如何备考？

NOAI人工智能奥赛初赛

获取 NOAI 真题包