NOAI人工智能奥赛初赛
考什么?如何备考?
到底考什么?难不难?孩子如何更好应对?
NOAI(全国人工智能奥林匹克)第一轮水平测试,是选拔中国国家队的第一道门槛。今天,我们基于2025年官方真题,为您详细拆解这场考试。
一、考什么题型?四类题目详解
第一类:选择题(30分)
选择题考查的是概念理解和简单计算,涵盖AI应用场景、机器学习基础、模型评估等内容。
【真题案例1】AI伦理与可解释性(2025年第6题)
某金融机构采用深度神经网络对用户贷款申请进行风险评估,上线后拒绝率显著升高。许多被拒客户质疑决策依据不透明,监管部门也要求该机构公开核心决策元素。若该机构希望兼顾模型的高准确率与可解释性,下列哪项措施最符合这一要求?
A. 向公众全面公开模型权重和所有客户数据
B. 采用可解释性技术(如特征重要度分析)来揭示模型判断逻辑 ✓
C. 随机生成若干拒贷理由,用固定模板向所有被拒用户解释
D. 大幅简化模型结构,仅保留极少数特征
这道题考的不是技术细节,而是AI在实际应用中的社会责任——模型不仅要准确,还要能解释。
【真题案例2】Softmax概率计算(2025年第11题)
图像分类任务,模型需要判断输入图像是猫、狗还是鸟。模型最后一层全连接层的输出张量为:[2.0, 1.0, 1.0]。请问,经过Softmax函数处理后,模型对每一类的预测概率分别是多少?
A. 猫: 0.576, 狗: 0.212, 鸟: 0.212 ✓
B. 猫: 0.509, 狗: 0.234, 鸟: 0.257
C. 猫: 0.516, 狗: 0.232, 鸟: 0.232
D. 猫: 0.500, 狗: 0.250, 鸟: 0.250
这道题需要手算:Softmax公式是 e^x / Σe^x,猫的概率 = e² / (e² + e¹ + e¹) ≈ 7.39 / 12.17 ≈ 0.576
选择题考查概念理解和简单计算——有些题可以秒答,有些题需要动笔算。记住常用数值(如e≈2.718)能节省时间。
第二类:概念解释题(20分)
概念题要求用自己的话解释AI术语,并举出实际例子。
【真题案例3】欠拟合(2025年第16题)
Jerry在进行机器学习模型训练时,使用了一个较简单的线性回归模型来预测房价,数据集包含多个特征(如房屋面积、卧室数量、房龄等),但模型在训练集和验证集上的误差都较大。请解释这种现象以及可能造成这种现象的原因。
官方评分标准:
• 回答"欠拟合"概念:2分
• 回答主要原因是"模型复杂度过低":2分
• 回答其他原因(如特征不足、训练不足等):1分
概念题要答全——定义 + 原因 + 举例,缺一项就扣分。
【真题案例4】算法偏见(2025年第17题)
请简要解释"算法偏见(Algorithm Bias)"的含义,并分析其可能导致的社会影响。结合实际案例,讨论如何通过技术和政策手段减少算法偏见。
答题要点:
• 含义:算法在训练数据或设计过程中引入的系统性偏差,导致对特定群体的不公平对待
• 社会影响:招聘歧视、贷款歧视、司法判决不公等
• 案例:亚马逊招聘AI歧视女性、美国COMPAS系统对黑人被告预测偏高
• 技术手段:数据去偏、公平性约束、模型可解释性
• 政策手段:算法审计制度、反歧视法规、透明度要求
AI伦理题考查的不是技术细节,而是对AI社会影响的思考能力——要能结合真实案例,从技术和制度两个层面分析问题。
第三类:代码补全题(20分)
给出一段Python代码框架,要求填写关键语句,需要保证语法正确、逻辑正确。
【真题案例5】线性回归房价预测(2025年第20题)
# 数据清洗,去除异常值 data = ___________①___________ # 划分训练集和测试集,80:20 X_train, y_train, X_test, y_test = ___________②___________ # 使用训练集训练模型 ___________③___________ # 计算均方误差MSE mse = ___________④___________
答案:
① data[(data['面积'] > 10) & (data['面积'] < 1000)]
② train_test_split(X, y, test_size=0.2)
③ model.fit(X_train, y_train)
④ mean_squared_error(y_test, y_pred)
【真题案例6】梯度下降实现(2025年第21题)
# 计算损失函数 def loss_function(x, y, w, b): for i in range(m): error = ___________①___________ total_error += error return total_error / (2 * m) # 梯度下降更新参数 def gradient_descent(x, y, w, b, alpha, num_iterations): for _ in range(num_iterations): dw, db = compute_gradient(x, y, w, b) w = ___________④___________ b = ___________⑤___________ return w, b
答案:
① (model(x[i], w, b) - y[i]) ** 2
④ w - alpha * dw(注意是减号,沿梯度反方向)
⑤ b - alpha * db
代码补全题要求语法正确、逻辑正确——需要熟悉sklearn和PyTorch的常用API,理解梯度下降等核心算法的数学原理,不只是会调库。
第四类:编程题(30分)
给出需求描述,要求手写完整的Python函数。这是分值最高的题型。
【真题案例7】图像模糊/均值滤波(2025年第22题)
实现函数blur,将每个像素点的颜色值替换为周围9个像素(包括自身)的平均值。图像边界处的像素点值保持不变。
这道题考查的是计算机视觉的基础操作。需要写出三层循环(行、列、颜色通道),并正确处理边界条件。
【真题案例8】CNN验证码识别(2025年第23题)
实现一个CNN网络,接收40×40的灰度图像,输出26个英文字母的预测概率。
要求:
• 第一个卷积块:输入1通道,输出32通道,3×3卷积,ReLU激活,2×2最大池化
• 第二个卷积块:输出64通道,5×5卷积,...
• 全连接层:至少一个中间层,最终输出26维
这道题需要:
1. 熟悉PyTorch的API(Conv2d、MaxPool2d、Linear)
2. 能手算特征图尺寸(40→池化→20→池化→10)
3. 正确计算全连接层的输入维度(64×10×10=6400)
编程题是分值最高的题型(30分),要求手写完整函数——需要熟练掌握循环、条件判断等基础语法,能手算CNN特征图尺寸,正确处理边界条件。
二、考哪些知识?
根据NOAI官方大纲(2026年V1.5版),初赛考查A区(Python编程)和B区(人工智能基础)两大板块。
A区:Python编程技能
基本语法 算数运算、关系运算、输入输出语句
程序结构 顺序、分支、循环
数据结构 字符串、列表、字典、元组及其基本操作
函数与模块 函数定义、内置函数、标准模块(os、math、random、sys等)
基础算法 排序、查找
B区:人工智能基础知识
人工智能概论
知道 连接主义、符号主义、行为主义、图灵测试
理解 AI伦理(数据隐私、算法偏见、责任归属),能通过案例分析讨论
机器学习
理解 监督学习、无监督学习,能描述区别和联系
知道 强化学习的概念和典型应用
理解 回归、分类、聚类,知道常见算法
理解 线性回归、逻辑回归的基本原理
知道 线性与非线性、概率论基础、正态分布、残差、偏差、标准差
理解 欠拟合、过拟合、正则化
能计算 模型评估指标:混淆矩阵、精确率、准确率、召回率、F1、交叉验证
理解 集成学习(梯度提升、Bagging、随机森林)的核心思想
神经网络
理解 感知机、神经网络
理解 反向传播算法,能描述正向传播和反向传播过程
理解 梯度下降、局部最优、全局最优
理解 卷积神经网络(CNN),能简要描述网络结构
能计算 卷积层、池化层、全连接层的原理和计算过程
理解 决策函数、激活函数、损失函数的作用
知道 动量优化方法(Adam、AdamW)与普通梯度下降的差异
知道 大语言模型(LLM)的核心思想
数据处理
理解 数据清洗的一般过程
理解 训练集、验证集、测试集的各自作用
这些知识难吗?与大学课程对比
上述知识点覆盖了清华大学人工智能相关专业的多门核心课程内容:
监督/无监督学习、回归、分类
对应清华《机器学习》(大三)
大学要求:推导损失函数的梯度公式,证明收敛性
NOAI要求:理解概念,能区分应用场景
混淆矩阵、精确率、召回率
对应清华《机器学习》(大三)
大学要求:推导各指标的统计学含义和置信区间
NOAI要求:能根据混淆矩阵手算各项指标
梯度下降、反向传播
对应清华《深度学习》(大三)
大学要求:推导链式法则,手算多层网络的梯度
NOAI要求:理解原理,能写出参数更新公式
CNN、卷积层、池化层
对应清华《深度学习》《计算机视觉》
大学要求:实现完整的CNN架构,调参优化
NOAI要求:理解结构,能手算特征图尺寸
AI伦理
对应清华《人工智能伦理》(选修)
大学要求:撰写伦理分析报告,参与案例研讨
NOAI要求:能用案例分析讨论
简单来说:NOAI考的是大学课程的"概念层",不考"推导层"。大学生需要证明"为什么这个公式成立",高中生只需要理解"这个公式怎么用"。
但这不代表简单。对于没有系统学习过AI的高中生来说,这些内容需要专门准备——它不在高中课本里,也不会在普通编程课上教。
三、备考冲刺:如何拿高分?
以下建议适用于已经系统学习过AI课程的学生,在考前进行针对性强化。
1. 答题策略
基于2025年真题分析,选择题中有两类:
快题 Python语法、概念判断(每题1分钟)
慢题 需要计算的题:Softmax概率、混淆矩阵指标(每题3-4分钟)
• 先快速过一遍,把能秒答的题先做完
• 需要计算的题标记出来,最后统一做
• 编程题如果一道卡住超过10分钟,先做另一道
2. 必须能手算的内容
Softmax概率
输出 [2.0, 1.0, 1.0] → 概率 = e^x / Σe^x
记住:e ≈ 2.718,e² ≈ 7.39
猫的概率 = 7.39 / (7.39 + 2.718 + 2.718) ≈ 0.576
混淆矩阵指标
预测正 预测负
实际正 TP FN
实际负 FP TN
精确率 = TP/(TP+FP) ← 预测为正的里面,多少真的是正
召回率 = TP/(TP+FN) ← 实际为正的里面,多少被找出来
准确率 = (TP+TN)/总数
CNN特征图尺寸
卷积后 = (输入 - 卷积核 + 2×padding) / stride + 1
池化后 = 输入 / 池化核大小
例:40×40 → Conv(3×3, padding=1) → 40×40 → Pool(2×2) → 20×20
3. 概念题:按评分点答题
官方评分结构:定义(2分)+ 原因/特点(2分)+ 举例(1分)
❌ 错误示范
"欠拟合就是模型效果不好。"
✅ 正确示范
"欠拟合是指模型在训练集和验证集上误差都较大的现象。主要原因是模型复杂度过低,无法捕捉数据中的规律。例如用简单的线性回归预测非线性关系的房价数据。"
4. 代码题:常见陷阱
陷阱1:除法 vs 整除
✗ mid = (L + R) / 2 得到浮点数
✓ mid = (L + R) // 2 得到整数
陷阱2:梯度下降方向
✗ w = w + alpha * dw 梯度上升
✓ w = w - alpha * dw 梯度下降(减号)
陷阱3:pandas条件筛选
✗ data[data['面积'] > 10 & data['面积'] < 1000]
✓ data[(data['面积'] > 10) & (data['面积'] < 1000)] 每个条件加括号
5. 考前检查清单
Python语法
□ 列表切片:a[1:4] 结果是什么?
□ 列表方法:append vs extend vs insert
□ 字典取值:d['key'] vs d.get('key')
□ 整除运算:// vs /
□ 列表推导式、lambda表达式
人工智能概论
□ 三大学派:连接主义、符号主义、行为主义
□ 图灵测试:什么是图灵测试?
机器学习概念
□ 监督学习 vs 无监督学习 vs 强化学习
□ 回归 vs 分类 vs 聚类
□ 线性回归 vs 逻辑回归
□ 训练集 vs 验证集 vs 测试集
□ 过拟合 vs 欠拟合、正则化、交叉验证
□ 集成学习:随机森林、Bagging、梯度提升
统计学基础
□ 残差、偏差、标准差
□ 正态分布(高斯分布)
□ 距离的定义(欧氏距离等)
评估指标(能手算)
□ 混淆矩阵:TP、TN、FP、FN的定义
□ 精确率 = TP/(TP+FP)
□ 召回率 = TP/(TP+FN)
□ 准确率 = (TP+TN)/总数
□ F1分数 = 2×精确率×召回率/(精确率+召回率)
神经网络
□ 感知机的基本结构
□ 激活函数的作用(引入非线性)、ReLU、Softmax
□ 决策函数、损失函数的作用
□ 梯度下降、局部最优 vs 全局最优
□ 反向传播、Adam/AdamW优化器
□ CNN结构、特征图尺寸计算公式
□ 大语言模型(LLM)的核心思想
AI伦理
□ 算法偏见:定义、危害、应对措施
□ 可解释性:为什么重要、如何实现
□ 数据隐私、责任归属
代码API
□ sklearn:train_test_split、model.fit、model.predict、mean_squared_error
□ PyTorch:nn.Conv2d、nn.MaxPool2d、nn.Linear、nn.ReLU
回到开头的问题
NOAI初赛到底难不难?
从知识范围看,它覆盖了大学AI专业的核心概念;从考查深度看,它只要求"理解"和"会用",不要求"推导"和"证明"。对于系统学习过AI课程的学生,这是一场可以准备、可以拿高分的考试。
但更重要的是:通过备考NOAI,学生获得的不只是一张证书,而是对人工智能的系统认知。
当同龄人还在讨论"AI会不会取代人类"时,参加过NOAI的学生已经知道:机器学习的本质是什么,神经网络如何"学习",模型为什么会出错,以及AI的能力边界在哪里。
这种认知,将是AI时代真正的竞争力。
2026年NOAI第一轮考试时间
3月22日(周日)9:00-11:00