NOAI人工智能奥赛初赛:考什么?如何备考?

NOAI人工智能奥赛初赛:考什么?如何备考?

本文核心观点
NOAI 第一轮水平测试是选拔国家队的第一道门槛。基于 2025 年官方真题,本文详细拆解 NOAI 初赛 4 类题型的考察重点和备考路径。

NOAI人工智能奥赛初赛

考什么?如何备考?

到底考什么?难不难?孩子如何更好应对?

NOAI(全国人工智能奥林匹克)第一轮水平测试,是选拔中国国家队的第一道门槛。今天,我们基于2025年官方真题,为您详细拆解这场考试。

一、考什么题型?四类题目详解

第一类:选择题(30分)

选择题考查的是概念理解简单计算,涵盖AI应用场景、机器学习基础、模型评估等内容。

【真题案例1】AI伦理与可解释性(2025年第6题)

某金融机构采用深度神经网络对用户贷款申请进行风险评估,上线后拒绝率显著升高。许多被拒客户质疑决策依据不透明,监管部门也要求该机构公开核心决策元素。若该机构希望兼顾模型的高准确率与可解释性,下列哪项措施最符合这一要求?

A. 向公众全面公开模型权重和所有客户数据

B. 采用可解释性技术(如特征重要度分析)来揭示模型判断逻辑 ✓

C. 随机生成若干拒贷理由,用固定模板向所有被拒用户解释

D. 大幅简化模型结构,仅保留极少数特征

这道题考的不是技术细节,而是AI在实际应用中的社会责任——模型不仅要准确,还要能解释。

【真题案例2】Softmax概率计算(2025年第11题)

图像分类任务,模型需要判断输入图像是猫、狗还是鸟。模型最后一层全连接层的输出张量为:[2.0, 1.0, 1.0]。请问,经过Softmax函数处理后,模型对每一类的预测概率分别是多少?

A. 猫: 0.576, 狗: 0.212, 鸟: 0.212 ✓

B. 猫: 0.509, 狗: 0.234, 鸟: 0.257

C. 猫: 0.516, 狗: 0.232, 鸟: 0.232

D. 猫: 0.500, 狗: 0.250, 鸟: 0.250

这道题需要手算:Softmax公式是 e^x / Σe^x,猫的概率 = e² / (e² + e¹ + e¹) ≈ 7.39 / 12.17 ≈ 0.576

选择题考查概念理解简单计算——有些题可以秒答,有些题需要动笔算。记住常用数值(如e≈2.718)能节省时间。

第二类:概念解释题(20分)

概念题要求用自己的话解释AI术语,并举出实际例子

【真题案例3】欠拟合(2025年第16题)

Jerry在进行机器学习模型训练时,使用了一个较简单的线性回归模型来预测房价,数据集包含多个特征(如房屋面积、卧室数量、房龄等),但模型在训练集和验证集上的误差都较大。请解释这种现象以及可能造成这种现象的原因。

官方评分标准:

• 回答"欠拟合"概念:2分

• 回答主要原因是"模型复杂度过低":2分

• 回答其他原因(如特征不足、训练不足等):1分

概念题要答全——定义 + 原因 + 举例,缺一项就扣分。

【真题案例4】算法偏见(2025年第17题)

请简要解释"算法偏见(Algorithm Bias)"的含义,并分析其可能导致的社会影响。结合实际案例,讨论如何通过技术和政策手段减少算法偏见。

答题要点:

含义:算法在训练数据或设计过程中引入的系统性偏差,导致对特定群体的不公平对待

社会影响:招聘歧视、贷款歧视、司法判决不公等

案例:亚马逊招聘AI歧视女性、美国COMPAS系统对黑人被告预测偏高

技术手段:数据去偏、公平性约束、模型可解释性

政策手段:算法审计制度、反歧视法规、透明度要求

AI伦理题考查的不是技术细节,而是对AI社会影响的思考能力——要能结合真实案例,从技术和制度两个层面分析问题。

第三类:代码补全题(20分)

给出一段Python代码框架,要求填写关键语句,需要保证语法正确、逻辑正确

【真题案例5】线性回归房价预测(2025年第20题)

# 数据清洗,去除异常值
data = ___________①___________

# 划分训练集和测试集,80:20
X_train, y_train, X_test, y_test = ___________②___________

# 使用训练集训练模型
___________③___________

# 计算均方误差MSE
mse = ___________④___________

答案:

data[(data['面积'] > 10) & (data['面积'] < 1000)]

train_test_split(X, y, test_size=0.2)

model.fit(X_train, y_train)

mean_squared_error(y_test, y_pred)

【真题案例6】梯度下降实现(2025年第21题)

# 计算损失函数
def loss_function(x, y, w, b):
    for i in range(m):
        error = ___________①___________
        total_error += error
    return total_error / (2 * m)

# 梯度下降更新参数
def gradient_descent(x, y, w, b, alpha, num_iterations):
    for _ in range(num_iterations):
        dw, db = compute_gradient(x, y, w, b)
        w = ___________④___________
        b = ___________⑤___________
    return w, b

答案:

(model(x[i], w, b) - y[i]) ** 2

w - alpha * dw(注意是减号,沿梯度反方向)

b - alpha * db

代码补全题要求语法正确、逻辑正确——需要熟悉sklearn和PyTorch的常用API,理解梯度下降等核心算法的数学原理,不只是会调库。

第四类:编程题(30分)

给出需求描述,要求手写完整的Python函数。这是分值最高的题型。

【真题案例7】图像模糊/均值滤波(2025年第22题)

实现函数blur,将每个像素点的颜色值替换为周围9个像素(包括自身)的平均值。图像边界处的像素点值保持不变。

这道题考查的是计算机视觉的基础操作。需要写出三层循环(行、列、颜色通道),并正确处理边界条件。

【真题案例8】CNN验证码识别(2025年第23题)

实现一个CNN网络,接收40×40的灰度图像,输出26个英文字母的预测概率。

要求:

• 第一个卷积块:输入1通道,输出32通道,3×3卷积,ReLU激活,2×2最大池化

• 第二个卷积块:输出64通道,5×5卷积,...

• 全连接层:至少一个中间层,最终输出26维

这道题需要:

1. 熟悉PyTorch的API(Conv2d、MaxPool2d、Linear)

2. 能手算特征图尺寸(40→池化→20→池化→10)

3. 正确计算全连接层的输入维度(64×10×10=6400)

编程题是分值最高的题型(30分),要求手写完整函数——需要熟练掌握循环、条件判断等基础语法,能手算CNN特征图尺寸,正确处理边界条件。

二、考哪些知识?

根据NOAI官方大纲(2026年V1.5版),初赛考查A区(Python编程)B区(人工智能基础)两大板块。

A区:Python编程技能

基本语法 算数运算、关系运算、输入输出语句

程序结构 顺序、分支、循环

数据结构 字符串、列表、字典、元组及其基本操作

函数与模块 函数定义、内置函数、标准模块(os、math、random、sys等)

基础算法 排序、查找

B区:人工智能基础知识

人工智能概论

知道 连接主义、符号主义、行为主义、图灵测试

理解 AI伦理(数据隐私、算法偏见、责任归属),能通过案例分析讨论

机器学习

理解 监督学习、无监督学习,能描述区别和联系

知道 强化学习的概念和典型应用

理解 回归、分类、聚类,知道常见算法

理解 线性回归、逻辑回归的基本原理

知道 线性与非线性、概率论基础、正态分布、残差、偏差、标准差

理解 欠拟合、过拟合、正则化

能计算 模型评估指标:混淆矩阵、精确率、准确率、召回率、F1、交叉验证

理解 集成学习(梯度提升、Bagging、随机森林)的核心思想

神经网络

理解 感知机、神经网络

理解 反向传播算法,能描述正向传播和反向传播过程

理解 梯度下降、局部最优、全局最优

理解 卷积神经网络(CNN),能简要描述网络结构

能计算 卷积层、池化层、全连接层的原理和计算过程

理解 决策函数、激活函数、损失函数的作用

知道 动量优化方法(Adam、AdamW)与普通梯度下降的差异

知道 大语言模型(LLM)的核心思想

数据处理

理解 数据清洗的一般过程

理解 训练集、验证集、测试集的各自作用

这些知识难吗?与大学课程对比

上述知识点覆盖了清华大学人工智能相关专业的多门核心课程内容:

监督/无监督学习、回归、分类
对应清华《机器学习》(大三)
大学要求:推导损失函数的梯度公式,证明收敛性
NOAI要求:理解概念,能区分应用场景

混淆矩阵、精确率、召回率
对应清华《机器学习》(大三)
大学要求:推导各指标的统计学含义和置信区间
NOAI要求:能根据混淆矩阵手算各项指标

梯度下降、反向传播
对应清华《深度学习》(大三)
大学要求:推导链式法则,手算多层网络的梯度
NOAI要求:理解原理,能写出参数更新公式

CNN、卷积层、池化层
对应清华《深度学习》《计算机视觉》
大学要求:实现完整的CNN架构,调参优化
NOAI要求:理解结构,能手算特征图尺寸

AI伦理
对应清华《人工智能伦理》(选修)
大学要求:撰写伦理分析报告,参与案例研讨
NOAI要求:能用案例分析讨论

简单来说:NOAI考的是大学课程的"概念层",不考"推导层"。大学生需要证明"为什么这个公式成立",高中生只需要理解"这个公式怎么用"。

但这不代表简单。对于没有系统学习过AI的高中生来说,这些内容需要专门准备——它不在高中课本里,也不会在普通编程课上教。

三、备考冲刺:如何拿高分?

以下建议适用于已经系统学习过AI课程的学生,在考前进行针对性强化。

1. 答题策略

基于2025年真题分析,选择题中有两类:

快题 Python语法、概念判断(每题1分钟)

慢题 需要计算的题:Softmax概率、混淆矩阵指标(每题3-4分钟)

先快速过一遍,把能秒答的题先做完

需要计算的题标记出来,最后统一做

编程题如果一道卡住超过10分钟,先做另一道

2. 必须能手算的内容

Softmax概率

输出 [2.0, 1.0, 1.0] → 概率 = e^x / Σe^x

记住:e ≈ 2.718,e² ≈ 7.39

猫的概率 = 7.39 / (7.39 + 2.718 + 2.718) ≈ 0.576

混淆矩阵指标

      预测正  预测负

实际正   TP    FN

实际负   FP    TN

精确率 = TP/(TP+FP) ← 预测为正的里面,多少真的是正

召回率 = TP/(TP+FN) ← 实际为正的里面,多少被找出来

准确率 = (TP+TN)/总数

CNN特征图尺寸

卷积后 = (输入 - 卷积核 + 2×padding) / stride + 1

池化后 = 输入 / 池化核大小

例:40×40 → Conv(3×3, padding=1) → 40×40 → Pool(2×2) → 20×20

3. 概念题:按评分点答题

官方评分结构:定义(2分)+ 原因/特点(2分)+ 举例(1分)

❌ 错误示范

"欠拟合就是模型效果不好。"

✅ 正确示范

"欠拟合是指模型在训练集和验证集上误差都较大的现象。主要原因是模型复杂度过低,无法捕捉数据中的规律。例如用简单的线性回归预测非线性关系的房价数据。"

4. 代码题:常见陷阱

陷阱1:除法 vs 整除

mid = (L + R) / 2 得到浮点数

mid = (L + R) // 2 得到整数

陷阱2:梯度下降方向

w = w + alpha * dw 梯度上升

w = w - alpha * dw 梯度下降(减号)

陷阱3:pandas条件筛选

data[data['面积'] > 10 & data['面积'] < 1000]

data[(data['面积'] > 10) & (data['面积'] < 1000)] 每个条件加括号

5. 考前检查清单

Python语法

□ 列表切片:a[1:4] 结果是什么?

□ 列表方法:append vs extend vs insert

□ 字典取值:d['key'] vs d.get('key')

□ 整除运算:// vs /

□ 列表推导式、lambda表达式

人工智能概论

□ 三大学派:连接主义、符号主义、行为主义

□ 图灵测试:什么是图灵测试?

机器学习概念

□ 监督学习 vs 无监督学习 vs 强化学习

□ 回归 vs 分类 vs 聚类

□ 线性回归 vs 逻辑回归

□ 训练集 vs 验证集 vs 测试集

□ 过拟合 vs 欠拟合、正则化、交叉验证

□ 集成学习:随机森林、Bagging、梯度提升

统计学基础

□ 残差、偏差、标准差

□ 正态分布(高斯分布)

□ 距离的定义(欧氏距离等)

评估指标(能手算)

□ 混淆矩阵:TP、TN、FP、FN的定义

□ 精确率 = TP/(TP+FP)

□ 召回率 = TP/(TP+FN)

□ 准确率 = (TP+TN)/总数

□ F1分数 = 2×精确率×召回率/(精确率+召回率)

神经网络

□ 感知机的基本结构

□ 激活函数的作用(引入非线性)、ReLU、Softmax

□ 决策函数、损失函数的作用

□ 梯度下降、局部最优 vs 全局最优

□ 反向传播、Adam/AdamW优化器

□ CNN结构、特征图尺寸计算公式

□ 大语言模型(LLM)的核心思想

AI伦理

□ 算法偏见:定义、危害、应对措施

□ 可解释性:为什么重要、如何实现

□ 数据隐私、责任归属

代码API

□ sklearn:train_test_split、model.fit、model.predict、mean_squared_error

□ PyTorch:nn.Conv2d、nn.MaxPool2d、nn.Linear、nn.ReLU

回到开头的问题

NOAI初赛到底难不难?

从知识范围看,它覆盖了大学AI专业的核心概念;从考查深度看,它只要求"理解"和"会用",不要求"推导"和"证明"。对于系统学习过AI课程的学生,这是一场可以准备、可以拿高分的考试。

但更重要的是:通过备考NOAI,学生获得的不只是一张证书,而是对人工智能的系统认知。

当同龄人还在讨论"AI会不会取代人类"时,参加过NOAI的学生已经知道:机器学习的本质是什么,神经网络如何"学习",模型为什么会出错,以及AI的能力边界在哪里。

这种认知,将是AI时代真正的竞争力。

2026年NOAI第一轮考试时间

3月22日(周日)9:00-11:00

微信二维码

扫码备注【NOAI】加交流群