STM32F1多通道ADC+DMA同步采集实战指南

模数转换（ADC）是嵌入式系统感知物理世界的基础环节，而多通道同步采样能力直接决定工业测控、传感器融合等场景的数据可信度。其核心原理在于利用ADC规则组实现硬件级通道轮序调度，并通过DMA控制器绕过CPU完成外设到内存的自主数据搬运，从而在保证时间一致性的同时释放处理器资源。该技术显著提升系统实时性与吞吐效率，广泛应用于电机控制、电池管理系统及多参数环境监测。本文聚焦STM32F103平台，详解A

wdx012345

60人浏览 · 2026-02-06 14:00:13

wdx012345 · 2026-02-06 14:00:13 发布

1. 多通道ADC采集的工程瓶颈与DMA引入动机

在嵌入式系统中，ADC（模数转换器）是连接物理世界与数字处理的核心桥梁。对于STM32F1系列这类主流MCU，其片上ADC资源虽已足够应对多数基础场景，但当系统需求从单点静态测量升级为多通道、高频率、低CPU开销的连续数据流采集时，传统轮询（Polling）或中断（Interrupt）驱动模式便暴露出根本性局限。

首要限制在于 通道复用能力的硬性约束 。STM32F103系列仅集成ADC1、ADC2、ADC3三个独立ADC外设，每个ADC内部虽支持多达16个输入通道（CH0–CH15），但其采样序列（Sequence）必须由单一ADC实例统一调度。若采用轮询方式——即在主循环中依次调用 HAL_ADC_Start() 、 HAL_ADC_PollForConversion() 、 HAL_ADC_GetValue() 完成单次转换——则每次启动转换仅能绑定一个通道。这意味着：若需同时采集CH0（如温度传感器）与CH1（如电池电压），工程师不得不在主循环中反复切换通道配置、启动转换、读取结果。此过程不仅代码冗长，更导致两个通道的数据在时间轴上严重错位：CH0的采样时刻与CH1相隔数毫秒甚至更久，完全丧失同步性。在需要计算两路信号相位差、比值或联合触发的工业控制场景中，这种时间失配直接导致算法失效。

第二重瓶颈是 CPU资源的不可持续消耗 。以典型12位ADC、1MHz ADCCLK为例，一次完整转换耗时约1.5μs（含采样时间）。若要求每10ms采集一对CH0/CH1数据，则每秒需执行200次转换操作。每次轮询需执行至少4–5条指令（启动、等待、读取、存储），保守估计占用CPU周期约2000次/秒。这看似微不足道，但在实时性要求严苛的系统中——例如同时运行FreeRTOS任务调度、CAN总线通信、PID闭环控制——这部分“隐形开销”会显著挤压关键任务的响应裕度。更严峻的是，当采样率提升至1kHz以上时，轮询模式将彻底吞噬CPU，使系统丧失基本交互能力。

DMA（Direct Memory Access）技术正是为突破上述双重瓶颈而生。其核心价值在于 解耦数据搬运与CPU执行 ：ADC硬件在完成一次转换后，不触发中断通知CPU，而是直接通过AHB总线将16位转换结果写入预分配的SRAM缓冲区；整个过程无需CPU参与任何寄存器读写或内存拷贝操作。对开发者而言，DMA并非一种“加速技巧”，而是一种 系统级架构重构 ——它将ADC从“需要CPU伺候的外设”转变为“自主运行的数据流引擎”。本方案采用DMA循环模式（Circular Mode）配合双通道规则组（Regular Group），实现CH0与CH1的严格交替、无缝衔接采集，最终在零CPU干预下构建出稳定、同步、高吞吐的多通道数据管道。

2. STM32F103 ADC+DMA硬件协同架构解析

理解ADC与DMA的协同机制，必须回归STM32F103的底层总线拓扑与外设互联逻辑。该芯片采用Cortex-M3内核，其存储器与外设通过AHB（Advanced High-performance Bus）与APB（Advanced Peripheral Bus）两级总线互联。ADC作为APB2总线上的高速外设，其数据寄存器（ADC_DR）被映射至AHB地址空间，从而可被DMA控制器直接寻址。而DMA1控制器（本方案使用DMA1 Channel1）作为AHB总线上的主设备（Master），具备独立于CPU的总线仲裁权，可主动发起对ADC_DR的读取操作。

2.1 ADC多通道规则组配置原理

ADC的规则组（Regular Sequence）是实现多通道轮转采集的硬件基础。其本质是一个由SQRx（Sequence Register）寄存器维护的通道索引队列。当ADC工作于连续转换模式（Continuous Conversion）时，硬件自动按SQRx中定义的顺序，依次对队列中的每个通道执行采样-转换流程。本方案需采集CH0与CH1，因此规则组长度（L[3:0]）必须设为2（即 SQR1[23:20] = 0x01 ），并配置：
- 第一转换序列（SQ1[4:0]）指向CH0（ SQR3[4:0] = 0x00 ）
- 第二转换序列（SQ2[4:0]）指向CH1（ SQR3[9:5] = 0x01 ）

此配置确保ADC硬件引擎严格遵循“CH0 → CH1 → CH0 → CH1…”的无限循环，为后续DMA搬运提供稳定、可预测的数据流节拍。

2.2 DMA通道与传输参数匹配逻辑

DMA1 Channel1被固定映射为ADC1的专用请求源（Request Source），此绑定关系由芯片硬件固化，不可更改。启用该通道需在DMA_CPAR1（外设地址寄存器）中写入ADC1_DR的基地址（ 0x4001244C ），在DMA_CMAR1（内存地址寄存器）中写入用户定义缓冲区（如 adc_dma_buffer ）的起始地址。关键参数设置如下：

数据宽度（PSIZE/MSIZE） ：ADC_DR寄存器为16位宽，故外设数据宽度（PSIZE）必须设为 DMA_PDATAALIGN_HALFWORD （16位）；内存数据宽度（MSIZE）同样设为半字，确保数据无损搬运。
传输方向（DIR） ： DMA_DIR_PERIPH_TO_MEM ，明确指示数据流向为外设→内存。
循环模式（CIRC） ：启用（ ENABLE ），使DMA在填满缓冲区后自动回绕至起始地址，形成永续数据流。
缓冲区长度（NDT） ：设为100，即 dma_config.Init.NbData = 100 。此数值非随意指定，而是基于数据处理策略的工程权衡：过小（如10）导致DMA频繁回绕，增加缓冲区管理复杂度；过大（如1000）则增大内存占用且延迟数据可用性。100长度在内存效率与处理实时性间取得平衡。

2.3 时钟树与采样时间协同设计

ADC性能直接受时钟域制约。STM32F103的ADCCLK由APB2总线时钟（PCLK2）经预分频器（ADCPRE）分频得到。本方案中，系统主频72MHz，PCLK2=72MHz，ADCPRE=2，故ADCCLK=36MHz。根据ADC电气特性，此频率下最大允许采样周期为1.5个ADCCLK周期（对应12位精度）。因此，CH0与CH1的采样时间（SMPx）均需设为 ADC_SAMPLETIME_1CYCLE_5 （1.5周期），确保转换精度不受时钟约束影响。若忽略此匹配，盲目提高ADCCLK，将导致转换结果不稳定或精度下降。

3. CubeMX图形化配置全流程详解

CubeMX作为ST官方推荐的初始化代码生成工具，其核心价值在于将复杂的寄存器配置抽象为直观的图形界面操作，并自动生成符合HAL库规范的初始化函数。以下步骤严格遵循工程实践，杜绝“点击即完成”的黑盒操作，每一步均阐明其背后的技术意图。

3.1 ADC外设基础配置

启用ADC1 ：在Pinout视图中，定位到PA0（ADC1_IN0）与PA1（ADC1_IN1）引脚，右键选择 GPIO_Input ，随后在Analog选项卡中勾选 ADC1_IN0 与 ADC1_IN1 。此举不仅配置引脚为模拟输入模式，更在底层自动调用 __HAL_RCC_ADC1_CLK_ENABLE() 使能ADC1时钟。
配置ADC参数 ：
- Resolution ：设为 12 Bits 。这是F1系列ADC的原生分辨率，更高位数需依赖过采样（Oversampling），本方案暂不启用。
- Data Alignment ： Right （右对齐）。HAL库默认采用右对齐，高位补零，便于后续数值处理。
- Scan Conversion Mode ： Enable 。扫描模式是多通道采集的前提，禁用时ADC仅能采集单一通道。
- Continuous Conversion Mode ： Enable 。连续模式使ADC在完成一次转换后立即启动下一次，形成稳定数据流，是DMA工作的必要条件。
- Discontinuous Conversion Mode ： Disable 。不连续模式会打断规则组序列，与DMA循环传输目标冲突。
- External Trigger Conversion ： Disabled 。本方案采用软件触发（ HAL_ADC_Start_DMA() ），避免外部信号干扰时序。
- Conversion Prescaler ： DIV2 。此即前述ADCPRE=2的图形化表示，确保ADCCLK=36MHz。

3.2 规则组通道序列配置

进入ADC1的Configuration页面，切换至 Regular Channels 子页：
- 点击 Add 按钮两次，分别添加 Channel 0 与 Channel 1 。
- 在 Rank 列中，将 Channel 0 设为 1 ， Channel 1 设为 2 。此操作直接映射至SQR3寄存器的SQ1/SQ2字段，构建CH0→CH1的严格序列。
- Sampling Time 列统一设为 1.5 Cycles ，与前述时钟分析一致。

3.3 DMA控制器集成配置

启用DMA请求 ：在ADC1 Configuration的 DMA Settings 页，勾选 DMA Request 。CubeMX自动识别ADC1需DMA1 Channel1，并在 DMA 视图中创建该通道实例。
配置DMA1 Channel1参数 ：
- Request ： ADC1 （自动关联，不可修改）。
- Direction ： Peripheral To Memory 。
- Data Width ： Half Word （16位），与ADC_DR宽度严格匹配。
- Mode ： Circular 。此为实现永续采集的关键开关。
- Priority ： High 。ADC数据流具有较高实时性要求，优先级低于SysTick但高于普通外设DMA。
- Burst Mode ： Single 。ADC_DR为单寄存器，不支持突发传输（Burst），此项必须为Single。

3.4 生成代码与初始化验证

点击 Project Manager → Generate Code ，CubeMX生成 MX_ADC1_Init() 与 MX_DMA_Init() 函数。关键生成代码片段如下：

// MX_ADC1_Init() 中生成的规则组配置
hadc1.Init.ScanConvMode = ENABLE;          // 启用扫描模式
hadc1.Init.ContinuousConvMode = ENABLE;    // 启用连续模式
hadc1.Init.NbrOfConversion = 2;            // 规则组长度=2
sConfig.Channel = ADC_CHANNEL_0;           // 第一通道：CH0
sConfig.Rank = 1;                          // 序列位置：1
sConfig.SamplingTime = ADC_SAMPLETIME_1CYCLE_5;
if (HAL_ADC_ConfigChannel(&hadc1, &sConfig) != HAL_OK) { /* Error Handler */ }
sConfig.Channel = ADC_CHANNEL_1;           // 第二通道：CH1
sConfig.Rank = 2;                          // 序列位置：2
if (HAL_ADC_ConfigChannel(&hadc1, &sConfig) != HAL_OK) { /* Error Handler */ }

// MX_DMA_Init() 中生成的DMA配置
hdma_adc1.Instance = DMA1_Channel1;
hdma_adc1.Init.Direction = DMA_PERIPH_TO_MEMORY;
hdma_adc1.Init.PDataAlign = DMA_PDATAALIGN_HALFWORD;
hdma_adc1.Init.MDataAlign = DMA_MDATAALIGN_HALFWORD;
hdma_adc1.Init.Mode = DMA_CIRCULAR;        // 循环模式
hdma_adc1.Init.Priority = DMA_PRIORITY_HIGH;

生成代码后，务必在 main.c 的 while(1) 循环前调用 HAL_ADC_Start_DMA() 启动采集：

uint16_t adc_dma_buffer[100]; // 定义100元素的半字缓冲区
HAL_ADC_Start_DMA(&hadc1, (uint32_t*)adc_dma_buffer, 100, 
                  DMA_MINC_ENABLE, DMA_PDATAALIGN_HALFWORD, DMA_MDATAALIGN_HALFWORD);

此调用将DMA通道与缓冲区绑定，并启动ADC连续转换。此后，CPU可完全脱离ADC数据搬运任务。

4. 多通道数据解析与软件滤波实现

DMA将ADC原始数据以严格交替的时序填入缓冲区： adc_dma_buffer[0] = CH0, adc_dma_buffer[1] = CH1, adc_dma_buffer[2] = CH0, adc_dma_buffer[3] = CH1… 形成一个奇偶索引分离的天然数据结构。高效利用此规律进行通道分离与滤波，是发挥多通道采集价值的关键。

4.1 奇偶索引通道分离算法

缓冲区长度为100（偶数），确保CH0与CH1数据各占50个样本。分离逻辑简洁而高效：

uint32_t ad1_sum = 0; // CH0累加器
uint32_t ad2_sum = 0; // CH1累加器
for(uint8_t i = 0; i < 100; i++) {
    if(i % 2 == 0) { // 偶数索引：CH0
        ad1_sum += adc_dma_buffer[i];
    } else {         // 奇数索引：CH1
        ad2_sum += adc_dma_buffer[i];
    }
}
uint16_t ad1_avg = ad1_sum / 50; // CH0平均值
uint16_t ad2_avg = ad2_sum / 50; // CH1平均值

此算法时间复杂度O(n)，空间复杂度O(1)，无额外内存分配，完美适配资源受限的MCU环境。值得注意的是， ad1_sum 与 ad2_sum 声明为 uint32_t 而非 uint16_t ，是因为50个12位ADC值（最大4095）累加后可能达到204750，远超 uint16_t 上限65535，此处体现嵌入式开发中数据类型选择的严谨性。

4.2 滑动平均滤波的工程实践

原始ADC数据受电源噪声、PCB布线耦合及传感器自身波动影响，存在高频毛刺。简单的算术平均（如上述50点平均）虽能抑制随机噪声，但对周期性干扰（如50Hz工频）效果有限，且响应滞后。本方案采用 滑动平均滤波（Moving Average Filter） ，在保持低计算开销前提下提升滤波质量：

#define FILTER_SIZE 50
uint16_t ad1_filter[FILTER_SIZE];
uint16_t ad2_filter[FILTER_SIZE];
uint8_t filter_index = 0;
uint32_t ad1_filter_sum = 0;
uint32_t ad2_filter_sum = 0;

// 每次新数据到达时更新滤波器
void update_filter(uint16_t ch0_val, uint16_t ch1_val) {
    // 移除旧值
    ad1_filter_sum -= ad1_filter[filter_index];
    ad2_filter_sum -= ad2_filter[filter_index];

    // 插入新值
    ad1_filter[filter_index] = ch0_val;
    ad2_filter[filter_index] = ch1_val;
    ad1_filter_sum += ch0_val;
    ad2_filter_sum += ch1_val;

    // 更新索引（循环缓冲区）
    filter_index = (filter_index + 1) % FILTER_SIZE;
}

// 获取当前滤波后值
uint16_t get_ad1_filtered(void) { return ad1_filter_sum / FILTER_SIZE; }
uint16_t get_ad2_filtered(void) { return ad2_filter_sum / FILTER_SIZE; }

滑动平均的本质是维护一个长度为N的FIFO队列，每次仅更新一个元素并重新计算总和，计算量恒定为O(1)，相比每次全量重算O(N)效率提升显著。实际项目中， FILTER_SIZE 可根据噪声特性调整：对缓慢变化的温度信号，可设为100以增强抑制；对快速响应的电机电流，可降至20以降低延迟。

4.3 电压值标定与线性转换

ADC输出为0–4095的数字量，需转换为物理电压值（单位：V）。转换公式为：
[
V_{out} = \frac{ADC_value \times V_{ref}}{2^{n}}
]
其中，(V_{ref})为参考电压（本系统为3.3V），(n)为ADC位数（12）。HAL库已将此计算封装为 HAL_ADC_GetValue() ，但直接使用需注意：该函数返回的是最后一次转换的瞬时值，而非DMA缓冲区的平均值。因此，应基于滤波后的 ad1_avg / ad2_avg 进行标定：

float voltage_ch0 = (float)ad1_avg * 3.3f / 4095.0f; // 单位：V
float voltage_ch1 = (float)ad2_avg * 3.3f / 4095.0f;

为提升浮点运算效率（尤其在无FPU的F1系列上），可预先计算标定系数：

#define ADC_TO_VOLT_COEFF (3.3f / 4095.0f) // ≈ 0.00080586
float voltage_ch0 = (float)ad1_avg * ADC_TO_VOLT_COEFF;

此系数法避免了每次转换时的除法运算，将计算简化为单次乘法，在资源敏感场景中至关重要。

5. 系统精度瓶颈分析与外置ADC升级路径

实测数据显示，本方案在1.6V输入下读数为1.56V，误差达40mV（约1.25%）；2.0V输入读数为1.958V，误差42mV。此精度远低于STM32F103数据手册宣称的±2 LSB（约1.6mV）典型值。误差根源并非代码缺陷，而是 系统级硬件限制 的集中体现。

5.1 片上ADC精度衰减的四大主因

参考电压（VREF）稳定性不足 ：MCU的VREF+引脚通常直接连接VDD（3.3V），而VDD受LDO负载调整率、PCB走线阻抗及大电流器件（如LED、电机）开关噪声影响，纹波可达50–100mV。ADC的转换结果与VREF成正比，VREF波动直接转化为测量误差。实测中，当系统无负载时误差减小至20mV，印证此点。
电源去耦不充分 ：ADC模拟部分（VDDA/VSSA）需独立于数字电源（VDD/VSS）供电，并配备高质量陶瓷电容（如100nF + 10μF）紧邻VDDA引脚放置。若PCB布局中VDDA去耦电容缺失或距离过远，高频噪声将耦合至ADC采样电路。
PCB布局干扰 ：ADC输入引脚（PA0/PA1）若靠近高速数字信号线（如USB、SPI）、大电流回路或未屏蔽的模拟传感器线缆，将引入共模/差模噪声。F1系列无专用差分输入通道，单端输入对此类干扰尤为敏感。
内部采样电容充电时间不足 ：尽管已设采样时间为1.5周期，但对于高阻抗信号源（如热敏电阻分压网络），ADC内部采样开关导通后，采样电容（几pF）需通过信号源内阻充电至稳定电压。若内阻>10kΩ，1.5周期（≈42ns）远不足以完成充电，导致转换值偏低。此即为何高精度应用常要求信号源内阻<1kΩ。

5.2 外置高精度ADC选型与集成策略

当系统精度要求突破±10mV时，必须放弃片上ADC，转向专业外置方案。ADI的AD7606系列（16位、8通道、同步采样）与TI的ADS1256（24位、ΔΣ型、内置PGA）是工业级首选。本方案推荐ADS1256，原因如下：

24位无丢失码（No Missing Codes） ：理论分辨率≈0.2μV（5V满量程），实测有效位数（ENOB）达21位，对应精度优于0.01mV，较片上ADC提升4000倍。
集成可编程增益放大器（PGA） ：增益1–128可调，可直接接入mV级传感器（如应变片、热电偶），消除外部运放带来的噪声与失调。
完备的模拟前端（AFE） ：内置基准源（2.5V，±2ppm/℃温漂）、RC抗混叠滤波、过压保护，大幅简化外围电路设计。
SPI接口与低功耗 ：与STM32 SPI外设无缝对接，待机电流仅100nA，适合电池供电设备。

集成ADS1256的关键步骤：
1. 硬件连接 ：SPI MOSI/MISO/SCLK/CS接STM32对应引脚；DRDY（Data Ready）引脚接MCU外部中断线（如EXTI0），用于精准捕获转换完成事件。
2. 驱动开发 ：编写SPI读写函数，重点实现 ADS1256_ReadRegister() 与 ADS1256_WriteRegister() 。通过配置 MUX 寄存器选择通道， PGA 寄存器设定增益， DATARATE 寄存器设定采样率（10SPS–30KSPS）。
3. 数据同步 ：利用DRDY中断触发 HAL_SPI_TransmitReceive() 读取24位转换结果，避免轮询浪费CPU。中断服务程序（ISR）中仅置位标志位，数据处理移至主循环或高优先级任务，确保实时性。

6. 实时性能验证与调试技巧

DMA方案的价值最终体现在可量化的实时性能提升。以下方法可客观验证系统效能，并快速定位潜在问题。

6.1 DMA吞吐率实测方法

利用STM32的DWT（Data Watchpoint and Trace）单元，可精确测量任意代码段执行周期。在 while(1) 循环中插入：

CoreDebug->DEMCR |= CoreDebug_DEMCR_TRCENA_Msk; // 使能DWT
DWT->CYCCNT = 0; // 清零计数器
DWT->CTRL |= DWT_CTRL_CYCCNTENA_Msk; // 使能计数器

// 在DMA缓冲区填满100次后（即50对CH0/CH1数据）读取计数器
uint32_t cycles = DWT->CYCCNT;
float time_ms = (float)cycles / SystemCoreClock * 1000.0f;
float throughput_khz = 100.0f / time_ms; // kHz

实测表明，在72MHz主频下，100次DMA传输耗时约5.2ms，对应吞吐率≈19.2kHz。这意味着ADC每秒完成19200次转换（CH0+CH1各9600次），而CPU占用率趋近于零——所有时间均用于其他任务或休眠。

6.2 常见故障排查清单

故障现象	可能原因	调试方法
DMA缓冲区无数据更新	① `HAL_ADC_Start_DMA()` 未调用；② DMA通道未使能（ `DMA1_Channel1->CCR \|= DMA_CCR_EN` ）；③ ADC未启动连续转换	使用ST-Link Utility查看 `DMA1_CNDTR1` （剩余数据数）是否递减；检查 `ADC_CR2` 寄存器 `CONT` 位是否为1
数据全为0或0xFFFF	① ADC时钟未使能（ `RCC->APB2ENR \|= RCC_APB2ENR_ADC1EN` ）；② 输入引脚未正确配置为模拟模式（ `GPIOA->CRL &= ~(0xF<<0)` ）	用万用表测量PA0/PA1电压是否随输入变化；检查CubeMX生成的 `MX_GPIO_Init()` 中对应引脚模式
CH0/CH1数据混淆	规则组序列（SQRx）配置错误，或 `NbrOfConversion` 未设为2	用逻辑分析仪抓取 `ADC_EOC` （转换结束）信号与DMA请求信号，验证时序是否严格交替
滤波后值跳变剧烈	滑动平均缓冲区索引溢出（ `filter_index` 未取模）；或ADC参考电压受大电流器件干扰	示波器观察VREF+引脚纹波；在 `update_filter()` 中添加 `assert(filter_index < FILTER_SIZE)`

6.3 工程经验：规避“伪精度”陷阱

曾有项目在使用ADS1256后，仍出现±5mV误差。经排查发现：PCB上VREF引脚（2.5V）与数字地（DGND）间串接了一个0Ω电阻，意图隔离噪声。但该电阻焊盘存在微小锡珠，导致VREF实际为2.495V，引入0.2%系统误差。 精度提升的终极瓶颈永远在物理层 ——再完美的软件算法也无法弥补一个虚焊的去耦电容。因此，高精度系统开发必须遵循：先优化硬件（LAYOUT、电源、接地），再调试固件，最后验证算法。我在调试某电机电流检测板时，曾因忽略VDDA与VDD的分割铜皮宽度，导致ADC读数随电机启停漂移100mV；改用2mm宽铜皮隔离后，漂移降至0.5mV以内。硬件细节，永远是嵌入式工程师的第一道防线。

openvela

openvela 操作系统专为 AIoT 领域量身定制，以轻量化、标准兼容、安全性和高度可扩展性为核心特点。openvela 以其卓越的技术优势，已成为众多物联网设备和 AI 硬件的技术首选，涵盖了智能手表、运动手环、智能音箱、耳机、智能家居设备以及机器人等多个领域。

更多推荐

JavaSE-16

底层初始:内部有个 transient Object[] elementData→ 就是一个 Object 类型的数组,啥都能存,默认没放元素时,数组是空数组,一添加数据,才会真正分配空间。) { // 有没有下一个。set(int index, Object e)：将指定索引处的元素，替换成指定的元素，返回值为替换前的元素。add(int index, Object e)：在指定位置插入元素,指