STM32串口寄存器级详解：SR、DR、BRR原理与实战

串口通信是嵌入式系统最基础的外设交互方式，其本质是基于状态机与时序控制的数据收发过程。核心在于理解状态寄存器（SR）如何实时反映硬件就绪状态，数据寄存器（DR）如何通过双缓冲实现全双工，以及波特率寄存器（BRR）如何利用16倍过采样机制保障通信鲁棒性。这些底层原理直接决定中断响应及时性、抗干扰能力与低延迟性能，广泛应用于调试日志、传感器数据采集、工业设备互联等场景。掌握SR的RXNE/TXE标志时

flink9streamer

1082人浏览 · 2026-02-14 12:36:06

flink9streamer · 2026-02-14 12:36:06 发布

1. STM32串口通信底层原理与寄存器级实现

在嵌入式系统开发中，串口（USART/UART）是最基础、最可靠的外设通信接口。它不仅是调试信息输出的“生命线”，更是设备间数据交换的核心通道。对STM32而言，理解其串口模块的硬件架构与寄存器操作逻辑，是摆脱HAL库黑盒、实现高性能、低延迟通信的前提。本节将从寄存器定义出发，深入剖析状态机行为、数据流控制及波特率生成机制，并最终构建一个完全基于标准外设库（SPL）或寄存器操作的串口1初始化与中断收发框架。

1.1 状态寄存器（SR）：通信状态的实时镜像

STM32的USART状态寄存器（SR）是一个32位只读寄存器，其每一位都精确反映当前硬件模块的瞬时状态。该寄存器是所有串口操作的“中枢神经”，任何发送或接收动作都必须通过轮询或中断方式查询SR中的相应标志位来确认是否就绪。理解SR各关键位的含义与触发条件，是编写健壮串口驱动的第一步。

位	名称	含义	触发条件	工程意义
0 (PE)	Parity Error	奇偶校验错误	接收数据时，校验位与数据位计算结果不匹配	表明物理链路存在干扰或对端配置错误，需清零并丢弃该字节
5 (RXNE)	Read Data Register Not Empty	接收数据寄存器非空	接收移位寄存器（RDR）中的数据已成功转移到接收数据寄存器（RDR），且未被读取	中断收发的核心标志。置1表示有新数据可读，必须立即读取 `DR` 寄存器以清除此标志，否则后续数据将被覆盖
6 (TC)	Transmission Complete	发送完成	发送移位寄存器（TDR）中的最后一位数据（包括停止位）已移出，且 `TDR` 为空	表示整个帧发送完毕，可用于实现多字节连续发送的同步点
7 (TXE)	Transmit Data Register Empty	发送数据寄存器空	`TDR` 寄存器为空，可安全写入下一个待发送字节	高效发送的关键标志。置1表示可以向 `DR` 寄存器写入新数据，是启动下一次发送的信号

值得注意的是， RXNE 与 TXE 并非简单的“有/无”状态，而是具有明确的时序约束。 RXNE 在数据进入 RDR 后即置位，但若未及时读取，当新数据到达时， RXNE 会保持置位，而旧数据将被新数据覆盖，导致丢包。 TXE 则在 TDR 为空时置位，一旦向 DR 写入数据， TXE 立即清零，直至该字节被移入移位寄存器后才再次置位。这种设计要求软件必须严格遵循“先查后用”的原则，任何绕过状态检查的直接读写操作都将导致不可预测的行为。

1.2 数据寄存器（DR）：双缓冲的数据通道

数据寄存器（DR）是一个32位的复合寄存器，其低9位（bit[8:0]）为实际的数据域。它的物理结构本质上是两个独立的8位寄存器——发送数据寄存器（TDR）和接收数据寄存器（RDR）——通过一个地址映射到同一个寄存器地址上。这种设计实现了发送与接收的完全解耦，是全双工通信的硬件基础。

写操作（发送） ：当CPU向 DR 写入一个字节（如 *(__IO uint16_t*)&USART1->DR = data; ）时，该数据被锁存到TDR中。如果此时发送器空闲（ TXE=1 ），数据会立即被加载到发送移位寄存器并开始串行化；如果发送器正忙（ TXE=0 ），数据将暂存在TDR中等待。
读操作（接收） ：当CPU从 DR 读取一个字节（如 data = (uint8_t)USART1->DR; ）时，实际读取的是RDR中的内容。该操作不仅返回数据，还会自动清除 RXNE 标志位，这是硬件强制的“读清”机制，目的是防止因软件疏忽导致的重复处理。

关于数据宽度， DR 支持8位和9位两种模式，由 USART_CR1 寄存器的 M 位控制。当 M=0 （默认）时，仅使用 DR[7:0] ，第9位（ DR[8] ）被用作奇偶校验位（若 PCE=1 ）；当 M=1 时， DR[8:0] 全部作为数据位，此时奇偶校验功能被禁用。在绝大多数应用中，8位数据+1位停止位的标准配置（8N1）已足够，因此 M 位通常保持为0。

1.3 波特率寄存器（BRR）：精准时序的数字基石

波特率是串口通信的“心跳”，其精度直接决定了通信的可靠性。STM32的USART通过一个16位的波特率寄存器（BRR）来配置，该寄存器采用一种巧妙的“整数+小数”分频算法，以适应不同系统时钟频率下的高精度需求。其核心思想是： 将系统时钟（f _PCLK ）进行16倍过采样，再通过一个分频系数得到目标波特率（Baud） 。

其数学关系为：

Baud = f_PCLK / (16 * USARTDIV)

其中， USARTDIV 是一个16位的无符号定点数，其高12位（bit[15:4]）为整数部分（DIV_Mantissa），低4位（bit[3:0]）为小数部分（DIV_Fraction）。 USARTDIV 的值由BRR寄存器直接承载。

以本例中常用的 USART1 为例，其时钟源为APB2总线，典型频率为84 MHz。若需配置为115200 bps，则计算过程如下：
1. 计算理论分频值： USARTDIV = f_PCLK / (16 * Baud) = 84,000,000 / (16 * 115,200) ≈ 45.5729
2. 分离整数与小数： DIV_Mantissa = 45 , Fraction = 0.5729
3. 计算小数部分： DIV_Fraction = int(0.5729 * 16) = int(9.166) = 9

因此，BRR寄存器的值应为 (45 << 4) | 9 = 0x2D9 。

这个设计的精妙之处在于，它通过16倍过采样极大地提高了抗干扰能力。接收器在每个位周期内会对线路电平进行16次采样，并根据多数判决原则确定该位的逻辑值。这使得即使在存在轻微抖动或噪声的情况下，也能准确识别起始位和数据位，从而保证了通信的鲁棒性。在实际工程中，选择一个尽可能接近理论值的 USARTDIV 是至关重要的，因为过大的误差会导致采样点偏移，最终引发帧错误（FE）。

2. 串口1硬件资源与系统时钟配置

在开始编写任何代码之前，必须首先明确串口1所依赖的硬件资源及其在整个系统中的位置。这是一个典型的“自顶向下”工程思维：从芯片数据手册的顶层框图出发，逐步细化到具体的引脚、时钟和中断向量。

2.1 外设时钟与总线拓扑

STM32F4系列微控制器采用AHB/APB两级总线架构。 USART1 作为一个高速外设，其时钟源来自APB2总线（Advanced Peripheral Bus 2），而 USART2/3/4/5 则挂载在APB1总线上。这一区分至关重要，因为它直接决定了我们配置时钟使能寄存器（RCC_APB2ENR / RCC_APB1ENR）的地址。

APB2总线时钟（PCLK2） ：通常由系统时钟（SYSCLK）经APB2预分频器（RCC_CFGR.PPRE2）分频得到。在大多数F407开发板上， PPRE2=0 ，即PCLK2 = SYSCLK = 168 MHz；但在本例教学环境中， PCLK2 被配置为84 MHz，这通常是通过设置 PPRE2=1 （二分频）实现的。
APB1总线时钟（PCLK1） ：同样由SYSCLK经 PPRE1 分频，但其最大频率通常为PCLK2的一半，用于驱动低速外设。

因此，要使 USART1 工作，我们必须执行以下两步时钟使能：
1. 使能GPIOA时钟（因为 USART1_TX 和 USART1_RX 复用在PA9和PA10上）： RCC->APB2ENR |= RCC_APB2ENR_IOPAEN;
2. 使能USART1时钟： RCC->APB2ENR |= RCC_APB2ENR_USART1EN;

这两条指令必须在任何GPIO或USART寄存器操作之前执行，否则所有后续的写操作都将无效，这是初学者最常见的错误之一。

2.2 引脚复用（AF）与GPIO配置

USART1 的物理引脚是 PA9 （TX）和 PA10 （RX）。它们并非GPIO的默认功能，而是需要通过“复用功能”（Alternate Function, AF）来激活。在STM32F4中，每个GPIO引脚最多可支持16种不同的复用功能，由 GPIOx_AFRH （高位引脚）和 GPIOx_AFRL （低位引脚）寄存器进行配置。

对于 PA9 和 PA10 ：
- PA9 对应 GPIOA_AFRH 寄存器的 AFRH[1] 字段（bit[7:4]）
- PA10 对应 GPIOA_AFRH 寄存器的 AFRH[2] 字段（bit[11:8]）

查阅《STM32F4xx Reference Manual》可知， USART1 的复用功能编号为 AF7 。因此，我们需要将 AFRH[1] 和 AFRH[2] 均设置为 0b0111 （即 0x7 ）。

同时，GPIO引脚本身也需要配置为复用推挽输出（TX）和浮空输入（RX）：
- PA9 (TX) ： GPIOA->MODER |= GPIO_MODER_MODER9_1; （复用模式）
- PA10 (RX) ： GPIOA->MODER |= GPIO_MODER_MODER10_0; （输入模式）
- GPIOA->OTYPER &= ~GPIO_OTYPER_OT_9; （推挽，非开漏）
- GPIOA->OSPEEDR |= GPIO_OSPEEDER_OSPEEDR9; （高速）
- GPIOA->PUPDR &= ~GPIO_PUPDR_PUPDR10; （浮空，无上下拉）

这些配置共同构成了一个完整的硬件连接路径：CPU -> APB2总线 -> USART1外设 -> PA9/PA10引脚 -> 物理串口线缆。

2.3 中断向量与NVIC配置

USART1 的中断请求（IRQ）在STM32F4的中断向量表中占据固定位置，其IRQn编号为 USART1_IRQn ，对应的中断号为37。要启用该中断，必须完成三个层次的配置：

外设级中断使能 ：在 USART_CR1 寄存器中，设置 RXNEIE （接收中断使能）和 TCIE （发送完成中断使能）等位。这是外设自身的开关。
NVIC中断通道使能 ：调用 NVIC_EnableIRQ(USART1_IRQn); ，这相当于打开了NVIC（Nested Vectored Interrupt Controller）通往CPU的“大门”。
NVIC优先级分组与抢占/响应优先级设置 ：STM32的中断优先级分为抢占优先级（Preemption Priority）和响应优先级（Subpriority）。其分组方式由 SCB->AIRCR 寄存器的 PRIGROUP 字段决定。常见的分组是 NVIC_PriorityGroup_2 ，即2位抢占优先级 + 2位响应优先级。随后，通过 NVIC_SetPriority(USART1_IRQn, NVIC_EncodePriority(NVIC_PriorityGroup_2, 1, 0)); 设置一个具体的优先级值。

这三个步骤缺一不可。如果只做了第1步，中断请求无法到达CPU；如果只做了第1、2步而没有正确分组，可能导致中断无法嵌套或响应顺序混乱。在本例中，由于只有一个串口中断，我们可以将抢占优先级设为1（确保其高于SysTick等系统中断），响应优先级设为0。

3. 串口1初始化与中断服务函数实现

基于前述原理，我们现在可以着手编写一个完整的、可运行的串口1初始化与中断收发程序。该实现完全基于寄存器操作，不依赖任何高级库，旨在清晰地展示每一个配置步骤背后的工程意图。

3.1 初始化函数： `USART1_Init()`

该函数封装了所有必需的硬件配置步骤，其执行顺序严格遵循硬件依赖关系：时钟 -> GPIO -> NVIC -> USART。

void USART1_Init(void)
{
    // 1. 使能GPIOA和USART1的时钟
    RCC->APB2ENR |= RCC_APB2ENR_IOPAEN;   // 使能GPIOA时钟
    RCC->APB2ENR |= RCC_APB2ENR_USART1EN; // 使能USART1时钟

    // 2. 配置PA9(TX)和PA10(RX)为复用功能
    //    PA9: MODER[9] = 10b (复用), OTYPER[9] = 0 (推挽), OSPEEDR[9] = 11b (高速)
    GPIOA->MODER |= GPIO_MODER_MODER9_1;
    GPIOA->OTYPER &= ~GPIO_OTYPER_OT_9;
    GPIOA->OSPEEDR |= GPIO_OSPEEDER_OSPEEDR9;

    //    PA10: MODER[10] = 01b (输入), PUPDR[10] = 00b (浮空)
    GPIOA->MODER &= ~GPIO_MODER_MODER10;
    GPIOA->PUPDR &= ~GPIO_PUPDR_PUPDR10;

    // 3. 配置PA9和PA10的复用功能为AF7 (USART1)
    //    AFRH[1] (PA9) 和 AFRH[2] (PA10) 均设为 0x7
    GPIOA->AFR[1] &= ~0xF0; // 清除PA9的AF位
    GPIOA->AFR[1] |= 0x70;  // 设置PA9为AF7
    GPIOA->AFR[1] &= ~0xF00; // 清除PA10的AF位
    GPIOA->AFR[1] |= 0x700;  // 设置PA10为AF7

    // 4. 配置NVIC: 使能中断并设置优先级
    NVIC_EnableIRQ(USART1_IRQn);
    NVIC_SetPriority(USART1_IRQn, 1);

    // 5. 配置USART1寄存器
    //    a. 先禁止USART1，进行配置
    USART1->CR1 &= ~USART_CR1_UE;

    //    b. 配置波特率: PCLK2=84MHz, Baud=115200 -> BRR=0x2D9
    USART1->BRR = 0x2D9;

    //    c. 配置控制寄存器CR1:
    //       - UE=0 (已清零，待最后使能)
    //       - RE=1 (使能接收)
    //       - TE=1 (使能发送)
    //       - M=0 (8位数据)
    //       - PCE=0 (无奇偶校验)
    USART1->CR1 = USART_CR1_RE | USART_CR1_TE;

    //    d. 配置控制寄存器CR2: 停止位=1
    USART1->CR2 = 0; // 默认就是1位停止位

    //    e. 配置控制寄存器CR3: 无硬件流控
    USART1->CR3 = 0;

    // 6. 使能USART1和接收中断
    USART1->CR1 |= USART_CR1_UE; // 最后一步，使能外设
    USART1->CR1 |= USART_CR1_RXNEIE; // 使能接收中断
}

此函数的每一行代码都有其明确的目的。例如，在配置 AFR 寄存器时，我们使用 &= 和 |= 操作符进行位操作，而非直接赋值，这是为了确保不意外修改同一寄存器中其他引脚的复用配置，体现了良好的编程习惯。

3.2 中断服务函数（ISR）： `USART1_IRQHandler`

中断服务函数是串口通信的“心脏”，它必须在极短的时间内完成数据的搬运，以避免缓冲区溢出。其核心逻辑是： 查询状态 -> 处理事件 -> 清除标志 。

void USART1_IRQHandler(void)
{
    // 1. 读取状态寄存器SR，判断中断来源
    uint16_t sr = USART1->SR;

    // 2. 检查接收中断 (RXNE)
    if (sr & USART_SR_RXNE)
    {
        // 读取DR寄存器，自动清除RXNE标志
        uint8_t received_data = (uint8_t)USART1->DR;

        // 此处可添加数据处理逻辑，例如回显
        // 将接收到的数据立即发送回去
        while (!(USART1->SR & USART_SR_TXE)); // 等待发送寄存器空
        USART1->DR = received_data;
    }

    // 3. 检查发送完成中断 (TC)
    //    注意：此处仅为演示，实际应用中TC中断常用于通知“一帧发送完毕”
    if (sr & USART_SR_TC)
    {
        // TC标志在发送最后一个字节的停止位后置位
        // 可在此处执行后续操作，如关闭发送器或切换状态
        // 本例中，我们简单地清除它（写1清零）
        USART1->SR &= ~USART_SR_TC;
    }
}

该ISR的关键在于对 SR 寄存器的原子性读取。我们首先将 SR 的值读入一个局部变量 sr ，然后基于此快照进行多次位判断。这样做的好处是避免了在两次读取 SR 之间，其状态可能因硬件变化而产生不一致。此外，对于 RXNE ，我们通过读取 DR 来清除标志，这是硬件规定的唯一正确方式；而对于 TC ，我们则通过向 SR 的对应位写1来清除，这同样是数据手册明确指出的操作。

3.3 主循环与数据交互

初始化完成后，主循环只需进入一个无限等待状态。所有数据的收发均由中断自动完成。

int main(void)
{
    // 系统初始化（如SysTick, RCC等）...
    SystemInit();

    // 串口1初始化
    USART1_Init();

    // 主循环：等待中断发生
    while (1)
    {
        // 所有工作都在中断服务函数中完成
        // 主循环可以在此处执行其他任务，或进入低功耗模式
    }
}

至此，一个最小可行的串口通信系统已经构建完成。它能够稳定地接收PC端串口助手发送的每一个字节，并立即将其原样回传。这个看似简单的功能，背后却凝聚了对时钟树、总线、GPIO、中断控制器以及USART外设寄存器的深刻理解。

4. 实际调试与常见问题排查

在真实的开发过程中，编译通过只是万里长征第一步。更多的精力往往花费在调试与排错上。以下是几个在串口开发中最常遇到的“坑”，以及基于上述原理的快速定位方法。

4.1 “无输出”问题：从物理层到协议层的逐级排查

当发现串口没有任何数据输出时，应遵循“由近及远、由硬到软”的原则进行排查：
1. 物理连接 ：用万用表测量PA9引脚对地电压。在空闲状态下，它应为高电平（VDD）。如果为0V，说明GPIO配置错误或引脚被短路。
2. 时钟使能 ：在 USART1_Init() 函数中，在 RCC->APB2ENR |= ... 之后，立即添加一条 while(1); 。如果程序卡在这里，说明时钟使能失败，需检查RCC寄存器地址和位定义是否正确。
3. GPIO复用 ：使用逻辑分析仪或示波器观察PA9引脚。发送一个已知字节（如 0x55 ），应能看到清晰的UART波形（起始位、8个数据位、停止位）。如果波形缺失，问题必在GPIO复用配置或 USART_CR1 的 TE 位未置位。
4. 波特率误差 ：即使波形存在，如果PC端显示乱码，首要怀疑波特率。重新计算 BRR 值，或使用示波器测量实际波特率。一个经验法则是，误差超过3%就可能导致通信失败。

4.2 “接收丢包”问题：深入理解RXNE的生命周期

RXNE 标志位的管理是接收逻辑的核心。一个典型的错误是：

// 错误示范：在中断中不读取DR，只做其他处理
if (sr & USART_SR_RXNE)
{
    // 忘记读取DR！
    ProcessData(); // 这里耗时过长
}

这会导致 RXNE 一直保持置位，而新的数据到来时，旧数据被覆盖，造成丢包。正确的做法永远是： 在检测到 RXNE 后，第一件事就是读取 DR 。如果 ProcessData() 耗时较长，应将数据存入一个环形缓冲区（Ring Buffer），然后在主循环中处理，从而将中断服务时间降至最低。

4.3 “中断不触发”问题：NVIC配置的隐秘陷阱

中断不触发往往是最令人沮丧的问题。除了检查 NVIC_EnableIRQ() 和 NVIC_SetPriority() 外，还有一个极易被忽视的点： 中断向量表的重映射 。在某些启动配置中，向量表可能被重映射到SRAM或Flash的其他地址。此时，即使 USART1_IRQHandler 函数存在，CPU也无法跳转到它。解决方法是在 startup_stm32f407xx.s 文件中，确保 VECT_TAB_SRAM 或 VECT_TAB_FLASH 宏被正确定义，并且 SCB->VTOR 寄存器指向了正确的向量表起始地址。

我在一个实际项目中曾遇到过类似问题：一个原本工作的串口突然失效，反复检查代码无果。最终发现是由于启用了 __enable_irq() 全局中断使能，但在此之前， NVIC_SetPriorityGrouping() 被错误地调用了一次，导致 SCB->AIRCR 的 PRIGROUP 字段被设置为一个非法值，从而使所有中断被静默屏蔽。这个教训让我养成了在每次修改NVIC相关配置后，都用调试器单步跟踪 SCB->AIRCR 寄存器的习惯。

5. 从寄存器到库函数：HAL库的映射与思考

虽然本文聚焦于寄存器级编程，但理解其与HAL库的对应关系，有助于我们在不同项目中做出明智的技术选型。HAL库的 HAL_UART_Init() 函数，其内部实现正是对上述所有步骤的封装。

__HAL_RCC_GPIOA_CLK_ENABLE() 对应 RCC->APB2ENR |= RCC_APB2ENR_IOPAEN;
__HAL_RCC_USART1_CLK_ENABLE() 对应 RCC->APB2ENR |= RCC_APB2ENR_USART1EN;
GPIO_InitStruct.Alternate = GPIO_AF7_USART1 对应 GPIOA->AFR[1] |= 0x70070;
huart1.Init.BaudRate = 115200 对应 USART1->BRR = 0x2D9;
huart1.Init.WordLength = UART_WORDLENGTH_8B 对应 USART1->CR1 &= ~USART_CR1_M;
huart1.Init.StopBits = UART_STOPBITS_1 对应 USART1->CR2 = 0;
HAL_UART_Receive_IT(&huart1, &rx_buffer, 1) 对应 USART1->CR1 |= USART_CR1_RXNEIE;

HAL库的价值在于它提供了跨芯片的抽象层和成熟的错误处理机制，极大提升了开发效率。然而，其代价是代码体积增大、执行效率略低，以及在极端性能要求场景下缺乏精细控制能力。我的经验是：对于产品原型和快速验证，HAL库是首选；而对于电机控制、音频处理等实时性要求极高的场合，寄存器操作或LL库（Low Layer）则更为合适。关键在于，无论选择哪种方式，工程师都必须清楚其底层发生了什么，这样才能在出现问题时，直击要害，而非在API文档的迷宫中徒劳打转。

openvela

openvela 操作系统专为 AIoT 领域量身定制，以轻量化、标准兼容、安全性和高度可扩展性为核心特点。openvela 以其卓越的技术优势，已成为众多物联网设备和 AI 硬件的技术首选，涵盖了智能手表、运动手环、智能音箱、耳机、智能家居设备以及机器人等多个领域。

更多推荐

JavaSE-16

底层初始:内部有个 transient Object[] elementData→ 就是一个 Object 类型的数组,啥都能存,默认没放元素时,数组是空数组,一添加数据,才会真正分配空间。) { // 有没有下一个。set(int index, Object e)：将指定索引处的元素，替换成指定的元素，返回值为替换前的元素。add(int index, Object e)：在指定位置插入元素,指