MiniCPM-V-2_6与STM32CubeMX集成开发：从模型到嵌入式系统的全流程

本文介绍了如何在星图GPU平台上自动化部署MiniCPM-V-2_6镜像，实现轻量级视觉语言模型的高效应用。该平台简化了模型获取与转换流程，用户可快速将模型集成至STM32等嵌入式系统，开发出具备实时图像识别与交互功能的智能设备，例如通过摄像头进行物体识别并通过串口反馈结果。

钭胥冉

89人浏览 · 2026-03-07 01:33:08

钭胥冉 · 2026-03-07 01:33:08 发布

MiniCPM-V-2_6与STM32CubeMX集成开发：从模型到嵌入式系统的全流程

1. 引言

你是不是也想过，把一个能看懂图片、能对话的AI模型，塞进一个小小的单片机里？听起来像是科幻电影里的情节，但今天，我们就要把这个想法变成现实。

想象一下，一个巴掌大的开发板，接上一个摄像头，就能实时识别眼前的物体，还能通过串口告诉你它看到了什么。这背后，就是MiniCPM-V-2_6这样的轻量级视觉语言模型，和STM32CubeMX这个强大的开发工具在联手工作。

这篇文章，就是带你一步步走通这个全流程。从在云端把模型训练好、打包好，到在本地用STM32CubeMX搭好硬件框架，再到把模型推理的代码“嫁接”进去，最后让它在真实的板子上跑起来。整个过程，我会尽量用大白话讲清楚，即使你之前没怎么接触过嵌入式AI，也能跟着做下来。

我们的目标很简单：让你亲手打造一个能“看见”并“思考”的嵌入式设备。准备好了吗？我们开始吧。

2. 环境与工具准备

工欲善其事，必先利其器。在动手写代码之前，我们得先把“战场”布置好。这一部分，我们来盘点一下需要哪些软件和硬件，并把它们安装配置妥当。

2.1 硬件清单

首先来看看需要哪些硬件家伙什儿：

STM32开发板：这是我们项目的大脑。建议选择主频高一点、内存（RAM）大一点的型号，比如STM32H7系列或者STM32F7系列。因为跑AI模型比较“吃”资源。我手头用的是一块STM32H743ZI Nucleo板，它有足够的RAM和算力。
摄像头模块：模型的“眼睛”。OV2640、OV5640这类常用的摄像头模块都可以，最好选择支持DCMI（数字摄像头接口）的，这样和STM32连接起来更高效。我用的是一块OV2640。
USB转TTL串口模块：这是我们的“传声筒”。用来在电脑和开发板之间传递信息，比如把模型识别的结果从板子发送到电脑上显示。CH340、FT232这些型号都行。
杜邦线若干：用来连接以上所有模块。
一台电脑：这个就不用多说了。

2.2 软件工具安装

硬件齐了，软件也得跟上。我们需要以下几样：

STM32CubeMX：这是ST官方的图形化配置工具，堪称STM32开发的“瑞士军刀”。它能帮你自动生成芯片初始化代码，配置时钟、外设引脚，大大节省时间。去ST官网下载安装即可，记得安装对应的HAL库。
集成开发环境（IDE）：
- Keil MDK-ARM (uVision)：老牌嵌入式IDE，对STM32支持很好，但个人版有代码大小限制。
- STM32CubeIDE：ST自家基于Eclipse的免费IDE，和CubeMX无缝集成，用起来很方便。我这次教程就以它为例。两者任选其一，建议新手直接用STM32CubeIDE，省去配置的麻烦。
串口调试助手：用来在电脑上接收开发板发来的数据。Putty、SecureCRT或者国产的XCOM、SSCOM都行。
Python环境（可选）：如果你需要在电脑上预先处理模型，或者验证一些数据，一个Python环境会很有帮助。推荐安装Anaconda来管理环境。

把上面这些软件下载好、安装好，我们的基础准备就完成了。接下来，我们去云端把模型“锻造”好。

3. 在星图平台准备模型

模型是AI应用的核心。对于嵌入式设备来说，我们需要的模型必须足够“瘦身”，同时保持一定的精度。MiniCPM-V-2_6就是一个为边缘设备设计的轻量级多模态模型。我们不需要从零开始训练，而是利用星图这样的AI平台，获取一个已经优化好的、适合部署的模型版本。

3.1 获取与转换模型

通常，研究人员会发布预训练好的模型权重，格式可能是PyTorch的 .pth 文件或者TensorFlow的格式。但是，这些格式不能直接在C语言的嵌入式环境中运行。所以，我们需要进行模型转换。

寻找模型资源：首先，在星图平台的模型库或开源社区（如Hugging Face、ModelScope）找到MiniCPM-V-2_6的官方发布页面。下载预训练好的模型权重文件。
理解模型格式：嵌入式部署通常需要将模型转换为更紧凑、推理效率更高的格式。常见的终端格式有：
- TFLite Micro：TensorFlow Lite for Microcontrollers的格式，非常适合微控制器。
- ONNX Runtime：一种开放的模型格式，有专门的嵌入式运行时。
- 供应商特定格式：像ST的X-CUBE-AI工具链，就支持将Keras、TFLite等格式转换为它自家的优化格式。你需要根据后续计划使用的推理引擎来选择转换目标。例如，如果你打算用ST的X-CUBE-AI，那最好先将模型转换为TFLite格式。

执行模型转换：这一步可能需要一些Python脚本。以转换为TFLite为例，你可能会用到类似下面的代码框架（具体参数需根据模型调整）：

import tensorflow as tf

# 1. 加载原始模型（这里以TensorFlow SavedModel为例）
model = tf.saved_model.load(‘path/to/minicpm-v-2_6_savedmodel’)

# 2. 获取模型的推理函数（具体方法取决于模型保存方式）
infer = model.signatures[‘serving_default’]

# 3. 创建TFLite转换器
converter = tf.lite.TFLiteConverter.from_concrete_functions([infer])

# 4. 设置优化选项（对嵌入式设备至关重要！）
converter.optimizations = [tf.lite.Optimize.DEFAULT]
# 可以尝试量化以进一步减小模型体积
# converter.representative_dataset = ... # 提供代表性数据用于量化校准
# converter.target_spec.supported_ops = [tf.lite.OpsSet.TFLITE_BUILTINS_INT8]
# converter.inference_input_type = tf.uint8
# converter.inference_output_type = tf.uint8

# 5. 转换模型
tflite_model = converter.convert()

# 6. 保存转换后的模型
with open(‘minicpm-v-2_6.tflite’, ‘wb’) as f:
    f.write(tflite_model)

转换成功后，你会得到一个 .tflite 文件，它比原始模型文件小得多，并且为嵌入式推理做了优化。

3.2 模型简化与验证

转换后的模型，在部署到设备之前，最好先在PC环境进行验证。

简化输入/输出：确保你清楚模型需要什么样的输入（例如，归一化后的图像数组）以及会产生什么样的输出（例如，分类标签的索引或概率分布）。
编写验证脚本：用Python写一个简单的脚本，用转换后的TFLite模型对一张测试图片进行推理，看看输出是否合理。这能确保转换过程没有出错。
记录模型信息：记下模型的输入维度（例如 224x224x3）、数据类型（例如 float32 或 uint8），以及输出结构。这些信息在后续编写嵌入式代码时会用到。

完成这一步，我们就得到了一个“便携式”的模型文件。接下来，该为它在STM32上搭建一个“家”了。

4. 使用STM32CubeMX配置项目

现在，我们打开STM32CubeMX，开始为我们的AI应用搭建硬件和底层软件框架。这个过程就像搭积木，通过图形化界面配置，让CubeMX帮我们生成正确的初始化代码。

4.1 创建新工程与芯片选型

启动STM32CubeMX，点击 New Project。
选择MCU：在Part Number搜索框里输入你的开发板主控型号，比如 STM32H743ZITx。选中它，然后点击 Start Project。
工程设置：给项目起个名字，比如 MiniCPM_V_Embedded。选择好工程保存的路径。在 Toolchain / IDE 下拉菜单里，选择 STM32CubeIDE。这样生成的项目可以直接用CubeIDE打开。

4.2 配置系统核心与外设

这是最关键的一步，我们要配置好时钟和各个需要用到的外设。

时钟配置（RCC）：
- 在 Pinout & Configuration 标签页，找到 System Core 下的 RCC。
- 将 High Speed Clock (HSE) 和 Low Speed Clock (LSE) 都设置为 Crystal/Ceramic Resonator（如果你的板子有外部晶振的话）。这能提供更精确的时钟源。
- 然后切换到 Clock Configuration 标签页。在这里，你可以像调节齿轮一样配置系统的时钟树。将HCLK（系统主时钟）设置到芯片允许的最高频率（比如STM32H743可以到480MHz），以获取最佳性能。CubeMX会自动检查配置是否有效，出现红色警告就要调整。
摄像头接口（DCMI）配置：
- 回到 Pinout & Configuration 标签页，在左侧 Connectivity 中找到 DCMI。
- 将其模式设置为 Enabled。
- 然后在下方出现的 Parameter Settings 中，根据你的摄像头模块（如OV2640）的数据手册，配置数据宽度（例如8位）、像素时钟极性、数据使能极性等。这些设置需要和摄像头模块的时序匹配。
- 配置完成后，CubeMX会自动分配DCMI的数据引脚（D0-D7）、行同步、场同步、像素时钟等引脚。你可以检查一下这些引脚分配是否和你的硬件连接一致。
调试输出接口（UART）配置：
- 在 Connectivity 中找到 USARTx（比如USART3）。
- 将其模式设置为 Asynchronous（异步通信）。
- 在 Parameter Settings 中，设置波特率（比如 115200 Bits/s），数据位 8，停止位 1，无校验。
- 这样我们就配置好了一个串口，用来向电脑发送识别结果。
其他可能需要的配置：
- DMA：为了高效传输摄像头数据，强烈建议为DCMI配置DMA（直接存储器访问）。在 DCMI 的配置里，找到DMA Settings，添加一个DMA请求，方向设为 Peripheral To Memory。这样摄像头数据可以不经过CPU直接存入内存，节省大量CPU资源。
- 定时器：如果需要控制帧率或者做定时任务，可以配置一个定时器。
- GPIO：可能还需要一些普通IO口来控制摄像头的复位、电源，或者连接LED指示灯。

4.3 生成工程代码

所有外设配置好后，就可以生成代码了。

点击顶部菜单的 Project Manager 标签页。
在 Project 子标签下，再次确认 Toolchain / IDE 是 STM32CubeIDE。
在 Code Generator 子标签下，我推荐勾选：
- Generate peripheral initialization as a pair of ‘.c/.h’ files per peripheral：这样每个外设的代码单独成文件，结构清晰。
- Backup previously generated files when re-generating：重新生成代码时备份旧文件，安全。
最后，点击右上角的 GENERATE CODE。CubeMX会生成一个完整的STM32CubeIDE工程。

现在，硬件底层的框架就搭好了。CubeMX已经帮我们写好了初始化时钟、GPIO、DCMI、UART、DMA的所有代码。接下来，我们要把AI模型的“大脑”接进来了。

5. 集成模型推理代码

有了CubeMX生成的硬件驱动框架，我们现在需要编写中间层代码，把摄像头采集的图像“喂”给模型，并把模型的“思考结果”通过串口送出去。这是整个项目承上启下的部分。

5.1 项目结构规划

在CubeIDE中打开生成的项目，一个好的代码结构能让后续开发维护更轻松。我建议在 Src 和 Inc 文件夹下新建几个文件：

你的项目/
├── Core/
│   ├── Inc/
│   │   ├── ai_model.h      // 模型推理相关函数声明
│   │   ├── image_utils.h   // 图像预处理函数声明
│   │   └── app.h           // 主应用逻辑声明
│   └── Src/
│       ├── ai_model.c      // 模型推理实现（包含模型数据）
│       ├── image_utils.c   // 图像预处理实现
│       └── app.c           // 主应用逻辑实现
├── X-CUBE-AI/ (如果你使用ST的AI扩展包)
└── ...

5.2 图像采集与预处理

模型不能直接处理原始的摄像头数据。我们需要通过DCMI驱动获取图像，然后进行预处理。

启动DCMI捕获：在 app.c 的某个初始化函数里（比如在 main 初始化所有外设后），调用HAL库函数启动DCMI的DMA捕获。

// 假设定义了一个帧缓冲区
uint8_t camera_frame_buffer[320*240*2]; // 例如QVGA分辨率，RGB565格式

// 启动DCMI DMA捕获
HAL_DCMI_Start_DMA(&hdcmi, DCMI_MODE_SNAPSHOT, (uint32_t)camera_frame_buffer, 320*240*2/4);

图像预处理函数：在 image_utils.c 中实现预处理。对于MiniCPM-V这类模型，预处理通常包括：

格式转换：将摄像头采集的RGB565或YUV格式，转换为模型需要的RGB888或BGR格式。
尺寸缩放：将图像缩放到模型规定的输入尺寸（如224x224）。
归一化：将像素值从[0, 255]归一化到模型训练时使用的范围（如[-1, 1]或[0, 1]）。这是一个简单的缩放和裁剪示例（伪代码）：

void preprocess_image(uint8_t* src, int src_w, int src_h, float* dst, int dst_w, int dst_h) {
    // 简单的双线性插值缩放
    float scale_x = (float)src_w / dst_w;
    float scale_y = (float)src_h / dst_h;
    for (int y = 0; y < dst_h; y++) {
        for (int x = 0; x < dst_w; x++) {
            // 计算源图像坐标
            float src_x = x * scale_x;
            float src_y = y * scale_y;
            // 双线性插值获取像素值 (此处简化，实际需处理RGB三个通道)
            float pixel_value = bilinear_interpolate(src, src_w, src_h, src_x, src_y);
            // 归一化并存储
            dst[y*dst_w + x] = (pixel_value / 255.0 - 0.5) / 0.5; // 示例归一化
        }
    }
}

5.3 集成推理引擎与运行模型

这是最核心的一步。你需要将第3步准备好的模型文件（如 .tflite）集成到项目中，并调用推理引擎。

嵌入模型数据：将 minicpm-v-2_6.tflite 文件转换为C语言数组。可以使用 xxd 或 bin2c 这类工具。
```
xxd -i minicpm-v-2_6.tflite > model_data.c
```
这会在 model_data.c 中生成一个 unsigned char 数组，比如 g_model_data[]。把这个数组放到 ai_model.c 中。

初始化推理引擎：在 ai_model.c 的初始化函数里，加载这个模型数据，并初始化TFLite Micro解释器（如果你用TFLite Micro）。

#include “tensorflow/lite/micro/all_ops_resolver.h”
#include “tensorflow/lite/micro/micro_interpreter.h”
#include “tensorflow/lite/schema/schema_generated.h”

static const tflite::Model* model = nullptr;
static tflite::MicroInterpreter* interpreter = nullptr;
static TfLiteTensor* input_tensor = nullptr;
static TfLiteTensor* output_tensor = nullptr;

uint8_t tensor_arena[1024 * 100]; // 根据模型大小调整，这是Tensor Arena

int ai_model_init(void) {
    // 1. 加载模型
    model = tflite::GetModel(g_model_data);
    // 2. 注册模型需要的所有操作
    static tflite::AllOpsResolver resolver;
    // 3. 构建解释器
    static tflite::MicroInterpreter static_interpreter(
        model, resolver, tensor_arena, sizeof(tensor_arena));
    interpreter = &static_interpreter;
    // 4. 分配内存
    TfLiteStatus allocate_status = interpreter->AllocateTensors();
    if (allocate_status != kTfLiteOk) {
        // 处理错误
        return -1;
    }
    // 5. 获取输入输出Tensor指针
    input_tensor = interpreter->input(0);
    output_tensor = interpreter->output(0);
    return 0;
}

执行推理：编写推理函数，将预处理后的图像数据填入输入Tensor，调用推理，并获取结果。

int ai_model_infer(float* preprocessed_image_data) {
    // 1. 将数据拷贝到输入Tensor
    memcpy(input_tensor->data.f, preprocessed_image_data, input_tensor->bytes);
    // 2. 调用推理
    TfLiteStatus invoke_status = interpreter->Invoke();
    if (invoke_status != kTfLiteOk) {
        return -1;
    }
    // 3. 从输出Tensor中读取结果
    // 假设输出是分类概率
    float* output_data = output_tensor->data.f;
    // ... 处理输出数据，例如找到最大概率的类别
    int predicted_class = 0;
    float max_prob = output_data[0];
    for (int i = 1; i < output_tensor->dims->data[1]; i++) {
        if (output_data[i] > max_prob) {
            max_prob = output_data[i];
            predicted_class = i;
        }
    }
    return predicted_class; // 返回识别结果
}

5.4 整合应用逻辑

最后，在 app.c 的主循环或中断回调函数中，把上面所有的模块串起来。

在DCMI帧中断中触发处理：可以配置DCMI在捕获完一帧后产生中断。

在中断服务程序或主循环中：

调用 preprocess_image 处理原始帧数据。
调用 ai_model_infer 进行推理。
将推理结果（如类别ID）通过 HAL_UART_Transmit 发送到串口。

// 在DCMI帧捕获完成中断回调函数中
void HAL_DCMI_FrameEventCallback(DCMI_HandleTypeDef *hdcmi) {
    // 1. 停止DMA，防止数据被覆盖
    HAL_DCMI_Stop(&hdcmi);
    // 2. 预处理
    float input_buffer[224*224*3];
    preprocess_image((uint8_t*)camera_frame_buffer, 320, 240, input_buffer, 224, 224);
    // 3. 推理
    int result = ai_model_infer(input_buffer);
    // 4. 通过串口发送结果
    char msg[50];
    sprintf(msg, “Detected Class: %d\r\n”, result);
    HAL_UART_Transmit(&huart3, (uint8_t*)msg, strlen(msg), 1000);
    // 5. 重新启动捕获下一帧
    HAL_DCMI_Start_DMA(&hdcmi, DCMI_MODE_SNAPSHOT, (uint32_t)camera_frame_buffer, 320*240*2/4);
}

代码集成完毕，是时候把它烧录到板子上，看看它到底能不能“看见”了。

6. 板级调试与性能优化

把程序编译下载到开发板后，真正的挑战才刚刚开始。你可能会遇到各种问题，从根本没反应到识别结果乱七八糟。别担心，这是嵌入式开发的常态。我们一步步来排查和优化。

6.1 基础调试与问题排查

首先，确保最基本的硬件和软件链路是通的。

电源与连接检查：确保所有模块供电正常，杜邦线连接牢固，特别是摄像头的数据线和时钟线。接触不良是导致图像花屏或DCMI无法工作的常见原因。
串口打印调试信息：在程序的关键节点（如初始化成功、开始捕获、预处理完成）添加串口打印语句。这是嵌入式调试最朴实但最有效的方法。确保你能收到这些信息，这能帮你定位程序卡在了哪一步。
```
printf(“[INFO] AI Model Init Success.\r\n”);
```
验证图像采集：在发送给模型之前，先把摄像头采集的原始图像数据通过串口发送到PC，并用工具（如Python的Matplotlib）显示出来。看看图像是否完整、颜色是否正确。如果图像是乱的，问题可能出在DCMI配置（时钟极性、数据格式）或摄像头初始化上。
简化推理测试：先不连接摄像头，用一个在代码里预定义好的、简单的测试数组（比如全零或固定图案）作为模型输入，看推理是否能正常执行并输出一个固定结果。这可以排除图像采集和预处理环节的问题。

6.2 内存与性能优化

当基本功能跑通后，我们就要关注效率和稳定性了。嵌入式资源紧张，优化是永恒的主题。

内存使用分析：
- Tensor Arena：这是TFLite Micro运行时的工作内存。如果 tensor_arena 大小不够，AllocateTensors() 会失败。如果分配太大，又浪费宝贵的RAM。你需要根据模型复杂度调整其大小。可以在初始化失败时逐步增大这个值试试。
- 帧缓冲区：摄像头帧缓冲区往往很大（QVGA RGB565就有150KB）。确保它被放在RAM中合适的位置（如DMA可访问的地址），并且没有和其他大数组重叠。
- 使用工具：STM32CubeIDE有内存使用分析视图，可以帮你查看全局变量和堆栈的使用情况，防止溢出。
推理速度优化：
- 降低输入分辨率：如果模型支持，使用更低的输入图像分辨率（如从224x224降到128x128）能极大减少计算量。
- 启用硬件加速：如果你的STM32芯片有硬件AI加速器（如STM32H7系列的Chrom-ART Accelerator™或某些系列的NN加速器），务必启用它。这通常需要特定的库和模型格式支持（如ST的X-CUBE-AI工具链）。
- 模型量化：在模型转换时（第3步），使用INT8量化代替FP32，不仅能减小模型体积，在支持整数运算的硬件上还能大幅提升速度。不过可能会带来轻微的精度损失。
- 优化预处理：图像缩放的循环是计算热点。可以尝试使用查表法、定点数运算，或者利用STM32的DSP库（如ARM CMSIS-DSP）中的优化函数来加速。
- 测量与定位瓶颈：使用一个GPIO引脚和示波器（或逻辑分析仪）来测量关键函数的执行时间。在函数开始时拉高引脚，结束时拉低，就能看到脉冲宽度，即执行时间。这能帮你找到最耗时的部分，进行针对性优化。

6.3 提高识别鲁棒性

最后，我们让系统变得更“聪明”更稳定。

添加看门狗：在 main 循环中喂狗，防止程序跑飞导致死机。
错误恢复机制：在DCMI DMA传输错误、推理失败等情况下，不要卡死，而是进行复位或重试操作。
后处理与滤波：对于连续视频流，可以对连续多帧的识别结果进行平滑滤波（如取滑动平均），避免结果抖动。比如，连续3帧都识别为同一类别，才认为结果是可靠的。
光照适应性：如果条件允许，可以在预处理中加入简单的自动亮度/对比度调整，让模型在不同光照环境下表现更稳定。

调试和优化是一个迭代的过程，可能需要反复多次。每解决一个问题，系统就变得更可靠一点。

7. 总结

走完这一整套流程，从云端模型到嵌入式设备，感觉就像完成了一次小小的“迁徙”。把原本在强大服务器上运行的AI模型，精简、打包，最终让它在一个资源受限的单片机上安家落户，并真正地工作起来，这个过程本身就充满了挑战和乐趣。

回顾一下，最关键的几个环节无非是：拿到一个合适的轻量级模型并做好转换；用STM32CubeMX像搭积木一样把硬件底层配置好，这是基础，省去了我们大量查手册、写寄存器的时间；然后就是编写中间层代码，把图像采集、预处理、模型推理、结果输出这几个模块像管道一样连接起来；最后，在真实的板子上反复调试、优化，解决那些预料之中和预料之外的问题。

第一次尝试，可能会被DCMI的时序、DMA的配置、内存不足这些问题困扰，这都很正常。嵌入式AI开发就是这样，需要软件和硬件的知识相结合。但当你看到串口终端第一次打印出正确的识别结果时，那种成就感是非常实在的。

这个项目只是一个起点。基于这个框架，你可以尝试更换不同的模型，实现物体识别、手势识别，甚至简单的视觉问答。也可以优化预处理和后处理逻辑，提升准确率和速度。希望这个教程能帮你打开嵌入式AI开发的大门，后面还有更多有趣的事情等着你去探索。

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

openvela

openvela 操作系统专为 AIoT 领域量身定制，以轻量化、标准兼容、安全性和高度可扩展性为核心特点。openvela 以其卓越的技术优势，已成为众多物联网设备和 AI 硬件的技术首选，涵盖了智能手表、运动手环、智能音箱、耳机、智能家居设备以及机器人等多个领域。

更多推荐

Eclipse Mraa项目实战：使用I2C传感器构建环境监测系统

Eclipse Mraa是一个开源的嵌入式Linux库，专为简化Raspberry Pi等嵌入式设备上的GPIO、I2C、SPI和UART等硬件接口访问而设计。本指南将带你通过实战案例，使用Eclipse Mraa库和I2C传感器快速构建一个功能完整的环境监测系统，适合嵌入式系统开发者和IoT爱好者入门学习。## 📋 准备工作：环境与组件### 核心组件清单- **硬件**：Raspb

openvela

Eclipse Mraa高级功能：中断处理与多线程同步的实战技巧

Eclipse Mraa作为简化嵌入式Linux硬件接口访问的开源库，不仅提供基础的GPIO、I2C等接口操作，还内置了强大的中断处理与多线程同步机制。本文将深入解析这两项高级功能的实现原理与实战技巧，帮助嵌入式开发者构建更高效、可靠的物联网应用。## 一、中断处理：实时响应硬件事件的核心机制中断是嵌入式系统实现实时响应的关键技术。Mraa通过简洁的API封装了底层中断处理逻辑，支持GPI

openvela

Leather Dress Collection快速上手：Python脚本一键启动app.py全流程

本文介绍了如何在星图GPU平台上自动化部署Leather Dress Collection镜像，快速实现皮革服装风格图像生成。该镜像基于Stable Diffusion 1.5的LoRA模型集合，提供12种不同风格的皮革服装设计，用户可通过Python脚本一键启动app.py，轻松应用于时尚设计、电商展示等场景。