【信创】Qwen大模型部署 FineReport帮助文档|报表开发|报表使用|学习教程

历史版本2 :【信创】Qwen大模型部署返回文档

编辑时间:03-18 15:13 历史版本: 最新历史版本上一篇历史版本下一篇历史版本 内容长度:2861 图片数:1目录数:3 修改原因:调整页面

1. 概述编辑

本文将介绍在信创环境下，FineChatBI 如何链接大模型

硬件要求：

软件要求：

模型文件要求：

在部署 Qwen 模型时，模型文件需满足以下特定要求，以确保模型能在华为昇腾硬件平台上正常运行：

Qwen 微调后的权重文件必须为全精度，支持的数据类型为 fp16 或 fp32，并且文件类型仅支持 safetensor 格式。在模型导出过程中，请勿使用量化操作，量化会降低模型精度，影响推理结果的准确性。
如果使用 llama-factory 工具对模型进行微调，需要按照官方文档的要求配置 yaml 文件。
如果使用 Atlas 300I Duo 服务器进行模型部署，模型的 torch dtype 只能设置为 float16，不支持 bfloat16。

下载镜像

进入 mindie 镜像仓库，填写表单申请下载权限，审批通过后根据官方网站提供的配套版本选择合适的 mindie 镜像下载。

1）创建目录 /home/qwen2_5_sft_0929

mkdir -p /home/qwen2_5_sft_0929

2）使用 wget 命令将模型文件下载到指定目录

wget -P /home/qwen2_5_sft_0929 <模型下载地址>

3）解压模型文件

tar -xvzf /home/qwen2_5_sft_0929/qwen_sft_0929.tar.gz -C /home/qwen2_5_sft_0929 
//qwen_sft_0929.tar.gz为压缩包名，用户需根据实际更改

4）