在 Ascend NPU 上支持的模型#

本节介绍了 Ascend NPU 支持的模型，包括大语言模型、多模态语言模型、嵌入模型和重排序模型。包含主流的 DeepSeek/Qwen/GLM 系列。欢迎您根据业务需求启用各种模型。

大语言模型#

模型家族	推荐模型	支持 A2	支持 A3
DeepSeek	DeepSeek V1, V2, V3(V3.1,V3.2), R1	√	√
Qwen	Qwen 3, Qwen 3Moe	√	√
Llama	meta-llama/Llama-4-Scout-17B-16E-Instruct, AI-ModelScope/Llama-3.1-8B-Instruct, LLM-Research/Llama-3.2-1B-Instruct	×	×
Mistral	mistralai/Mistral-7B-Instruct-v0.2	√	√
Gemma	google/gemma-3-4b-it	√	√
Phi	microsoft/Phi-4-multimodal-instruct	√	√
OLMoE	allenai/OLMoE-1B-7B-0924	×	×
StableLM	stabilityai/stablelm-2-1_6b	×	×
Command-R	CohereForAI/c4ai-command-r-v01	×	×
Grok	huihui-ai/grok-2	×	×
ChatGLM	ZhipuAI/chatglm2-6b	×	×
InternLM 2 (书生·浦语)	Shanghai_AI_Laboratory/internlm2-7b	√	√
ExaONE 3	LGAI-EXAONE/EXAONE-3.5-7.8B-Instruct	√	√
XVERSE (元力元宇宙)	xverse/XVERSE-MoE-A36B	√	√
SmolLM	HuggingFaceTB/SmolLM-1.7B	√	√
GLM-4	ZhipuAI/glm-4-9b-chat	×	×
MiMo	XiaomiMiMo/MiMo-7B-RL	√	√
Arcee AFM-4.5B	arcee-ai/AFM-4.5B-Base	√	√
Persimmon	Howeee/persimmon-8b-chat	√	√
Ling (灵笔)	inclusionAI/Ling-lite	√	√
Granite	ibm-granite/granite-3.1-8b-instruct	√	√
Granite Moe	ibm-granite/granite-3.0-3b-a800m-instruct	√	√
DBRX (Databricks)	databricks/dbrx-instruct	×	×
百川 Baichuan 2 (7B, 13B)	baichuan-inc/Baichuan2-13B-Chat	×	×
文心一言 ERNIE-4.5 (4.5, 4.5MoE 系列)	baidu/ERNIE-4.5-21B-A3B-PT	×	×
MiniCPM (v3, 4B)	openbmb/MiniCPM3-4B	×	×
GPTOSS	openai/gpt-oss-120b	×	×

模型家族	推荐模型	支持 A2	支持 A3
Qwen-VL (Qwen2 系列)	Qwen/Qwen3-VL-235B-A22B-Instruct	×	×
DeepSeek-VL2	deepseek-ai/deepseek-vl2	×	×
Janus-Pro (1B, 7B)	deepseek-ai/Janus-Pro-7B	√	√
MiniCPM-V / MiniCPM-o	openbmb/MiniCPM-V-2_6	×	×
Gemma 3 (多模态)	google/gemma-3-4b-it	√	√
Mistral-Small-3.1-24B	mistralai/Mistral-Small-3.1-24B-Instruct-2503	×	×
Phi-4-multimodal-instruct	microsoft/Phi-4-multimodal-instruct	×	×
MiMo-VL (7B)	XiaomiMiMo/MiMo-VL-7B-RL	×	×
LLaVA (v1.5 & v1.6)	AI-ModelScope/llava-v1.6-34b	√	√
LLaVA-NeXT (8B, 72B)	lmms-lab/llava-next-72b	√	√
LLaVA-OneVision	lmms-lab/llava-onevision-qwen2-7b-ov	×	×
Kimi-VL (A3B)	Kimi/Kimi-VL-A3B-Instruct	×	×
GLM-4.5V (106B) / GLM-4.1V(9B)	ZhipuAI/GLM-4.5V	×	√
Llama 3.2 Vision (11B)	meta-llama/Llama-3.2-11B-Vision-Instruct	×	×

模型家族	推荐模型	支持 A2	支持 A3
E5 (基于 Llama/Mistral)	intfloat/e5-mistral-7b-instruct	×	×
GTE-Qwen2	iic/gte_Qwen2-1.5B-instruct	×	×
Qwen3-Embedding	Qwen/Qwen3-Embedding-8B	×	×
GME (多模态)	Alibaba-NLP/gme-Qwen2-VL-2B-Instruct	×	×
CLIP	AI-ModelScope/clip-vit-large-patch14-336	×	√
BGE	BAAI/bge-large-en-v1.5	×	×

模型家族	推荐模型	支持 A2	支持 A3
Llama3.1 Reward	Skywork/Skywork-Reward-Llama-3.1-8B-v0.2	×	√
InternLM 2 Reward	Shanghai_AI_Laboratory/internlm2-7b-reward	×	√
Qwen2.5 Reward - Math (数学)	Qwen/Qwen2.5-Math-RM-72B	×	√
Qwen2.5 Reward - Sequence (序列)	jason9693/Qwen2.5-1.5B-apeach	×	√
Gemma 2-27B Reward	Skywork/Skywork-Reward-Gemma-2-27B-v0.2	×	×

模型家族	推荐模型	支持 A2	支持 A3
BGE-Reranker	BAAI/bge-reranker-v2-m3	×	×