增加Qwen3-Coder模型支持

2025-08-06 15:13:26 +08:00 · 2025-08-06 15:13:26 +08:00 · 80e66263a8
commit 80e66263a8
parent cca0402255
1 changed files with 42 additions and 0 deletions
--- a/llmengine/qwen3coder.py
+++ b/llmengine/qwen3coder.py
@ -0,0 +1,42 @@
 #!/share/vllm-0.8.5/bin/python
 # pip install accelerate
 from appPublic.worker import awaitify
 from appPublic.log import debug
 from ahserver.serverenv import get_serverenv
 from PIL import Image
 import torch
 from llmengine.base_chat_llm import BaseChatLLM, llm_register
 from transformers import AutoModelForCausalLM, AutoTokenizer
 class Qwen3CoderLLM(BaseChatLLM):
 	def __init__(self, model_id):
 		self.tokenizer = AutoTokenizer.from_pretrained(model_id)
 		self.model = AutoModelForCausalLM.from_pretrained(
 			model_id,
 			torch_dtype="auto",
 			device_map="auto"
 		)
 		self.model_id = model_id
 	def build_kwargs(self, inputs, streamer):
 		generate_kwargs = dict(
 			**inputs,
 			streamer=streamer,
 			# do_sample=True,
 			# eos_token_id=self.tokenizer.eos_token_id
 			max_new_tokens=65536
 		)
 		return generate_kwargs
 	def _messages2inputs(self, messages):
 		debug(f'-----------{messages=}-----------')
 		text = self.tokenizer.apply_chat_template(
 			messages, 
 			tokenize=False,
 			add_generation_prompt=True
 		)
 		debug(f'{text=}, {type(text)=}')
 		return self.tokenizer([text], return_tensors="pt").to(self.model.device)
 llm_register("Qwen/Qwen3Coder", Qwen3LLM)