感谢作者的工作!! 我想了解一下Intern-S1-mini的模型架构相较于Qwen3有什么区别吗,是否能通过swift框架直接sft微调呢
感谢作者的工作!!
我想了解一下Intern-S1-mini的模型架构相较于Qwen3有什么区别吗,是否能通过swift框架直接sft微调呢