#9RedditT2未读
Qwen3.6-35B-A3B Q4:8GB 3070 Ti 上跑 262k 上下文、30+ tok/s
来源:/u/Alternative-Cat-1347 / reddit ·
LocalLLaMA 用户分享 Qwen3.6-35B-A3B Q4 在 8GB RTX 3070 Ti 上支持 262k 上下文并达到 30+ tok/s 的本地推理表现。
推荐理由:非常贴合本地推理、长上下文、低显存部署和 Agent 运行成本评估;值得验证配置和复现条件。
9 / 10 打开原文