深潮 TechFlow 消息,3 月 17 日,据 Tether CEO Paolo Ardoino 披露,Tether AI 团队发布了新版 QVAC Fabric,集成跨平台 BitNet LoRA 框架,可在消费级 GPU 及智能手机上实现十亿参数级大模型的训练与推理。
新版 QVAC Fabric LLM 首次实现了 BitNet LoRA 微调与推理在 AMD、Intel、Apple Metal 及移动端 GPU 上的跨平台运行。在旗舰设备上,GPU 推理速度较 CPU 提升 2 至 11 倍,内存占用较全精度模型减少最高 90%。Tether 团队已在 Pixel 9、S25 及 iPhone 16 等旗舰手机上完成最高 38 亿参数模型的微调,并在 iPhone 16 上实现最高 130 亿参数模型的微调。相关代码已开源至 GitHub。




