ITBear旗下自媒体矩阵:

​Unsloth Studio 发布:首个本地可视化大模型微调平台,显存占用降低 70%

   时间:2026-03-18 18:33:52 来源:CHINAZ编辑:快讯 IP:北京 发表评论无障碍通道
 

知名高性能微调库 Unsloth AI 正式推出了 Unsloth Studio。这是一款开源、无代码的本地可视化界面,旨在大幅降低软件工程师微调大语言模型(LLM)的门槛,让开发者彻底告别复杂的 CUDA 环境配置与高昂的硬件成本。

Unsloth Studio 的底层采用了由 Triton 语言编写的定制化反向传播内核,相比标准微调框架实现了质的飞跃:

训练速度翻倍:训练效率提升了2倍。

显存节省70%:在不损失模型精度的前提下,大幅减少了对 GPU 显存的依赖。

消费级显卡友好:开发者现在可以在 RTX4090或5090等单块消费级显卡上,微调原本需要多卡集群才能运行的8B 或70B 参数模型(如 Llama3.3、DeepSeek-R1)。

该平台将数据准备、训练到部署的完整生命周期整合进了一个直观的 Web UI 中:

可视化数据配方:引入节点式工作流,支持 PDF、JSONL 等多种格式的自动摄取,并能利用 NVIDIA DataDesigner 将杂乱文档转化为结构化的指令数据集。

强化学习支持:内置对 GRPO(群组相对策略优化)的支持。这种技术源自 DeepSeek-R1,能够在无需额外“批判模型”的情况下,让本地硬件也能训练具备多步逻辑推理能力的 AI。

一键导出部署:支持一键导出为 GGUF、vLLM 或 Ollama 格式,打通了从训练检查点到生产环境推理的“最后一公里”。

随着 Unsloth Studio 的发布,大模型微调正从依赖昂贵的云端 SaaS 转向更加私密、低成本的本地开发模式。它不仅为 Llama4和 Qwen 系列提供了即时兼容,更为企业所有权的定制化模型开发提供了强大工具。

技术详情:https://unsloth.ai/docs/new/studio

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version