工作电脑 lenovo 昭阳 K14 上班的路上,在接近西山的北清路上,月亮挂在山尖。 为我的小黄蜂自行车开发了一个模型,预测下一次的保养时间,...
FastChat [https://github.com/modelscope/modelscope-classroom/blob/main/L...
以下从云厂商平台、垂直行业方案、开源工具链等维度,梳理国内外主流的大模型开发平台,结合技术特性与行业适配性进行对比分析: 一、云厂商全栈平台 平...
不同模型的参数精度不同,以下仅为参考。以下是不同参数规模模型对应的硬件配置对比表格,包含关键指标和适用场景: 参数规模显存需求推荐显卡(NVID...
一、LoRA核心技术:大模型的「高效笔记法」(用1%的力气,拿99%的效果) 1. LoRA原理:从「全量抄书」到「划重点」的逆袭 核心逻辑:预...
一、大模型训练核心概念:从预训练到微调(大模型的 “养成记”:从识字到刷题) 1. 预训练:模型的九年义务教育(识字阶段) 定义:用海量文本(比...
大模型概念://www.greatytc.com/p/a91b9eb15656[//www.greatytc.com/p/a...
在使用LoRA对DeepSeek R1进行微调时,LoraConfig中的参数设置对模型性能和训练效率有重要影响。下面详细解释各参数含义及调整策...
一、基础知识 Sphinx,这是一个非常流行的文档生成工具,主要用于为 Python 项目、开源库、技术文档等生成美观的 HTML、PDF、EP...