登录注册写文章

2024-03-26 这个计算正确吗？

2024-03-26 这个计算正确吗？

预训练 Tiny-llamma 1.1B 模型需要 90天时间，16块A-100 (40显存）的显卡。数据量3 trillion个tokens。

这些训练数据，每个tokens如果按照每个占4字节来计算，则需要12TB的硬盘。

gpufuwuqi的价格是每个月1550。（这么便宜？）1550 * 16 *3 = 74400元。^[1]

查它的网站备案是厦门同力合创公司。这家公司有被投诉的记录。

胖哒云游客服联系不上不给予退款相关的服务厦门同力合创网络科技有限公司深圳分公司客服不处理,不予退款,服务不到位,联系不到客服

另外一个计算

TinyLlama is only a 1.1B parameter model. Yet, the project had to use 16 A100-40G GPUs over almost 3 months. Even on a very cheap cloud, e.g. $1 per A100-40G per hour, it would cost around $35,000.7 Feb 2024

https://www.reddit.com/r/LocalLLaMA/comments/1abzhg5/llama_2_models_smaller_than_1b/ ↩

最后编辑于：2024.03.26 02:06:17

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Rust 并发安全相关的几个概念（下）
引言本文介绍 Rust 并发安全相关的几个概念：Send、Sync、Arc，Mutex、RwLock 等之间的联...
Databend阅读 3,030评论 0赞 0
联想X220 + 黑苹果
原文:THINKPAD X220 MACOS HIGH SIERRA 10.13 INSTALLATION GUI...
Leekris阅读 14,305评论 0赞 1
Day162 | 遇见POWH3D（三） - justo、mantso语录2018-02-02
justo和mantso都指出之前的ethpyramid抄袭代码，除了有漏洞之外，算法也注定了团队是最大的收益者，...
自由算法阅读 4,505评论 0赞 0
2003-2014考研真题
**2014真题Directions:Read the following text. Choose the be...
又是夜半惊坐起阅读 13,394评论 0赞 23
关于angular8 升级到9样式问题 bootstrap4 reboot.scss
具体参考https://www.csdn.net/tags/NtzaYgzsMTcwOTMtYmxvZwO0O0O...
MAYDAY77阅读 3,392评论 0赞 1

赞1赞

赞赏

手机看全文