华为算力是突破封锁了么？_DoctorD

DoctorD

23-11-22 15:27

3

算力长期看好，人工智能时代的锂电池。
锂电板块从15年就开始炒，到21年涨了多少，中间又历经了多少次调整。。。算力这点调整算啥啊，毛毛雨而已。
不过感觉短线资金目前玩这个板块也不容易赚钱，玩短线还是要追热点，产业逻辑什么的主要是指导做极长持股时需要分析的。

短线还是北交所新的投机天堂更爽（问题就是只有镰刀，没有韭菜，只能拼谁的镰刀更锋利），流动性太差，大佬们投点小钱爽一发调剂一下心情还是挺舒畅的，小资金去重仓搏命还是风险偏大，当然，最后肯定有人能创造短期几十倍奇迹的。

六幺我是巴二六六

23-11-21 22:14

0

大佬今天算力板块这么跌，还看好算力吗？

sjy970901

23-11-17 13:00

0

老师，一样。小票今天只干了西陇，毕竟题材日内主流，还是复合高度板。恒为昨天错过，今天吸了。中贝也拿了些。今年的涨幅前十基本都是算力票。情绪票连板也就6板，还没突破前高7板压制就有人吹对标三羊大帝了

DoctorD

23-11-17 12:53

2

没有，这个月坑还没填满，暂时先不莽情绪小票了，等新高了再说吧。
目前继续在算力里苟着，市场缩量，盘子比较大的股，的走势的确不太顺畅，昨天的恒为科技还没出，还有万手大哥在托底，大哥不撤单的话应该能封杀下跌空间，长期逻辑比较看好的票先苟一苟，看看下午能不能回流吧。

修戒

23-11-17 12:39

0

博士今天头铁了妖股吗？三伯，银宝，西陇科学？

我相信我能走出来

23-11-16 13:02

0

恒为逻辑硬那天小仓位板上进去了第二天被板块情绪错杀差点跌停也没高兴拿一刀割了。

DoctorD

23-11-16 12:41

5

这个月除了开局爽2天，后面都在艰难爬坑，看来回血还是要靠算力。。。
赛博卡车热度很高，但和我们国情不符，感觉用武之地不大。漂亮国几乎家家都有皮卡，也有相应的消费Xi惯，我们这大城市里家庭买卡车的消费观还是没形成，日常也没有多少拉货需求，买大件东西都是送货上门，偶尔有需求的话，叫个货拉拉什么的也很方便。高端卡车开出去也没有什么社交属性，总感觉有点鸡肋的产品。

至于英伟达新发布的定制三款芯片，基本和团队小伙伴们上次分析的一样，性能大砍特砍。。。

理论上H100比H20的速度快了6.68倍。据分析师Dylan Petal最新发布的一篇博文，即使H20的实际利用率能达到90%，其在实际多卡互联环境中的性能仍只能接近H100的50%。
也有媒体称，H20的综合算力仅相当于H100的20%，且由于增加了HBM显存和NVLink互联模块，算力成本显著提高。
英伟达已经做出这三款芯片的样品，H20 和 L20预计将于今年 12 月推出，而 L2将于明年 1 月推出。产品采样将于发布前一个月开始。
H20 Vs. H100先来看H100，拥有80GB HBM3内存，内存带宽为3.4Tb/s，理论性能为1979 TFLO P，性能密度（TFLOPs/Die size ）高达19.4，是英伟达当前产品线中最强大的GPU。
H20，拥有96GB HBM3内存，内存带宽高达4.0 Tb/s，均高于H100，但计算能力仅为296 TFLOP，性能密度为2.9，远不如H100。
理论上H100 相比H20 的速度快了6.68倍。但值得注意的是，这个比较是基于FP16 Tensor Core的浮点计算能力(FP16 Tensor Core FLOPs)，且启用了稀疏计算（减少运算量，因此速度会有显著提升），因此并不能全面反映其所有的计算能力。
另外，该GPU的热设计功耗为400W，低于H100的700W，并且在HGX解决方案(英伟达的GPU服务器方案)中可以进行8路GPU的配置，它还保留了900 GB/s的NVLink高速互联功能，同时还提供了7路MIG(Multi-Instance GPU，多实例GPU)的功能。
H100 SXM TF16（Sparsity）FLOPS = 1979
H20 SXM TF16（Sparsity）FLOPS = 296
根据Peta的LLM性能对比模型表明，H20在moderate batch size下峰值token/秒，比H100高出20%，在low batch size下的token to token延迟比H100还要低25%。这是由于将推理所需的芯片数量从2个减少到1个，如果再使用8位量化，LLAMA 70B模型可以在单个H20上有效运行，而不是需要2个H100。
值得一提的是，H20的计算能力虽然只有296个TFLOP，远不及H100的1979个，但如果H20的实际利用率MFU（目前H100的MFU仅为38.1%），这意味着H20实际能跑出270 TFLOPS，那么H20在实际多卡互联环境中的性能接近H100的50%。
从传统计算的角度来看，H20相比H100有所降级，但在LLM推理这一方面，H20实际上会比H100快了20%以上，理由是H20在某些方面与明年要发布的H200相似。注意，H200是H100的后继产品，复杂AI和HPC工作负载的超级芯片。
L20和L2配置更加精简与此同时，L20配备48 GB 内存和计算性能为239个TFLOP，而 L2 配置为 24 GB 内存和计算性能193个TFLOP。
L20基于L40，L2基于L4，但这两款芯片在LLM推理和训练中并不常用。
L20和L2均采用 PCIe 外形规格，采用了适合工作站和服务器的PCIe规格，相比Hopper H800和A800这些规格更高的型号，配置也更加精简。
但是英伟达用于AI和高性能计算的软件堆栈对某些客户来说非常有价值，以至于他们不愿放弃Hopper架构，即使规格降级也在所不惜。
L40 TF16 (Sparsity) FLOPs = 362
L20 TF16 (Sparsity) FLOPs = 239
L4 TF16 (Sparsity) FLOPs = 242
L2 TF16 (Sparsity) FLOPs = 193

简单汇总分析了一下，阉割版特供芯片实际性能大概是原版的20%~50%，黄氏一刀砍掉8成内功，感觉难堪大用。这里有点需要注意的是，用于AI和高性能计算的软件堆栈 的重要性，感觉这也许是我们之前分析时所忽略的问题，对于国产算力瓶颈的突破，除了硬件性能，调度软件方面带来的易用性和效率提高也是需要重视的，这也是恒为这个网络可视化及智能系统平台为什么突然大受重视的原因，也许现在很多年轻人从来没感受过在微软的可视化操作系统windows出现之前的Dos平台操作起来多复杂吧，任何简单的操作都需要用键盘敲上相应的代码才能实现，现在回忆起来已经感觉是上一辈子的遥远事情了。。。可视化系统的出现，简化了操作，自然而然地提升了效率，那是一个跨时代的变革，也造就了微软这家伟大的公司。

无风也无浪

23-10-28 17:14

0

英萎达技术会不会被华为拿下？
华为产能会不会满产？
这二个都成立，就没英萎达啥事了。
技术领先一时还是一世。
以华为的屎性，技术突破是肯定的。

黑木华

23-10-28 16:59

0

博士请教一下显卡线的微星明显有资金在运作但是它有点庄走的又相对独立不怎么跟国产算力这周末又有中美关系缓和的意思不知道该以什么样的锚定来拿这个票一直拿着总觉得没有信心

DoctorD

23-10-25 15:44

0

当然有，问题是玩短线的不一定能等得起。
我之前说过中际的业绩是看英伟达出货量的，英伟达算力被禁，中际的预期也要相应下调。
后续英伟达肯定也不会甘心成为大国博弈牺牲品，肯定不会放弃这么大的市场的，阉割版算力卡正在开发中，民用的4090一刀砍成4080super已经在路上了，商用的也要再砍几刀，砍的多了竞争力肯定会下降毋庸置疑，市占率会受影响。

另外中际是机构票，与近期市场风格不符。
现在有话语权的是量化和游资，他们都玩情绪股里激战正酣。

我现在长线是押宝华为算力和摩尔线程显卡了，短线就是跟热点了。

今天同花顺华为升腾板块也开新服了，早干啥去了，非得让VIP建了仓才开新服？。。。