下载
登录/ 注册
主页
论坛
视频
热股
可转债
基金
下载
下载

华为算力是突破封锁了么?

23-10-20 12:33 2379次浏览
DoctorD
+关注
博主要求身份验证
登录用户ID:
昨晚和小伙伴们研究了一下漂亮国新的算力管制规则,什么tpp,td之类的专业术语就不解释了,总之研究完就一个感觉,宁可错杀,绝不放过。。。连民用的 4090芯片都要管制(显卡成品可以豁免)
这摆明了以后只能抛弃一切幻想,自己搞算力芯片了,否则未来人工智能时代肯定是要落后的,第四次工业革命是各国改变国运的重要契机,漂亮国这么搞绝对不仅是毛衣战这么简单,未来商用的肯定不会放松管制,民用显卡芯片明年的5090,5080,2年后的6060等也跑不了被管制的命运。

今天新能源赛道和地产领涨,然并没有带起大盘向上共振,个人对这样超跌反弹板块的持续性不是太看好。。。
主观上还是看好华为,科大讯飞 透露当前华为昇腾910B能力已经基本做到可对标英伟达 A100,A100可是最高端的级别了,真搞出来这就算突破封锁了吧,就不知道产能行不行能不能满足市场的需求。
华为算力方向,四川长虹 走势比预期顽强,但是市场还在困难模式,看有资金在搞,也控仓跟了些,希望不要被坑吧。
打开淘股吧APP
7
评论(45)
收藏
展开
热门 最新
DoctorD

23-10-23 12:58

7
另外,团队小伙伴周末几天都在加班研究漂亮国的ECCN 3A090和4A090条款的具体内容,以及《半导体出口管制暂行最终规则(SME IFR)》,和《实施额外出口管制:先进计算单元,超级计算与半导体终端用途;对临时最终规则的更新与修正(AC/SIFR)》这些原版文件,当小伙伴们看完了bis多达295页和141页的两个官方文件后,我们发现一个重大问题,目前市场绝大多数解读“显卡禁售”和“民用消费级显卡豁免”的解读都是断章取义的,我们团队自己研究得出的结论是,4090显卡其实并未禁止销售,但是显卡不能用于生产、开发、使用、操作、安装、维护、修理、翻新这些活动,对于以上被禁活动的界定,漂亮国bis在SME IFR文档的第7到53页中对这些词的含义和包含范围,进行了详细的解释,简单来说就是显卡就算可以卖,但是在中国,显卡的半导体芯片的对应的使用者(包括人或实体)的终端使用,如果涉及到人工智能,深度学,数据中心,超算以及军事,还有某些我写出来就过不了审的领域,那销售活动就会被禁止,同时,与半导体芯片相关的用于“用于生产、开发、使用、操作、安装、维护、修理、翻新”的相关设备的终端使用,如果也牵扯到上述领域也会被禁止,结果就是,就算显卡的购买者是个人买家,但其背后其实是某公司或者机构,显卡事实上是使用在人工智能等被禁止的用途上,那么bis就要求对显卡的销售和设计进行额外的限制,在SME IFR的57-94页和AC/SIFR的87-142页中,就有明确的“身份审查”和“技术确认”的要求,在该禁令彻底生效的一个月后,bis会要求显卡销售方,既要知道对显卡的销售方进行是否为“美国身份”的审查,也要获得显卡购买者或者使用者的相关信息,用来进行终端使用的审查,用于防范显卡不被用于bis禁止的事宜,如果违反那么其销售行为会被禁止。[淘股吧]
至于大家曲解的“民用消费级显卡豁免”,却并非大家想象的,填填申请表就能实现的“简单豁免”,在bis的AC/SIFR的第104页,对“豁免”进行了解释,给出了一个非常明确的例子,简单的就是说在芯片的通信手段上,比如对又256个AI加速单元的芯片,设置一个1Gb/s的对外输出限制,来防止其与其他同类设备一起使用,换言之,未来即便是被用于bis禁止领域z之外销售的4090及以上级别民用消费显卡,将会通过某种技术手段限制其算力,最终会被豁免销售的会是阉割餐费板4090(很可能DLSS功能受限)。
归根到底,为了在未来第四次工业革命的道路上不落伍,为了在人工智能的时代跟上世界的潮流,我们有且只有一条路就是自研人工智能AI算力集群系统。市场怎么走我不清楚,短线走势是大资金(量化,巨型游资)说了算,但是未来行业趋势我们丝毫不怀疑,甚至已经越来越笃定,华为算力,国产人工智能服务集群,国产显卡必将崛起,5年后见分晓吧。
DoctorD

23-11-16 12:41

5
这个月除了开局爽2天,后面都在艰难爬坑,看来回血还是要靠算力。。。[淘股吧]
赛博卡车热度很高,但和我们国情不符,感觉用武之地不大。漂亮国几乎家家都有皮卡,也有相应的消费Xi惯,我们这大城市里家庭买卡车的消费观还是没形成,日常也没有多少拉货需求,买大件东西都是送货上门,偶尔有需求的话,叫个货拉拉什么的也很方便。高端卡车开出去也没有什么社交属性,总感觉有点鸡肋的产品。

至于英伟达新发布的定制三款芯片,基本和团队小伙伴们上次分析的一样,性能大砍特砍。。。
 
 

理论上H100比H20的速度快了6.68倍。据分析师Dylan Petal最新发布的一篇博文,即使H20的实际利用率能达到90%,其在实际多卡互联环境中的性能仍只能接近H100的50%。
也有媒体称,H20的综合算力仅相当于H100的20%,且由于增加了HBM显存和NVLink互联模块,算力成本显著提高。
英伟达已经做出这三款芯片的样品,H20 和 L20预计将于今年 12 月推出,而 L2将于明年 1 月推出。产品采样将于发布前一个月开始。
H20 Vs. H100先来看H100,拥有80GB HBM3内存,内存带宽为3.4Tb/s,理论性能为1979  TFLO P,性能密度(TFLOPs/Die size )高达19.4,是英伟达当前产品线中最强大的GPU。
H20,拥有96GB HBM3内存,内存带宽高达4.0 Tb/s,均高于H100,但计算能力仅为296 TFLOP,性能密度为2.9,远不如H100。
理论上H100 相比H20 的速度快了6.68倍。但值得注意的是,这个比较是基于FP16 Tensor Core的浮点计算能力(FP16 Tensor Core FLOPs),且启用了稀疏计算(减少运算量,因此速度会有显著提升),因此并不能全面反映其所有的计算能力。
另外,该GPU的热设计功耗为400W,低于H100的700W,并且在HGX解决方案(英伟达的GPU服务器方案)中可以进行8路GPU的配置,它还保留了900 GB/s的NVLink高速互联功能,同时还提供了7路MIG(Multi-Instance GPU,多实例GPU)的功能。
H100 SXM TF16(Sparsity)FLOPS = 1979
H20 SXM TF16(Sparsity)FLOPS = 296
根据Peta的LLM性能对比模型表明,H20在moderate batch size下峰值token/秒,比H100高出20%,在low batch size下的token to token延迟比H100还要低25%。这是由于将推理所需的芯片数量从2个减少到1个,如果再使用8位量化,LLAMA 70B模型可以在单个H20上有效运行,而不是需要2个H100。
值得一提的是,H20的计算能力虽然只有296个TFLOP,远不及H100的1979个,但如果H20的实际利用率MFU(目前H100的MFU仅为38.1%),这意味着H20实际能跑出270 TFLOPS,那么H20在实际多卡互联环境中的性能接近H100的50%。
从传统计算的角度来看,H20相比H100有所降级,但在LLM推理这一方面,H20实际上会比H100快了20%以上,理由是H20在某些方面与明年要发布的H200相似。注意,H200是H100的后继产品,复杂AI和HPC工作负载的超级芯片。
L20和L2配置更加精简与此同时,L20配备48 GB 内存和计算性能为239个TFLOP,而 L2 配置为 24 GB 内存和计算性能193个TFLOP。
L20基于L40,L2基于L4,但这两款芯片在LLM推理和训练中并不常用。
L20和L2均采用 PCIe 外形规格,采用了适合工作站和服务器的PCIe规格,相比Hopper H800和A800这些规格更高的型号,配置也更加精简。
但是英伟达用于AI和高性能计算的软件堆栈对某些客户来说非常有价值,以至于他们不愿放弃Hopper架构,即使规格降级也在所不惜。
L40 TF16 (Sparsity) FLOPs = 362
L20 TF16 (Sparsity) FLOPs = 239
L4 TF16 (Sparsity) FLOPs = 242
L2 TF16 (Sparsity) FLOPs = 193

简单汇总分析了一下,阉割版特供芯片实际性能大概是原版的20%~50%,黄氏一刀砍掉8成内功,感觉难堪大用。这里有点需要注意的是,用于AI和高性能计算的软件堆栈 的重要性,感觉这也许是我们之前分析时所忽略的问题,对于国产算力瓶颈的突破,除了硬件性能,调度软件方面带来的易用性和效率提高也是需要重视的,这也是恒为这个网络可视化及智能系统平台为什么突然大受重视的原因,也许现在很多年轻人从来没感受过在微软的可视化操作系统windows出现之前的Dos平台操作起来多复杂吧,任何简单的操作都需要用键盘敲上相应的代码才能实现,现在回忆起来已经感觉是上一辈子的遥远事情了。。。可视化系统的出现,简化了操作,自然而然地提升了效率,那是一个跨时代的变革,也造就了微软这家伟大的公司。
  
  
DoctorD

23-10-24 12:52

5
一切以盘面为准吧,今天市场普涨,杀人气大票,顶小票,感觉不太好,华菲光、华康汽车、长虹都很弱,大资金赚不了钱,也许就要转移阵地另辟战场了。[淘股吧]
收盘收不到5日线上我就不留了,近期市场风气偏炒妖,同一个概念盘子小有妖气的走得好,逻辑正宗的大盘股反而相对弱很多,对比赛力斯和圣龙就很明显,做短线应以市场为大。
用心倾听市场,努力理解市场。
DoctorD

23-10-23 12:33

4
人工智能时代才刚开始,以后路还长的很,第四次工业革命是各国改变国运的重要契机,现在漂亮国企图把我们人工智能的发展扼杀在摇篮之中,才会采用杀敌800自损1000的狠招,单单英伟达市值一周就跌去1万亿软妹币,漂亮国这种玩法已经不计成本了。[淘股吧]
京东上搜索英伟达4090已经在北京断货多日了,包括未来的5090,甚至可能不会在大陆发布。其实就是因为4090虽然是民用级消费显卡,事实上还是有着不俗的AI算力水准的,据我所知就有不少公司和高校的研究室都在用4090做人工智能方面的工作,并不仅仅像之前大家想象的只是用来打游戏。(其实现在越来越多3A大作支持的DLSS,就是人工智能算力的体现,英伟达显卡开不开DLSS,实机水品差别极大。)
英伟达也只是大国博弈中的牺牲品而已,英伟达算力越跌,市场就会越看好华为算力的替代。
DoctorD

23-11-22 15:27

3
算力长期看好,人工智能时代的锂电池[淘股吧]
锂电板块从15年就开始炒,到21年涨了多少,中间又历经了多少次调整。。。算力这点调整算啥啊,毛毛雨而已。
不过感觉短线资金目前玩这个板块也不容易赚钱,玩短线还是要追热点,产业逻辑什么的主要是指导做极长持股时需要分析的。

短线还是北交所新的投机天堂更爽(问题就是只有镰刀,没有韭菜,只能拼谁的镰刀更锋利),流动性太差,大佬们投点小钱爽一发调剂一下心情还是挺舒畅的,小资金去重仓搏命还是风险偏大,当然,最后肯定有人能创造短期几十倍奇迹的。
DoctorD

23-10-23 15:13

3
大盘还是很差,猛怼的想法还是悠着点,我自己虽然极度看好华为算力,但也是控仓在搞的。而且这是我们团队自己的研究成果,相关研究结论只是在小范围传播,目前扩散范围很小。周末重点研究的都是大国博弈造成的产业趋势分析,最终落实到短线走势上如何走,还要看市场究竟认不认。
DoctorD

23-10-20 14:24

3
感觉大盘有点探底回升的意思,和大盘一起共振探底的会是华为算力么?还是新能源赛道?房地产?各路资金都在自己看好的方向造势啊。 
选择困难症啊。。。莫非说小孩子才做选择,自选股里面全都要一点才好???
DoctorD

23-11-17 12:53

2
没有,这个月坑还没填满,暂时先不莽情绪小票了,等新高了再说吧。[淘股吧]
目前继续在算力里苟着,市场缩量,盘子比较大的股,的走势的确不太顺畅,昨天的 恒为科技 还没出,还有万手大哥在托底,大哥不撤单的话应该能封杀下跌空间,长期逻辑比较看好的票先苟一苟,看看下午能不能回流吧。
DoctorD

23-10-23 12:58

2
另外,团队小伙伴周末几天都在加班研究漂亮国的ECCN 3A090和4A090条款的具体内容,以及《半导体出口管制暂行最终规则(SME IFR)》,和《实施额外出口管制:先进计算单元,超级计算与半导体终端用途;对临时最终规则的更新与修正(AC/SIFR)》这些原版文件,当小伙伴们看完了bis多达295页和141页的两个官方文件后,我们发现一个重大问题,目前市场绝大多数解读“显卡禁售”和“民用消费级显卡豁免”的解读都是断章取义的,我们团队自己研究得出的结论是,4090显卡其实并未禁止销售,但是显卡不能用于生产、开发、使用、操作、安装、维护、修理、翻新这些活动,对于以上被禁活动的界定,漂亮国bis在SME IFR文档的第7到53页中对这些词的含义和包含范围,进行了详细的解释,简单来说就是显卡就算可以卖,但是在中国,显卡的半导体芯片的对应的使用者(包括人或实体)的终端使用,如果涉及到人工智能,深度学,数据中心,超算以及军事,还有某些我写出来就过不了审的领域,那销售活动就会被禁止,同时,与半导体芯片相关的用于“用于生产、开发、使用、操作、安装、维护、修理、翻新”的相关设备的终端使用,如果也牵扯到上述领域也会被禁止,结果就是,就算显卡的购买者是个人买家,但其背后其实是某公司或者机构,显卡事实上是使用在人工智能等被禁止的用途上,那么bis就要求对显卡的销售和设计进行额外的限制,在SME IFR的57-94页和AC/SIFR的87-142页中,就有明确的“身份审查”和“技术确认”的要求,在该禁令彻底生效的一个月后,bis会要求显卡销售方,既要知道对显卡的销售方进行是否为“美国身份”的审查,也要获得显卡购买者或者使用者的相关信息,用来进行终端使用的审查,用于防范显卡不被用于bis禁止的事宜,如果违反那么其销售行为会被禁止,
DoctorD

23-10-20 12:52

2
恒为也很好啊,养家昨天还在加仓呢,但走势不太乐观啊,10日线破掉了。。对比起来四川长虹5日线上面承接还是非常强,弱市我还是更偏向于跟随些。
刷新 首页上一页 下一页 末页
提交