现在国内做大模型的为什么那么多,给人感觉好像大模型谁都能做,首先是开源,只要组织一个几十人有大型软件开发经验的工程师,就能把开源代码整理好弄起来,但是大模型只是一个框架,真正让它展现能力的是数据和应用,这个数据量是tb级别的,恰恰很多公司没有这样的数据积累,所以这也是很多大模型的公司比如
科大讯飞 现在只能停留在语音和文本功能阶段,而数据又需要标注清洗和蒸馏,这样的对数据有经验的团队非常少,因此美国做大模型只有几家互联网公司,国内也就几家大型互联网公司有这样的数据团队,这种数据团队,没有三五年是打造不出来的
而做搜索类型的公司天生具有优势和
人工智能基因,搜索公司有大量的数据,不如谷歌和
微软,华尔街为什么就是看好谷歌和微软的原因就是这个两家公司通过搜索拥有大量数据,国内基本就是
百度和360,具体到a股就只有360,并且它叠加了安全的领先优势,很多公司不具备数据优势就无法做通用大模型,只能做垂直行业的大模型应用,而越到后面通用大模型的威力越来越大越强,垂直大模型很多就会被通用大模型取代