大模型
[淘股吧]周五开始,大模型"卷”起来了。
自Kimi的长文本处理能力在资本市场被热捧,多家大模型相继推出长文本处理能力。
阿里通义才问22日宣布,向所有人免费开放1000万字的长文档处理功能。
百度文心一
言也宣布下个月将进行版本升级,届时也将开放长文本能力,文字范围会在200万-500
万。目前,文心一言的文本上限大致在2.8万字。
3月23日,360智脑宣布正式内测500万字长文本处理功能。
另外,国内首个千亿参数多模态金融大模型”财跃F1金融大模型”今日在2024全球开
发者先锋大会上正式发布,由上海财跃星辰智能科技有限公司研发。
有关多模态,消息称,OpenAl将于好莱坞电影公司会面并推荐Sora。
AI初创公司Suno推出V3音乐生成模型
也有一定热度。只需几秒,即可生成2分钟动听
的音频。
关于Kimi,经济日报发表文章《国产大模型kimi能否“登月》,其中提到,月之暗面公
司以初生牛犊不怕虎的精神志指“登月”,堪称目标远大,值得期许。中国公司需要“登月”
这样目标远大的理想,国产大模型也需要“登月”这样富有竞争力的技术储备。
大模型的炒作向上延伸主要是语料数据和算力。
二、算力
上海方面有政策支持。
3月22日,上海市通信管理局等11个部门联合印发《上海市智能算力基础设施高质量发
展“算力浦江”智算行动实施方案(2024-2025年)》。
其中提到,到2025年,上海市智能算力规模超过30EFlops,占比达到总算力的50%以
上。算力网络节点间单向网络时延控制在1毫秒以内。智算中心内先进存储容量占比达
到50%以上。
国产算力仍然是重点,《方案》提到,推动智算芯片全面兼容国产训练框架,推动智算
芯片软硬件实现高质量自主可控。