12月1日,美国
人工智能研究公司OpenAI推出
人工智能聊天原型Chat-GPT,上线五天全球用户数量已突破百万,赚足了眼球。ChatGPT是一种专注于对话生成的语言模型,它能够根据用户的文本输入,产生相应的智能回答,主要运用的技术就是NLP。有人将ChatGPT比喻为“搜索引擎+社交软件”的结合体,能够在实时互动的过程中获得问题的合理答案。
那么,国内在NLP领域的研究进度和商业化情况如何?有哪些参与者?行业竞争的重点和难点在哪里?
带着这些问题,我们来看NLP这条产业链。
这条产业链各环节,包括:
1)上游:基础层——包括数据处理(数据清洗、标注、整理及分类)、算力基础设施(主要为GPU芯片、AI定制芯片,以及相关
传感器等)。芯片代表厂商有
英伟达 、
高通 (GPU)、
英特尔 (FPGA)、谷歌、
寒武纪 等;
云计算服务商代表有
微软 、
亚马逊 、
阿里巴巴 、
百度 等;
可运用于自然语言处理训练的数据集不断丰富,多数是由学术及研究机构承担建设的公共数据集,比如维基百科语料库、斯坦福大学问答数据集等。
2)中游:技术层——在数据及算力的基础上,进行相关算法研发,满足基础技术需求。按照细分场景,可分为:计算机视觉、语音识别、自然语言处理等领域,分别对应人类的视觉、听觉和阅读能力。
3)下游:各行业应用场景——是将技术层的基础技术与具体场景需求相融合,以解决实际的问题(如帮助企业提升运营效率或优化用户体验,帮助公安部门实现摄像头自动识别等)。具体包括:
教育、医疗、
安防、娱乐、汽车(自动驾驶)、
智慧城市、
工业自动化、企业数字化等具体场景。
$天玑科技(sz300245)$