1、谁不蹭GPT谁尴尬,谁不入局GPT淘汰谁。字节、百度、阿里、腾讯、京东、网易、搜狐、小米,你能想到的中国互联网大厂,这几天都拼命跟ChatGPT套近乎。最狠的是破产好几次的寺库,一夜股价翻倍,就连变现困难的知乎股价都涨了50%。
2、ChatGPT的原理是对话式UI + GPT(Generative Pre-trained Transformer,生成式预训练变换器)–3.5系列模型提供支持。有专家说国内技术与OpenAI的差距,并没有想象中的那么大,算不上什么卡脖子技术。可问题是为什么中国互联网公司集体缺席ChatGPT,直到国外的一家创业公司推出爆红之后又集体补课?
3、这个得从ChatGPT的前世今生里找答案。
2017年6月,Google发布Transformer论文。
2017年7月,OpenAI发布人类喜好的强化学习算法、PPO算法。
2018年6月,OpenAI发布GPT-1。
2019年2月,OpenAI发布GPT-2,此后OpenAI专注于GPT。
2020年5月,GPT-3论文发布。
2020年6月,GPT-3 API发布。
2021年7月,OpenAI发布Copilot原型算法。
2021年11月,GPT-3 API Public Release,不对中国开放。
2022年1月,GPT-3.5 API发布。
2022年3月,GPT-3.5论文发布,公开Alignment算法。
2022年11月,OpenAI发布GPT3.5 API的新模型(text-davinci-003)。
2022年12月,ChatGPT发布。
2023年1月,微软宣布投资OpenAI数十亿美元。
2023年2月,ChatGPT引爆中国互联网。
4、几个基本结论,一个是OpenAI长期投入5年才有了今天,远见、勇敢、坚持、资本缺一不可;一个是我们因为疫情闭关了三年,恰恰是OpenAI的GPT发展、壮大、产品化的三年,大家都在国内,没办法出国参加学术会议交流,错过了三年;一个是高质量的训练数据才能训练出高质量的大规模语言模型,ChatGPT的GPT-3模型拥有1750亿参数,而我们周遭充斥着被阉割的信息。
5、GPT的精髓是Alignment(人类意图的对齐)。中国AI科学家们特别是大厂的研究人员,讲究实用主义,大部分把语言模型应用在下游任务上,比如各个APP里伺候你的客服机器人,根据用户指令跳转到具体任务,当你说转人工,它就帮着把客服小姐姐给你叫来。
6、另一派中国AI科学家专注于计算机视觉路线,解决图像问题,从图像分类、检测到识别,从高层视觉到底层视觉,比如自动驾驶、图片生成等。这也是AI在中国应用最为广泛、商业化最为成功的地方,比如自动驾驶、图片生成、AI四小龙为代表的人脸识别、图像识别技术,以至于大家都认为中国已经走在全球人工智能的先进行列了。
7、用ChatGPT自己的回答来说,它最牛逼的地方在于自然语言生成能力和理解能力,还可以进行自然语言处理任务。语言是人类最后的家园,当人工智能可以思考、学习、推理、交流人类语言,那就是一场新技术革命的序曲和方向,是过去十年中国大厂引以为豪的AI算法、大数据需要重新补课的开始。
8、希望中国大厂能追上,希望中国大厂别自嗨,希望中国大厂别固步自封,也希望中国大厂除了有赚钱的能力,也有改变世界、造福人类的志气,毕竟靠一家之力没办法洗出来高质量的训练数据。
来源:气氛爼 微信号:baba_talk