再造一个ChatGPT?并没想象的容易

栏目:业界动态 发布时间:2023-02-10 来源: 21世纪经济报道 浏览量: 215
分享到:

ChatGPT:奇点镜像

今年开春,来自大洋彼岸的人工智能应用ChatGPT“扑扇了一下翅膀”,一场浩浩荡荡的AI浪潮席卷全球。

作为一款上线两个月用户数就破亿的AI聊天机器人,ChatGPT不仅拥有远超预期的语言能力,并且展现出了超高的“情商”,甚至还能进行专业性很强的研报撰写、论文编辑、投顾分析。一时间,全球资本市场对其闻风而动,国内外科技大厂相继跟风“蹭热点”宣称将推出类似产品,而相关概念股的股价近期也狂飙上涨。人们纷纷探寻ChatGPT背后的价值,寻求这一AI新贵未来可能将要打开的商业空间。

当然,我们很期待看到人工智能的发展更上一层楼,那些以前存在于科幻电影、动画片中的能和人类无障碍交流的机器人或许很快就能成为现实。然而,热事件,冷思考。不得不问一句,这场科技热潮是预示着颠覆性革命,奇点将临?还是说更多反映了人们对于人工智能技术的焦虑性期待?而未来,人工智能的边界又在哪里呢?(林曦)

ChatGPT的热度仍在持续升温,尤其是该概念在资本市场带来的“助涨效应”,也吸引越来越多的上市公司开始蹭热点。

但是,ChatGPT背后的技术能力并不简单,更不是短期内想要实现就能实现的。因此,有业内专家呼吁,不要让ChatGPT沦为资本炒作的话题,而是要将目光聚焦于这个产品及其背后的技术能力,如何推动AI产业的进一步发展。

既然要回归理性,那对ChatGPT的探讨还是应该放在技术及应用的范畴,近日,多位AI领域专家也就ChatGPT及相关技术分享了一些思考。

 

与物理世界存在距离

旷视研究院基础科研负责人张祥雨告诉21世纪经济报道,ChatGPT在底层数据、核心技术、用户体验等各方面都可以说是里程碑式的AI产品。

张祥雨表示,如果从智能的角度看,AI要能完整模拟人脑,大概需要“感知、决策、执行、反馈以及知识记忆”这几个模块。而ChatGPT的核心技术是AI语言大模型,其关键是如何让AI模型具备逻辑推理能力以及如何让AI学习全互联网的知识。目前来看,ChatGPT基本都做到了,因此在决策和知识这个环节,有了很大的突破。

但是,张祥雨也指出,ChatGPT基本上没有跟物理世界发生关系,包括输入和输出。这是因为人类在物理世界的生存能力和基础运动能力,看似简单,其实都经过漫长的进化,底层机制是更难被破解的。某种意义上来说,是一种更难学习的智能。

在其看来,人工智能会在未来几年更快速地发展和应用,并从两个方向改变我们的世界:一是“AI in Digital”,即以 AIGC为代表的技术浪潮,通过重构内容生产力,让数字世界发生变革;二是“AI in Physical”,即以特斯拉为代表的企业,通过构建不同形态的机器人载体,对物理世界进行改造。

“‘AI in Digital’和‘AI in Physical’是两条不同的技术路线,相辅相成,对我们的未来会产生根本性的影响。而‘AI in Digital’背后的生成式大模型也为‘AI in Physical’的发展带来了新的机遇”,张祥雨说。

 

需要工程化能力

对于ChatGPT,腾讯研究院资深专家、前沿科技研究中心主任王强从“大模型”技术的角度进行了分析。其表示,当前的人工智能大多是针对特定的场景应用进行训练,生成的模型难以迁移到其他应用,属于“小模型”的范畴。

小模型的迁移过程不仅需要大量的手工调参,还需要给机器喂养海量的标注数据,拉低了人工智能的研发效率,且成本较高。而大模型通常是在无标注的大数据集上,采用自监督学习的方法进行训练。之后,在其他场景的应用中,开发者只需要对模型进行微调,或采用少量数据进行二次训练,就可以满足新应用场景的需要。

这意味着,对大模型的改进可以让所有的下游小模型受益,大幅提升人工智能的适用场景和研发效率。这也是为什么大模型近年来会成为业界重点投入的方向。

比如推出ChatGPT的OpenAI,其早在2020年就推出了大型语言生成模型GPT-3(Generative Pre-training Transformer 3),其训练参数量达到1750亿,在当时,这已是世界之最。而当前ChatGPT的版本为GPT3.5,是在GPT3之上的调优,能力进一步增强。

然而,要仅比较模型大小,那在GPT3推出后,业内已经涌现出更多比其更大的模型,但为什么这次是ChatGPT成功破圈?王强认为,ChatGPT是非常成功的一次从技术研发到工程化、再到点燃大众热情的经典案例。

王强进一步分析指出,在技术创新层面,OpenAI不断引入新的技术路线,比如这次引入的强化学习方法,就很好地提升了模型的效果。除此之外,OpenAI在组织文化、反馈机制、项目策划等方面的各项工作,也都共同推动了ChatGPT的成功。

比如项目策划方面,王强认为,一个影响力出圈的技术,与其项目策划密不可分。ChatGPT的问答和多轮对话形式,就很好地激发了大众的热情和创造力。

此前,Gartner已连续两年把AI工程列为年度战略技术趋势之一。在Gartner看来,AI工程化是AI大规模发展的必经之路。因为任何行业或企业,只要有场景、数据和算力,都可以落地AI应用,但落地效率、周期会远超预期。

这也进一步提醒我们,在越来越多企业鼓吹自己具备类ChatGPT技术时,外界更要冷静思考,仅有数据哪怕也具备一定算法和算力的公司,它真的能够创造出ChatGPT吗?

 

技术应用广泛

不过,虽然不是人人都具备创造ChatGPT的能力,但并不影响该技术具有广泛的应用性。目前,关于ChatGPT技术的应用讨论热度比较高的是搜索引擎,包括谷歌、微软以及百度等公司,都正在将ChatGPT技术融入其搜索引擎当中。

王强认为,短期来看,ChatGPT不会替代搜索引擎,但长期看来,通过融合,ChatGPT会推动形成新的搜索引擎。

从回答问题的角度,ChatGPT尽管已经十分强大,但其仍然无法替代现有搜索引擎的作用,未来仍要解决实时信息源以及置信度的问题。不过,ChatGPT的出现,确实给搜索引擎带来了新的思路,也有可能会推动出现新的搜索体验。

而除了搜索引擎之外,王强认为ChatGPT将会给更多领域带来变革。比如,ChatGPT会成为未来人机交互的一个新入口,从而改变现有APP的交互方式,以更为自然的对话方式,让用户来使用软件和调用技能。

此外,像是火热的数字人,通过ChatGPT这样的模型提供对话能力,能让数字人具备有趣的灵魂。同时,该能力也可以嵌入到机器人中,让未来的机器人更聪明。

开发者也可以利用ChatGPT这样的底层平台,在大模型基础上根据不同行业和场景进行模型调优,从而创造出各类满足用户需求的丰富应用,从而形成对话式AI的生态。

而在教育、医疗、广告营销、电子商务、市场和战略咨询、企业服务、编写代码等专业服务领域,ChatGPT技术也能成为更为专业的人类助手,不仅可以生成内容,还可以调用各种专业能力,甚至替代部分初级的专业工作。

此前,有研究报告认为,得益于模型泛化能力强、长尾数据的低依赖性以及下游模型使用效率的提升,大模型已具备了“通用智能”的雏形。并且在大模型的助力下,人工智能技术从五年前的“能听会看”,已走到今天的“能思考、会创作”,未来有望实现“会推理、能决策”的重大进步。