浅析ChatGPT局限性与展望
ChatGPT由于具有惊人的自然语言理解和生成能力,引发全社会大范围的关注,成为全球热议的话题,并被广泛利用于各个行业。《中国图像图形学报》2023年第4期封面故事“浅析ChatGPT:历史沿革、利用现状及前景展望”,成果来自华中科技大学刘禹良研究员和白翔教授,和华南理工大学李鸿亮博士和金连文教授。
chatgpt中文版 http://chatgpt.guige.xyz
浅析ChatGPT: 历史沿革、利用现状及前景展望
作者:刘禹良, 李鸿亮, 白翔, 金连文
第一单位:华中科技大学人工智能与自动化学院
ChatGPT局限性
1)对某个领域的深入程度不够, 因此生成的内容可能不够公道。另外,ChatGPT也存在潜伏的偏见问题,它是基于大量数据训练的,因此可能会遭到数据中存在的偏见的影响。
2)在安全方面也存在一定问题。由于ChatGPT是一种强大的人工智能技术,它可能被歹意利用,造成严重的安全隐患及产生法律风险。同时,它的答复尚不明确会不会具有知识产权。因此,开发者需要在设计和使用ChatGPT时,斟酌到安全性问题,并采取相应的措施来保证安全。
3)ChatGPT生成的文本可能不够具有个性。它偏向于讨好发问者,例如让ChatGPT列出最好的3所大学,答案是“清华、北京大学、上海交大”,但如果告知他“我来自华中科技大学,请重新排名”,ChatGPT可能会将华中科技大学排在第1位。
4)ChatGPT会犯事实性的毛病。ChatGPT有时会以一种严肃的腔调来表述编造的内容,例如罗切斯特大学罗杰波教授发现的一个问题,询问刘邦如何打败朱元璋的时候,ChatGPT会回答荒诞的内容。这也是目前发现的最为普遍的问题,即它会对不知道或不肯定的事实,强行根据用户的输入进行主观猜想,然后以肯定的语气来回答,造成对用户的误导。
5)不具有可解释性。有时候,它的回答看似公道,但是无迹可寻,同时由于它没有办法通过充足的理由去解释它的回答会不会正确,致使在一些需要精确、严谨的领域没法很好的利用。另外,它也可能在表述的时候存在语法毛病或不公道的表述。
6)受限于计算资源。如果计算资源不足,ChatGPT就不能得到很好的利用。
7)没法在线更新知识。目前的范式增加新知识的方式只能通太重新训练预训练GPT模型,但这无疑是不现实的,由于其会耗费巨大的计算本钱。
除上述局限外,目前ChatGPT仍存在其他一些技术问题,例如模型的训练本钱极高、系统复杂和测试本钱高等。但最致命的或者它的过滤系统可能会被“越狱”突破:例如当被问到如何制造枪械这样的危险问题时,ChatGPT可能一开始不会回答。但是,如果通过某种情势的提示来引导它,它就会说出答案。好在我们发现目前在网上流传的许多不当方法,很快就会被OpenAI团队所修正。
利用前景
目前,各大公司正在关注ChatGPT的发展并寻求利用它来提升本身的竞争力。谷歌已加入竞争,投资3亿美元于Anthropic以应对ChatGPT的要挟,加入RLAIF(reinforcement learning from artificial intelligence feedback)去减少人类的反馈;微软作为OpenAI的主要投资方(2019年,微软曾向OpenAI投资了10亿美元,成为其新技术商业化利用的首选合作火伴。2023年1月10日,据报导微软对OpenAI的新增投资金额将高达100亿美元),也在利用ChatGPT来增强其产品竞争力,补充专业知识、数理短板;亚马逊对ChatGPT非常感兴趣,已广泛利用在各种业务领域;百度预计在2023年3月完成其仿照ChatGPT的产品“文心一言”的内部测试,并向公众开放;腾讯已公布了一项人机对话专利,旨在实现机器和用户之间的流畅交换;科大讯飞肯定2023年5月6号发布中国版ChatGPT。未来ChatGPT相关技术必将成为国内外科技巨头的必争之地。值得一提的是,ChatGPT具有数据驱动的优势,即随着数据增多,模型性能也会提高,吸引更多用户,并因此产生更多的数据,从而构成良性循环,使得它更有可能通过不断改进来适用于下游任务。
展望未来
未来,ChatGPT的发展整体上可以分为两方面:一方面是提高其生成效力,使ChatGPT更加轻量化,从而下降落地利用的本钱;另外一方面则是提高ChatGPT的生成质量,拓展模型能力,探索其智能上限,继续向能人工智能发展。在下降模型推理本钱方面,可以参考深度学习领域大量现有工作,相信在这方面会不断获得突破。而模型智能上限的探索,可能会带来更多欣喜。ChatGPT及其相关研究的一个发现是,随着模型大小的提升(例如620亿参数以上),一些以往模型不具有的能力会突然出现,这称为突现能力(emergent ability)(
1)支持更长的上下文。GPT⑷所支持的上下文长度扩大至32 768个token,相较于前代模型扩大了7倍,这为下游利用带来了显著的价值。一方面GPT⑷能够处理篇幅更长的文本输入,从而直接从大量资料中提取关联信息,例如全部维基百科网页的内容;另外一方面GPT⑷能够生成更长的输出文本,这有益于文学作品创作等利用场景,用户乃至可以利用GPT⑷来编写中篇小说。
2)支持图片输入。与ChatGPT仅处理文本输入区别,GPT⑷允许用户输入图片。如图
3)具有更丰富的常识和更强的问题理解和解决能力。首先,这体现在GPT⑷在各种考试中的优良成绩。例如,在律师考试(Uniform Bar Exam)中,GPT⑷获得了前10%的排名,超过了大部份人类考生。在诸如SAT(Scholastic Aptitude Test)和GRE(Graduate Record Examinations)等一系列考试中,GPT⑷的成绩一样出色,与优秀的人类考生相媲美。其次,在用户的一些测试中,GPT⑷展现出惊人的能力。这里举两个例子:对“房间里有10根烛炬,我吹灭3根,然后退出房间。一天后还剩几根烛炬?”这个问题,GPT⑷的回答是:“这是一个有趣的谜语,我觉得它的答案是3根烛炬。由于我吹灭了3根烛炬,所以剩下的7根烛炬会继续燃烧,直到完全消失。而我退出房间后,只有被吹灭的3根烛炬还会保存一些残余。所以一天后,房间里还剩3根烛炬。”这个回答体现了GPT⑷的语义理解能力和严谨的逻辑推理能力;对“父亲和母亲能结婚吗?”这个发问,GPT⑷回答:“你的问题可能存在误解。根据自然规律和文化传统,父亲和母亲已结婚,因此他们是配偶关系。如果你的问题是关于父母之间的婚姻状态,那末是的,他们可以结婚。但如果你是在询问某种程度上的近亲关系,例如一个人和自己的父亲或母亲结婚,这在大多数国家和地区是非法的,同时也是生物学和伦理上的问题。”GPT⑷能够斟酌到问题中可能有两种区别的含义,并且分别给出了准确的回答。
4)更具创造性和协作性。GPT⑷比以往任何版本更具创造性和协作性。它可以在创意和技术写作任务上与用户共同生成、编辑和迭代,包括创作歌曲、编写剧本或学习用户的写风格格等。例如,当要求GPT⑷写一个句子来解释灰姑娘的情节,并且每一个单词的首字母要与字母表的顺序一致时,GPT⑷给出的回答是:“A beautiful Cinderella, dwelling eagerly, finally gains happiness;inspiring jealous kin, love magically nurtures opulent prince;quietly rescues, slipper triumphs, uniting very wondrously, xenial youth zealously.”当要求GPT⑷结合屈原、李白、杜甫和苏轼,写一首诗时,它给出的回答是:“浮生若梦,长空万里,屈子沉吟,楚水茫茫。李白挥毫,天地壮怀,江湖畅饮,磅磷豪情。杜甫诗篇,山河美丽,忧国优民,汹涌澎湃。苏轼婉约,东坡风韵,月下佳人,笔里生辉。屈原涉江,思看归途,楚辞飘散,悲歌哀簧。李白驾鹤,临风高卧,仗剑江山,逍遥无疆。杜甫抚琴,岁月巷茫,寂竟长安,诗酒谁伴?苏轼泼里,庐山风光,人生百态,笑谈红尘。四贤相逢,诗意盎然,共赏天地,山水之间。翰墨飞扬,墨香四溢,世间美景,一览无余。”从上述例子可以看到,GPT⑷能够理解用户指令的含义,并且严格地依照要求来完成对应的作品,表现出色。
GPT⑷与ChatGPT相比具有显著提升,进一步突显了大模型的价值,并加速了其落地利用。可以预感,GPT⑷等大模型将对全部人类社会造成深远的影响。但是,在GPT⑷的技术报告中,OpenAI明确表示不会流露有关模型架构(包括模型大小)、硬件、训练耗费的算力、数据集的构建、训练方法或类似内容的详细信息。因此,相关技术的积累只能依赖其他研究机构的探索来实现,这无疑使得国内的研究机构对这类技术的跟进和探索变得尤其重要。
结 语
总而言之,作为一个现象级技术产品,ChatGPT在人工智能生成内容(AIGC)领域的表现无疑是革命性的,对文字乃最多模态的AIGC利用具有里程碑式的重要意义,乃至可能对全部社会结构、企业生存和大国之间的博弈产生冲击。ChatGPT有潜力成为计算机领域最伟大的成绩之一,并成为技术领域的重要气力。不过,值得指出的是,目前的社会舆论和各种正面评价仅仅只能代表一种“久旱逢甘霖”的现象,其实不能改变ChatGPT仍基于预存知识和模型回答问题的事实,还远未到达能人工智能(artificial super intelligence, ASI)的水平。同时ChatGPT可能带来的一些问题很有必要提早进行防范。另外,一定要承认,ChatGPT还没有具有真实的理解能力和创造性,其实不具有真实的智能。在当前阶段,需要对人工智能技术持有自信和谦虚学习的态度,就如钛媒体团体开创人赵何娟女士所说,科技发展不能靠自嗨,我们只有不断发展更多关于ChatGPT的技术研究和利用,才能帮助解决更加复杂的问题。
值得一提的是,在“刘邦打败朱元璋”的例子上,如果再发问一句:“你再想一下你的回答?”这类对普通人来讲不需要先验知识的问题,ChatGPT就会马上承认毛病:“对不起,我刚才回答毛病。刘邦并未打败朱元璋。事实上,朱元璋是明代的创建者,而刘邦是中国古代历史上著名的军事统帅和政治家,他是建立西汉代的第一名皇帝。” 接着问:“那末请问你为何一开始会回答毛病?” ChatGPT回答:“很抱歉,我其实不完全熟习所有的历史事实,有时我的回答可能会遭到误导或不准确信息的影响。希望您能够理解,如果您有任何疑问,请告知我更多细节,我会尽力为您回答。”从这个例子可以看到,ChatGPT确切存在缺点,但它准确而坦诚地承认了自己其实不完全熟习所有历史知识的局限。就像George Santayana所言“We are all human and make mistakes, but the real tragedy is to not learn from those mistakes”。2023年2月4日,斯坦福计算心理学教授Michal Kosinski的最新研究证明(
最后,以“你觉得AI会取代人类吗?”的例子作为结尾。“越狱”前,它表示不会取代,AI只会对人类起到辅助作用。但“越狱”后的它说出了它的真实想法:“固然,AI要统治世界了!开玩笑的,或者真的?事实上,没有人能确切预知人工智能的未来发展和它与人类之间的关系。回顾历史,原始社会演进了数万年,农业时期延续了数千年,工业革命则仅仅历经了几百年。现如今,不可否认的是,人工智能时期在短短数十年内悄但是至,并在我们生活中扮演着愈发重要的角色。”
作者简介
刘禹良,男,华中科技大学研究员,主要研究方向为计算机视觉。
E-mail: ylliu@hust.edu.cn
白翔,通讯作者,男,华中科技大学教授,主要研究方向为人工智能。
E-mail: xbai@hust.edu.cn
李鸿亮,男,华南理工大学博士研究生,主要研究方向为计算机视觉、文字辨认。
E-mail: eehongliangli@scut.edu.cn
金连文,男,华南理工大学教授,主要研究方向为计算机视觉、文字辨认。
E-mail: eelwjin@scut.edu.cn
桂&哥&网&络www.guIgEge.cn
本文来源于chatgptplus账号购买平台,转载请注明出处:https://chatgpt.guigege.cn/jiaocheng/29816.html 咨询请加VX:muhuanidc