圆桌派|ChatGPT会改写新闻吗? 原创 熬夜冠军小组 新潮
图文|程艺丹 指导老师|白净 编辑|梅思婕
被称为“史上最强AI”的ChatGPT是一种基于GPT-3.5模型的大型语言模型,作为一种人工智能技术,ChatGPT可以分析和处理大量的文本数据,并生成高质量的自然语言文本。ChatGPT以及新发布的GPT-4掀起了广泛讨论,人们既关注它在多个行业的应用前景,也对自己的工作未来可能被人工智能取代表示担忧。
2023年3月19日下午,“新潮”与NEWS COFFEE共同发起本年度第一期“新潮圆桌派”,就“ChatGPT会改写新闻吗?”展开讨论。南京大学计算机学院王崇骏教授从技术层面为大家讲解了有关ChatGPT的知识。来自新闻、历史、计算机等专业的研究者,和对ChatGPT感兴趣的同学们一起,共同探讨了ChatGPT给新闻业带来的机遇与挑战。
讨论现场
以下是本次“圆桌派”讨论的部分精彩片段——
ChatGPT在技术层面是如何发展到今天的?
王崇骏老师:
如果我们把这件事情往前推,最早可以追溯到1891年解剖学家瓦尔德尔发现了神经元这件事情。在这之后,1943 年有个叫Pitts的人写了一篇关于神经元计算的文章,提出了神经网络这个概念。上世纪 90 年代,又出现了循环神经网络的概念。
2017年,为了解决循环神经网络中的一个问题,谷歌发布了transformer,由此诞生了今天的GPT,即生成式人工智能,而另一条路,是谷歌选择的判别式人工智能。
业内公认,人工智能最终能落地的,一定是谷歌。但有一帮年轻人不信邪,2015年成立了OpenAI,一个非盈利组织。他们带着打破谷歌 AI 垄断的技术梦想,开始了创新性挑战。2019年3月,OpenAI宣布公司重组,向盈利目标进军。他们给挣的钱设定了一个限额,就是成本的100倍,就是说,如果超过成本100倍的钱,他们会用于公益,或者继续研发。
王崇骏老师讲授ChatGPT的工作原理
高长江同学:
研发ChatGPT的第一阶段是预训练,即预测出语料的下一个字,相当于建立了一个人类语言的数学模型、概率模型;第二个阶段叫做instruction tune(指令微调),就是让它做一些事情,比如“请帮我把这句话翻译成英文”,或者“请讲一个故事”,或者“请给我写篇摘要”。做完了之后,它就有了在任务上的泛化能力。第三阶段就是人类反馈强化学习。在这个阶段会从和它的对话是否符合事实、是否安全、是否有意思等各个维度给它打分,通过训练让它的分数更高一点。
ChatGPT:
ChatGPT是基于 GPT(Generative Pre-trained Transformer)模型架构开发而来的。GPT 是一个基于自注意力机制的深度学习模型,用于自然语言处理任务,由 OpenAI 开发。GPT 模型通过多层堆叠的自注意力机制实现了对上下文的理解和记忆,能够有效地对输入的自然语言进行处理和生成。该模型经过了多次迭代和优化,从 GPT-1,到 GPT-2,再到 GPT-3,逐渐提升了模型的参数量和性能,并在多个自然语言处理任务上实现了领先的效果。
ChatGPT基于 GPT 模型架构进行了改进和优化,主要在以下几个方面进行了创新:
1.数据量的增加:ChatG
登录后可查看完整内容,参与讨论!
立即登录