苏大夜校ChatGPT学习笔记1:简介

2024年3月4日、6日和8日,参加苏州大学夜校组织的“chatGPT”课程,学习简介、编写指令、和实际应用。 整理简单笔记,以下是4日第一节课 “ChatGPT简介”

## chatGPT简介

ChatGPT:人工智能迎来网景/iphone时刻,网景Netscape和iphone分别代表互联网和移动互联网时代的到来,而ChatGPT代表“通用人工智能”的到来,之前都只是“弱人工智能”,比如google会下象棋的程序;

比尔盖茨:The age of AI has begun! ChatGPT是1980年(现代图形桌面系统GUI和随后的Windows操作系统)以来最具革命性的技术进步。

“信息——模型——行动”的系统
1. 第一代系统,重点在于“信息”,由人来进行“模型——行动”
2. 第二代系统,系统负责“信息——模型”,人负责“行动”,核心是“模型”/
3. 第三代系统,
ChatGPT代表一种“大模型,通用模型”,模型的成本大幅下降;从而促进了模型生态的发展

ChatGPT——人工智能历史上最为强悍的“信息助手”
·丰富的背景知识
·长文档理解与生成能力
·长程对话的语义一致性
·复杂任务推理能力
·与人类价值观对齐的能力
·自然语言指令遵循能力

ChatGPT相比于对话机器人,ChatGPT能解决复杂问题。(从what,who,when,where这一类问题,到回答why和how类问题)

两个复杂的问题:(1)让ChatGPT用逻辑推理,英国从形成喝茶习惯,为什么人口增加越来越多;(2)一名中国大学生,询问两年后出国留学,应该怎么规划;(3)怎样和ChatGPT实现口语对话;

ChatGPT能直接给你答案,能反向提问(向人问问题),能完成工作任务(特别是文字相关的工作)。

反向提问:检验认知,扩充认知。 基于乔哈里(Johari)沟通视窗,分析“我不知道的盲区”而“ChatGPT知道的“。

ChatGPT:人工智能历史上最强悍的“信息助手”。 因为chatgpt有丰富的背景信息(投喂了公开的互联网信息),长文档理解和生成能力,长程对话,复杂推理,自然语言指令等;

ChatGPT发展历史:从GPT-1 (1.17亿个参数,学习5G资料),到GPT-2(15亿参数,学习40GB内容),到GPT-3(1750亿参数,学习45TB资料),成为「超大语言模型」(LLM); GPT-4有更强的多模态能力,可以理解图片和数学公式。

## 智力魔力何来

关键词:深度学习,单词接龙,自回归,泛化,上文,模型,概率,下文;训练

神经网络模型,深度学习(核心是训练input和output之间的“非线性映射函数”,确定函数的参数)

实质功能:预测下一个字(单字接龙),通过自回归重复预测,得到“长文预测”。 生成结果需要“上文”+“模型”。

相同的input“上文”,会有不同的output,因为要根据模型中的“概率”提供“下文”。

长文的input和output,同样需要很多的输入训练,以建立相应的模型;在此之外的新问题,就依据大模型的“泛化能力”,实现举一反三

搜索引擎是从数据库中寻找答案,而GPT是从利用模型,生成答案。

Chatgpt的三个训练阶段:
1. 无监督学习(开卷有益,使用海量互联网文件,预训练pre-training,但回答形式和内容却不受约束,缺乏引导的状态)——>
2. 监督学习(模版规范,用优质的“对话模版”矫正模型的“不规范习惯”,从而学会特定的指令,比如“翻译”,“缩写”,特定的问题描述语言;训练“思维链”,学会一步一步的分析出答案)——>
3.强化学习(创意引导,通过针对答案进行奖励,利用评分机制去调整模型的参数,从而限制特定表现,趋向于人类价值观的答案。);最终得到“生成语言模型”。

三个训练阶段:脑容量很大的懂王鹦鹉 —> 懂规矩的博学鹦鹉——>既懂规矩又会试探的博学鹦鹉

## 应用场景与社会影响

未来人与人之间的差距,是我们创造性利用AI的能力。

AI会让一部分人更专业、更进取。

Satya:对知识型工作者来说,ChatGPT这种通用大模型完全等于工业革命。

大模型的本质是知识,具有逻辑和推理的AGI能力。

如何应对,如何迎接AI时代?

早日获得AI的访问权,让自己更专业(善用ChatGPT,辅助工作),并让自己更有创造性。

“人工智能不会取代你,会用人工智能的人会取代你”~

终生学习,善用新工具。

2024-3-9 更新发布。