苏大夜校ChatGPT学习笔记1：简介

2024年3月4日、6日和8日，参加苏州大学夜校组织的“chatGPT”课程，学习简介、编写指令、和实际应用。整理简单笔记，以下是4日第一节课 “ChatGPT简介”

## chatGPT简介

ChatGPT：人工智能迎来网景/iphone时刻，网景Netscape和iphone分别代表互联网和移动互联网时代的到来，而ChatGPT代表“通用人工智能”的到来，之前都只是“弱人工智能”，比如google会下象棋的程序；

比尔盖茨：The age of AI has begun! ChatGPT是1980年（现代图形桌面系统GUI和随后的Windows操作系统）以来最具革命性的技术进步。

“信息——模型——行动”的系统
1. 第一代系统，重点在于“信息”，由人来进行“模型——行动”
2. 第二代系统，系统负责“信息——模型”，人负责“行动”，核心是“模型”/
3. 第三代系统，
ChatGPT代表一种“大模型，通用模型”，模型的成本大幅下降；从而促进了模型生态的发展

ChatGPT——人工智能历史上最为强悍的“信息助手”
·丰富的背景知识
·长文档理解与生成能力
·长程对话的语义一致性
·复杂任务推理能力
·与人类价值观对齐的能力
·自然语言指令遵循能力

ChatGPT相比于对话机器人，ChatGPT能解决复杂问题。（从what，who，when，where这一类问题，到回答why和how类问题）

两个复杂的问题：（1）让ChatGPT用逻辑推理，英国从形成喝茶习惯，为什么人口增加越来越多；（2）一名中国大学生，询问两年后出国留学，应该怎么规划；（3）怎样和ChatGPT实现口语对话；

ChatGPT能直接给你答案，能反向提问（向人问问题），能完成工作任务（特别是文字相关的工作）。

反向提问：检验认知，扩充认知。基于乔哈里（Johari）沟通视窗，分析“我不知道的盲区”而“ChatGPT知道的“。

ChatGPT：人工智能历史上最强悍的“信息助手”。因为chatgpt有丰富的背景信息（投喂了公开的互联网信息），长文档理解和生成能力，长程对话，复杂推理，自然语言指令等；

ChatGPT发展历史：从GPT-1 （1.17亿个参数，学习5G资料），到GPT-2（15亿参数，学习40GB内容），到GPT-3（1750亿参数，学习45TB资料），成为「超大语言模型」（LLM）； GPT-4有更强的多模态能力，可以理解图片和数学公式。

## 智力魔力何来

关键词：深度学习，单词接龙，自回归，泛化，上文，模型，概率，下文；训练

神经网络模型，深度学习（核心是训练input和output之间的“非线性映射函数”，确定函数的参数）

实质功能：预测下一个字（单字接龙），通过自回归重复预测，得到“长文预测”。生成结果需要“上文”+“模型”。

相同的input“上文”，会有不同的output，因为要根据模型中的“概率”提供“下文”。

长文的input和output，同样需要很多的输入训练，以建立相应的模型；在此之外的新问题，就依据大模型的“泛化能力”，实现举一反三。

搜索引擎是从数据库中寻找答案，而GPT是从利用模型，生成答案。

Chatgpt的三个训练阶段：
1. 无监督学习（开卷有益，使用海量互联网文件，预训练pre-training，但回答形式和内容却不受约束，缺乏引导的状态）——>
2. 监督学习（模版规范，用优质的“对话模版”矫正模型的“不规范习惯”，从而学会特定的指令，比如“翻译”，“缩写”，特定的问题描述语言；训练“思维链”，学会一步一步的分析出答案）——>
3.强化学习（创意引导，通过针对答案进行奖励，利用评分机制去调整模型的参数，从而限制特定表现，趋向于人类价值观的答案。）；最终得到“生成语言模型”。

三个训练阶段：脑容量很大的懂王鹦鹉 —> 懂规矩的博学鹦鹉——>既懂规矩又会试探的博学鹦鹉

## 应用场景与社会影响

未来人与人之间的差距，是我们创造性利用AI的能力。

AI会让一部分人更专业、更进取。

Satya：对知识型工作者来说，ChatGPT这种通用大模型完全等于工业革命。

大模型的本质是知识，具有逻辑和推理的AGI能力。

如何应对，如何迎接AI时代？

早日获得AI的访问权，让自己更专业（善用ChatGPT，辅助工作），并让自己更有创造性。

“人工智能不会取代你，会用人工智能的人会取代你”～

终生学习，善用新工具。

2024-3-9 更新发布。