思维导图
引言
ChatGPT的推出使OpenAI在2023年估值为290亿美元。
生成式预训练转换器(GPT)语言模型家族的ChatGPT 是在OpenAI的GPT-3的更高级版本“GPT-3.5”的基础上进行了升级(一种迁移学习方法)。
微调的过程使用了来自人类反馈的强化学习,这是一种将监督学习与强化学习相结合的技术(RLHF)。这两种策略都利用了人类的帮助,以帮助模型表现更好。
什么是提示?
提示是给机器学习模型提供的一个短文本片段或指令,用于引导它生成输出。
提示为模型提供了上下文、指导和对所需输出类型的约束。
制定清晰简明提示的好处
提高理解能力
增加参与度
节省时间
一致性
更好的回复质量
专业性
制定有效提示的人工智能技术
自然语言生成(NLG):NLG是一种从结构化数据或提示生成类似人类文本的技术。它可以用于生成针对特定用户或上下文的有效提示。例如,在推荐系统中,NLG可以生成询问用户偏好和兴趣的提示。
自然语言理解(NLU):NLU是一种帮助机器理解人类语言的技术。NLU可以用于分析用户对提示的回答,并生成与用户输入相关的后续提示。例如,如果用户对提示的回答是"我喜欢意大利菜",NLU可以生成一个后续提示,询问用户对意大利菜的喜爱程度。
强化学习(RL):RL是一种使机器能够从与环境的互动中学习的技术。它可以用于生成促使用户提供更多信息性回答的提示。例如,在对话系统中,RL可以用于生成引导对话朝特定目标发展的提示。
主动学习:主动学习是一种选择最具信息量的示例供用户标记的技术。它可以用于生成最有可能引导用户提供信息性回答的提示。例如,在文本分类任务中,主动学习可以生成询问用户标记最模糊或不确定的示例的提示。
迁移学习:迁移学习是一种允许模型利用一个领域的知识来帮助另一个领域的技术。它可以通过利用其他领域的知识生成针对特定用户或上下文的提示。例如,在推荐系统中,迁移学习可以利用过去行为或偏好的知识生成个性化的提示。
机器学习:机器学习算法可用于分析大量数据,以识别模式和关系,这可以用于制作有效的提示。
决策树:决策树是一种流行的AI技术,可用于引导用户通过一系列提示,以达到所需的结果。
深度学习:深度学习是一种AI技术,涉及训练神经网络识别模式并进行预测。
A/B测试:A/B测试涉及测试提示的不同版本,以确定哪个版本更有效。
不同类型提示的概述
口头提示是另一个人给出的口头指令或暗示,以引导期望的回应。口头提示通常在教室环境中使用,教师指导学生完成特定任务或提供完成活动所需的信息。例如,教师可以提示学生回答问题或提醒他们在发言前举手。
视觉提示是可以看见的提示,如图片、图表或书面指导。视觉提示用于帮助有口头沟通困难的人,如自闭症谱系障碍者。例如,视觉时间表可以显示一天中需要完成的任务顺序。触觉提示是一种物理提示,如触摸或轻击,以引导期望的回应。触觉提示通常在治疗环境中用于帮助感觉处理障碍的个体。例如,治疗师可以使用触觉提示引导人们的手完成任务。
环境提示是环境中的暗示,可以引导期望的回应。环境提示通常用于鼓励人们参与特定的行为或活动。例如,交通灯指示什么时候可以安全过马路,提示行人行动。
手势提示是身体手势或信号,如指点或点头,以引导期望的回应。手势提示通常用于帮助沟通困难或身体障碍的个体。例如,照料者可以使用手势表明是用餐时间。
书面提示是以书面形式提供的指令或提示,如便笺或提醒。书面提示通常用于提醒个体需要完成的任务或提供指导。例如,提醒便笺可以提示一个人在特定时间服药。
听觉提示是可以听到的提示,如蜂鸣声或铃声,以引导期望的回应。听觉提示通常在警报或提醒中使用。例如,可以设置定时器在需要换任务时发出蜂鸣声。
模仿提示是一个人展示期望回应的提示。模仿提示通常用于教授个人新技能或行为。例如,教师可以演示如何解决数学问题,帮助学生学习这项技能。
自我生成提示是个人为自己创建的提示。自我生成提示通常用于帮助个体管理日常任务或记住重要信息。例如,一个人可以在手机上设置提醒,在每天特定时间服药。
建议
简洁明了提出问题
有疑问时澄清问题
避免过于宽泛或含糊的问题
指定对话行为(个性、声音、行为等)
当回答偏离你的问题或期望,尝试重置对话
提供背景:更好的理解问题的范围和意图