ChatGPT 作为大型语言模型,以理解人类语言而闻名。与其向 ChatGPT 询问一个你不知道的答案,不如利用其自然语言理解(NLU)能力,让它处理现有信息。在这篇文章中,你将学到:
- 如何让 ChatGPT 从长文本中生成摘要
- 如何让 ChatGPT 从一段文字中提取关键信息
使用我的著作《利用 ChatGPT 最大化生产力》开始并应用 ChatGPT。它提供了实际用例和提示示例,旨在让你快速开始使用 ChatGPT。
让我们开始吧。

利用 ChatGPT 的自然语言理解能力。
图片由作者使用 Stable Diffusion 生成。保留部分权利。
概述
这篇文章分为三个部分;它们是:
- 你的 AI 秘书
- 提取非结构化信息
- 如何使用 ChatGPT 进行 NLU
你的 AI 秘书
想象一下,你有一份包含不同人对话的会议记录。这份记录是追踪讨论过程以了解结论是如何达成的绝佳方式,但会议纪要应该更容易阅读决策。你可以让 ChatGPT 从会议记录中生成会议纪要。
让我们来看看这份会议记录。摘录如下:
>> 各位早上好。我是迈克尔·斯特恩,财务总监布拉德·兰德的代表,也是纽约市过渡期金融管理局财务委员会的主席。提醒一下,除非发言,请保持静音。我现在宣布财务委员会会议开始。丽塔,请点名好吗?
…
>> 谢谢大家。祝大家周末愉快。
>> 祝大家周末愉快。
>> 谢谢。
这不是一次长时间的会议,但会议记录有好几页。你可以使用以下提示将会议记录总结为一页的纪要:
作为一名经验丰富的秘书,请将以下会议记录总结为会议纪要,列出参与者、议程、关键决策和行动项目。
>> 各位早上好。我是迈克尔·斯特恩,财务总监
布拉德·兰德的代表,也是纽约市
过渡期金融管理局财务委员会的主席。提醒一下,请保持静音
除非发言。我现在宣布财务
委员会会议开始。丽塔,请点名好吗?…
>> 谢谢大家。祝大家周末愉快。
>> 祝大家周末愉快。
>> 谢谢。
在提示中,你提供了会议记录并告诉 ChatGPT 输出中应包含哪些内容,以确保所有关键细节都包含在内。以下是 ChatGPT 生成的内容:
会议纪要
会议:财务委员会会议
日期:[插入日期]
时间:[插入时间]
地点:[插入地点]参与者
– 迈克尔·斯特恩(财务总监布拉德·兰德的代表兼财务委员会主席)
– 大卫·沃马克(代表总监雅克·吉哈)
– 戴安娜·贝纳特(代表专员普雷斯顿·尼布拉克)
– 露安·科齐奥尔(代表专员托马斯·福利)
– 赫克托·德国(代表议长阿德里安娜·亚当斯)议程
1. 批准委员会上次会议纪要。
2. 建议董事会批准第 125 号决议,授权发行高达 16 亿美元的 23 财年 D 系列未来税收担保债券。关键决策
1. 批准委员会上次会议纪要。
– 会议纪要经过审查并一致批准。2. 建议董事会批准第 125 号决议,授权发行高达 16 亿美元的 23 财年 D 系列未来税收担保债券。
– 提交了决议,并提供了子系列的预期细分。
– 委员会成员一致投票赞成该决议,并获得批准。行动项目
1. 会议记录中未提及。休会
– 财务委员会会议休会。—
会议:董事会会议
日期:[插入日期]
时间:[插入时间]
地点:[插入地点]参与者
– 大卫·沃马克(预算总监雅克·吉哈的代表兼董事会主席)
– 戴安娜·贝纳特(代表专员普雷斯顿·尼布拉克)
– 迈克尔·斯特恩(代表财务总监布拉德·兰德)
– 露安·科齐奥尔(代表专员托马斯·福利)
– 赫克托·德国(代表议长阿德里安娜·亚当斯)议程
1. 授权在与 COVID-19 相关的紧急状态期间举行远程会议的决议。
2. 批准上次董事会会议纪要。
3. 批准第 125 号决议,授权发行高达 16 亿美元的 2023 财年 D 系列未来税收担保债券。关键决策
1. 授权在与 COVID-19 相关的紧急状态期间举行远程会议的决议。
– 提议了该决议,以允许在城市内与 COVID-19 相关的紧急状态生效期间举行远程会议。
– 董事会成员投票赞成该决议,并获得批准。2. 批准上次董事会会议纪要。
– 会议纪要经过审查并一致批准。3. 批准第 125 号决议,授权发行高达 16 亿美元的 2023 财年 D 系列未来税收担保债券。
– 提交了决议,并提及了委员会的建议。
– 董事会成员一致投票赞成该决议,并获得批准。行动项目
1. 会议记录中未提及。休会
– 董事会会议休会。注意:所提供的会议记录不包含会议的具体细节,例如日期、时间和地点。请根据组织的上下文和要求填写缺失的信息。
会议纪要比会议记录整洁得多,也更容易阅读。一个特殊的事实是,这份记录是两个会议合并为一个,你可以从纪要中得知这一点。但是,如果你希望它采用特定的格式,可能仍然需要进行润色。一些应该出现在纪要中但会议记录中没有的信息被替换为占位符,你需要填写。这与总结会议记录相比应该不会太困难。
ChatGPT 可以轻松完成这项工作,因为它经过训练以理解语言,并且可以提取关键信息。你可以通过适当的提示来指示 ChatGPT 以特定格式重现关键信息,使其成为一名有用的秘书。
然而,有些会议很长。会议记录可能非常长,会超出 ChatGPT 的上下文长度限制。在这种情况下,ChatGPT 将拒绝继续。你可能需要将会议记录分解成多个块,让 ChatGPT 先分别总结每个块。然后将总结结果合并以生成纪要。
提取非结构化信息
由于 ChatGPT 能够理解文本,你可以使用它来提取非结构化信息。非结构化信息是指那些融入文本段落中的信息,与列表和表格相反。由于它没有明显的模式,因此很难搜索。
你可以利用 ChatGPT 的语言理解能力来帮助你提取非结构化信息并生成列表。让我们考虑以下示例:
阅读以下文本,并回答以下问题:
1. 最新的旅客人数是多少?
2. 提及此数据量的日期是何时?
3. 之前有多少旅客?
4. 提及之前数据量的日期是何时?文本
纽约和新泽西港务局今天宣布,自 COVID-19 大流行开始以来,其区域机场的月航空旅客量首次超过了疫情前的水平。
11 月份,港务局机场共处理了 1100 万名旅客,达到 2019 年疫情前 11 月份旅客量的 102%。11 月份航空旅行的强劲需求主要由感恩节期间的国内旅客推动,当时前往美国度假的旅客比 2019 年感恩节增加了 8%。
港务局还预测,到 2022 年底,航空旅行需求将保持高位,尤其是在 2022 年 12 月 23 日星期五至 2023 年 1 月 2 日星期一的 11 天期间。
双州地区航空旅行的明显恢复,标志着港务局在其三大主要区域机场的重建项目取得了一年的成就和开放。这与 2020 年疫情低谷时期形成了鲜明对比,当时三大主要机场的客运量急剧下降,仅为疫情前水平的四分之一。
“在经历了两年的全球大流行之后,我们被困在家中,渴望旅行,现在看到我们的机场恢复到疫情前的水平,我们感到非常欣慰,”港务局主席凯文·奥图尔说。“今年以来,我们看到机场旅客稳步回升,当他们看到等待他们的全新世界级航空设施时,脸上露出了惊喜。我们期待在未来几周内迎来数百万名旅客,因为人们将与亲人一起庆祝节日。”
“2022 年 11 月航空客运量超过疫情前的 2019 年 11 月数字,这表明我们对该地区机场的历史性投资至关重要,”港务局执行董事里克·科顿说。“我们的目标是为通过我们机场旅行的航空旅客提供世界一流的 21 世纪旅行体验,并为该地区经济在疫情后的日益复苏做出贡献。”
拉瓜迪亚机场今年早些时候完成了耗资 80 亿美元的公私合作改造,成为美国过去 25 年来第一座新建的主要机场。新机场分阶段建设,以确保其在整个施工过程中保持全面运营且不损失运力。今年,新 B 航站楼的所有旅客设施以及达美航空的新 C 航站楼和重建的道路网络都已开放。新机场因其 21 世纪的设计、设施和客户体验而受到旅客好评,并获得了全球受人尊敬的行业组织的奖项和荣誉。
纽瓦克自由国际机场也在 2022 年 11 月迎来了一个重要的里程碑,其新 A 航站楼举行了剪彩仪式。该航站楼拥有约 100 万平方英尺的空间和 33 个登机口,可容纳更大的飞机,并设有现代化的通用值机区、安检区和行李提取区,预计每年可高效处理约 1360 万名旅客。港务局还宣布了一位世界级总体规划师,负责领导整个机场的改造。新 A 航站楼预计将于 2023 年初投入使用。
在约翰·F·肯尼迪国际机场,港务局完成了两个新航站楼——一号航站楼和六号航站楼——的财务结算,并完成了八号航站楼的扩建,增加了约 13 万平方英尺的翻新空间。此次扩建标志着肯尼迪机场改造的第一步,并允许英国航空公司从其位于拥有 50 年历史的七号航站楼的长期基地迁至八号航站楼与美国航空公司共用。七号航站楼将被拆除,为明年初开始建设的新六号航站楼腾出空间。四号航站楼耗资 15 亿美元的扩建工程也正在进行中,已于 2021 年 12 月破土动工。
文本摘自此处发布的新闻稿。
ChatGPT 的结果如下:
1. 文本中提到的最新旅客人数为 1100 万人次。
2. 提及此数据量的日期是 11 月。
3. 文本未提供 COVID-19 大流行之前的旅客人数信息。
4. 文本中未提及之前数据量的日期。
提取出的结果更容易获取,你可以将其用于其他用途。另请注意,当提供的文本不包含你正在寻找的信息时,它会告诉你。这是因为在你的提示中,你要求它仅根据文本进行回答。
如何使用 ChatGPT 进行 NLU
ChatGPT 作为语言模型应该很容易理解文本。但是,为了利用其自然语言理解能力,你应该小心,不要让它“幻觉”。当允许它生成超出上下文的文本时,就会发生幻觉。可以通过在提示中明确提及只使用提供的任务信息,而不使用其他任何信息来避免这种情况。
即便如此,请记住 ChatGPT 可能无法很好地理解所有内容。如果存在一些超出上下文的信息,ChatGPT 将无法知晓。一个具体的例子是特定领域的缩写和行话。如果有些信息不太直观,ChatGPT 也可能无法提取。你可以尝试多次重新生成上面的第二个示例。ChatGPT 有时无法找到确切的旅客量,因为文本将其表示为另一个量的百分比。
总结
在这篇文章中,你已经看到了如何将 ChatGPT 用作自然语言理解工具。你已经看到了以下示例:
- 将会议记录转换为纪要
- 从文本中提取特定信息
利用 ChatGPT 的这种能力,你可以轻松构建一个助手,例如从收到的电子邮件中提取行动项目并创建待办事项列表。
非常感谢你,亲爱的杰森先生。你的话题非常有帮助。
此致。
Samah – 也门。
感谢 Samah 的支持和反馈!我们非常感谢。
谢谢 Jason,非常好的见解和指导。
非常欢迎 Chittaranjan!我们感谢你的反馈!