田渊栋等原班人马又一新作：AI生成长篇故事，数千字长文也能连贯、有趣-阿里云开发者社区

田渊栋等原班人马又一新作：AI生成长篇故事，数千字长文也能连贯、有趣

2023-05-18 118

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 田渊栋等原班人马又一新作：AI生成长篇故事，数千字长文也能连贯、有趣

以后，写故事这脑力活可以交给 AI 了。

前段时间，模仿人类写作过程的语言模型 Re^3 发布，该模型不需要微调大模型，而是通过设计 prompt 来生成一致性强的故事。

现在，该研究团队又提出了一个生成故事的新模型 DOC。论文作者 Kevin Yang、田渊栋也在推特上发文宣传了 DOC 模型，表示 DOC 比 Re^3 生成的故事更加连贯、有趣。

DOC 框架意指详细大纲控制（Detailed Outline Control），用于在自动生成数千字长故事时提高情节的连贯性。DOC 由两个互补的组件组成：详细大纲组件（Detailed Outliner）、详细控制器（Detailed Controller）。

论文地址：https://arxiv.org/pdf/2212.10077.pdf

Detailed Outliner 负责创建详细的、分层结构的大纲，将写作创意从起草转移到规划阶段。Detailed Controller 则通过控制故事段落与大纲细节对齐，确保生成结果遵循详细的大纲。

该研究对模型自动生成故事的功能进行了人工评估，DOC 在多个指标上获得了大幅增益：情节连贯性（22.5%）、大纲相关性（28.2%）和趣味性（20.7%），大大优于 Re^3 模型。此外，DOC 在交互式生成环境中更易于控制。

DOC

与 Re^3 类似，DOC 通过将写作过程分解为计划、起草、重写和编辑步骤，生成超过 2000 字、情节连贯的长篇故事。DOC 遵循 Re^3 的高级写作过程和基于结构化提示的段落生成。不过 DOC 删除了耗时的编辑步骤，即便如此，但对最终故事的质量没有影响。

不同于 Re^3 存在的缺点，如无法保持远程情节的连贯性、与周围环境不符的冗长段落、故事经常偏离最初计划等，DOC 旨在通过两项创新来解决这些缺点：通过 Detailed Outliner 实施更详细的规划，通过 Detailed Controller 在起草过程中相应地进行更详细的控制。

DOC 的高层概述。

Detailed Outliner

Detailed Outliner 递归地生成任意粒度的分层详细大纲。图 3 总结了各个组件。

Detailed Controller

Detailed Controller 增强了生成器与详细大纲保持相关性的能力。该研究将 Detailed Controller 实现为 FUDGE 控制器，以根据给定的摘要指导段落生成。

在起草过程中，Detailed Controller 的灵活性体现在：

事件。将事件描述（图 2，橙色文本）逐字输入控制器。
设置。如果设置发生变化，该研究通过构建输入摘要来说明角色移动到新设置，与事件描述相比使用较低的控制强度。
角色。如果出现了一个没有出现在前一个大纲条目中的角色，该研究还是通过构建一个输入摘要来说明这一点，再次使用较低的控制强度。

实验与评估

该研究比较了处于同一顶级大纲条目的 1000 到 1500 字的段落，而不是完整的故事。评估指标包括三个：连贯性、相关性以及趣味性。

结果如表 1 所示，DOC 生成的段落情节更加连贯且与大纲相关。

表 3 显示了 DOC 根据表 2 中的详细大纲（经大量删节）编写的一个故事（经大量删节）：虽然有些问题仍然存在，但故事还保持整体连贯，遵循大纲内容。

人机交互故事生成：如表 4 所示，在四个人机交互指标上，人类更喜欢 DOC 而不是 RE^3 生成的故事：至少四分之三的人表示 DOC 在每个评估指标上都更优秀。

消融实验

为了评估 DOC 的两个主要组成部分，该研究对 DOC 进行了如下两种修改：

DOC-NOOUTLINE，仅根据粗略大纲而不是完整的详细大纲生成故事，使用固定强度的 Detailed Controller。
DOC-NOCONTROL，除了 Detailed Controller 关闭外，其他设置与 DOC 相同。

消融实验的结果如下表 5 所示：

该研究发现，与 Re^3 相比，趣味性的提高主要是由于 DOC 有更详细的大纲；而 Detailed Controller 可能会稍微损害趣味性。该研究通过定性观察发现：进一步增加控制强度会产生更多重复的输出，这些输出越来越狭隘地拟合给定的大纲，而失去了创造力。

如下表 6 所示，该研究又进一步实验证明：Detailed Controller 的作用是大大提高 DOC 在起草过程中遵循大纲细节的能力。

了解更多研究，请参考原论文。

田渊栋等原班人马又一新作：AI生成长篇故事，数千字长文也能连贯、有趣

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

田渊栋等原班人马又一新作：AI生成长篇故事，数千字长文也能连贯、有趣

热门文章

最新文章

相关课程

相关电子书

相关实验场景