在 AI 长文写作领域,一项革命性突破正在改写行业规则 —— 由「人工智能之父」Jürgen Schmidhuber 领衔的团队,正式开源其长文写作框架WriteHERE。该框架凭借异质递归规划(Heterogeneous Recursive Planning)技术,实现单次生成超4 万字、100 页专业报告的能力,在小说创作、报告生成场景中全面超越 Perplexity 付费版「深度研究」、DeepMind 的 Agent's Room 及斯坦福 STORM 等顶尖方案。



  • 论文标题:Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models
  • 论文地址:https://arxiv.org/pdf/2503.08275
  • 项目主页 & 在线 Demo://writehere.site/
  • GitHub 仓库:https://github.com/principia-ai/WriteHERE



动态规划颠覆传统

从「大纲先行」到「实时编织」

现有 AI 长文生成系统(如 Agent's Room、STORM)多将写作简化为「规划 - 填充」的线性流程,而 WriteHERE 首次通过数学形式化揭示:长文写作本质上是检索(Retrieval)、推理(Reasoning)、写作(Composition)三类异构任务的动态编织

1. 写作代理系统的五元组定义

研究团队将写作系统抽象为数学元组:



其中:



这一形式化框架突破了传统 AI 写作工具「重生成、轻管理」的设计范式。写作不再是简单的文本扩展,而是记忆空间、工作空间与外部环境的持续交互过程

2. 任务类型的数学建模

研究团队将写作过程解构为三类原子操作:



规划问题的形式化革命

从 HTN 到异质递归

研究团队受层次任务网络(HTN)规划启发,提出写作规划问题的数学定义:





解决方案为满足以下条件的原始操作序列:

  • 可执行性:每个操作的前置条件均被满足。
  • 目标达成:最终工作空间状态符合写作目标。

核心技术

异质性递归与状态化 DAG 任务管理

WriteHERE 的核心突破体现在两大技术创新:

1. 异质任务递归分解:每个写作任务被动态标注类型(检索 / 推理 / 写作),并基于类型分解为子任务,直至可执行的原子任务。例如,当执行「撰写贸易报告第六章:行业深度剖析:识别赢家与输家」,系统进一步分解为以下子任务:

  • 检索任务:收集最新 (截至 2025 年 4 月) 的行业数据,包括科技 (半导体、软件、硬件)、汽车、农业、制药 / 医疗保健、能源和消费品行业的贸易统计、市场份额、公司财务表现、行业报告及专家评论。
  • 推理任务(8 个子任务):构建统一分析框架,确立「赢家」和「输家」识别标准;分别分析科技、汽车、农业、制药 / 医疗保健、能源和消费品行业的关税、非关税措施、宏观经济状况及全球价值链重构影响;规划行业绩效对比可视化内容。
  • 写作任务(8 个子任务):撰写章节引言;分别撰写科技、汽车、农业、制药 / 医疗保健、能源和消费品六大行业的详细分析;撰写章节结论,综合关键发现并过渡至下章区域视角。

2. 状态化层次调度算法:任务依赖关系以有向无环图(DAG)管理,结合任务状态(激活 / 挂起 / 静默)实现自适应执行。该机制确保系统能根据实时反馈动态调整规划深度,例如在贸易报告中,系统能追踪每个子任务的状态,确保在撰写特定章节(如区域分析)前完成其所有依赖任务(如宏观经济影响分析)。

实验表现

全面碾压现有方案

团队在小说创作(Tell me a story 数据集)和技术报告生成(WildSeek 数据集)两大任务中验证了 WriteHERE 的优越性:

  • 小说写作:基于 GPT-4o 和 Claude-3.5-Sonnet,WriteHERE 在情节结构、创意性、角色塑造等维度全面领先。当生成长度从 2000 词扩展至 8000 词时,其优势进一步扩大,整体胜率较 Agent's Room 超过 90%(见图 1)。
  • 技术报告:在信息相关性、覆盖广度、深度等关键指标上,WriteHERE 以接近满分的表现(平均 4.9/5)超越 STORM 和 Co-STORM。对比移除异质递归规划模块的消融实验,性能显著下降,印证了该设计的核心价值(见图 2)。



图 1 小说写作任务评测



图 2 报告写作任务评测

压力测试

百页报告生成

研究团队公开的超100 页《2025 年 Q2 全球贸易战深度报告》展现了框架的极致能力:

系统自动构建了一个包含 16 个主要章节、超过 80 个子任务的异质递归计划,涵盖引言、全球关税结构、非关税壁垒、宏观经济冲击、全球价值链重构、行业赢家与输家、地区分析、未来预测等内容。整个生成过程体现了异质递归规划的优势 —— 系统能够自动根据需要深入研究特定主题(如美国 232 条款钢铝关税扩张),同时保持对整体结构的把控,确保各章节之间的连贯性和一致性。最终报告包含超过 44,000 字的正文,覆盖从关税机制到行业赢家的全面分析。

开源生态与社区反响

作为完全开源(MIT 协议)的框架,WriteHERE 支持开发者自由调用异构 Agent(如专用检索模型、推理引擎),或将彻底改变长文写作工具的商业模式。

英伟达高级研究科学家 Enze Xie 试用后评价模型表现惊艳:



社区用户 @AIExplorer 反馈:

「WriteHERE 太棒了。我把它和 GPT-4o-mini 一起使用,它能有效替代我的大部分 OpenAI 深度搜索。」



知名 AI 领域推特大 V Ben Tossell 更直言:

「这个写作模型太棒了。」



此刻,长文写作的「自动化天花板」已被打破。访问 writehere.site,即可加入这场 AI 写作的革命。

ad1 webp
ad2 webp
ad1 webp
ad2 webp