一周前我发了篇介绍自己项目MuseAI的笔记,一个把小说丢进去就能跟角色一起冒险的AI角色扮演工具。 评论区同学们给我提了很多不错的建议,提到最多的就是,能不能分析几百万字的长篇小说。 我后面仔细一想,还真给我想出来一个方案。我把整个方法在下面分享给大家,感兴趣的同学可以自己用AI工具去实现,如果嫌麻烦也可以直接用我的开源工具。 一、反向生成大纲,200万字的小说,大纲一键生成 长篇小说的问题是,AI的上下文窗口再大,你也不可能一次性把200万字全扔进去。 刚好上篇笔记评论区同学给了我一篇哈利波特全集,大概200万字。我拿来尝试各种方案,最后搞了一个分段处理加总结大纲的二阶段方法。 先把整本小说切成小块,逐段提取情节线,最后合并成一个大纲。实测下来,200万字的长篇,大概几分钟能跑完。 这里分别调用2个Agent,第一个我叫它“长篇-分段摘要”,主要任务是分段提取关键情节。在这一步,我把原文截断为多个5万字的小章节,例如200万字的小说,就会生成40个章节。然后让这个Agent分别分析各章节,再把结果提供给第二阶段。 第二个Agent我叫它“长篇-汇总大纲”,主要任务是汇总最终的大纲。注意,这里很大的一个坑,就是很容易出现输出token不够用被截断的情况,所以我在统提示词里,强调不要超过10000字,但不一定会听话,所以是有失败几率的! 二、用大纲生成世界书和角色列表 之前的背景设定生成,是直接从原文里暴力提取,这样肯定是没法支持几百万字的小说。 现在,既可以支持小说原文生成背景设定,也支持大纲生成背景设定。并且抛弃了原有世界书+角色卡一次性直出的方案,改为第一阶段生成世界书+角色列表,第二阶段再生成角色卡。 并且这里在功能上提供了足够的自由度,你可以选择只出世界书,也可以选择只出角色卡。 三、角色卡一个一个生成,再也不会漏人了 OK,最后到了最关键的环节。老版本提取角色卡的时候,因为是一次性出,经常会漏掉一些配角。现在再也不用担心这个问题,因为有了详细的角色列表,模型再也不会漏掉任何一个角色。 最关键的是,在角色卡提取时,你可以手动输入角色名或者角色列表,这样就绝对不可能再漏了。 #人机恋 #ai角色扮演 #ai伴侣 #酒馆 #sillytavern #酒馆ai #万物皆可howto @HOWTO薯