本来是打算发点之前囤积的剧评,要做的时候反而有些“近乡情怯”了,思来想去,还是立些Flag吹个牛激励下自己好。
前者不用多说,希望以后不会荒废这个博客;至于后者,真的是打本人苦所谓评分久矣...且不说现在的作者写本近乎于都是偏向于女生体验(真的是要大喊一声,男玩家不是牛马,男玩家是人!),其他各种诸如水军刷好评之类、各种主观但不全面的评测(人之常情),甚至部分平台亲自下场操作分数,不知所谓的控评机制...
现在科技水平如此发达,最近吃了这么多烂本之后,终于是下定决心为自己、为同好做点力所能及之事了!所以从现在开始新建文件夹————写个用AI代入各个角色体验剧本并给出最后分数的程序。
现在GPT也迭代这么多代了,GPT-4o的数据日期是截止到23年10月,在语言理解和生成方面更是领先GPT-3.5很多很多,除了Token还是有所限制之外,需要分次理解文本,甚至有时候角色本字数过多的时候需要人工删减,可能会对最终的结果有所影响,但是AI与人各有优缺,工具最终都是服务于人的,AI给出的结果也不过是一个参考以及我个人的小小恶趣味罢了,应该是能够暂时胜任我预想中的任务(当然,能训练出自己的模型就更好了,更有针对性,也许我会尝试去做呢?又一个Flag...)
至于AI怎么个评测法,现在也已经有了初步的想法:
- 面具设置:各种人设,诸如亲、友、爱、偏好抗压、喜欢疯批等等,设置侧重点,尽量囊括吧。
- 体验方面:用以上面具各体验一遍对应性别角色本,尽量模拟现实中吃多线以及调剂/微调剂/心测不符但是确实能吃的情况。
- 分析次数:现在4o的价格还算能接受,剧本里的文本大多都是日常用字,Tokens方面应该不会相差太多,加上预想中基本上都是消耗input tokens,所以跑个面具人设的双数就足够了吧(暂定)。
- 模型选择:gpt-4o-2024-05-13或gpt-4o-2024-08-06,4o-mini不在考虑之内。
- 点评方向:见下文;文笔方面AI点评设置占比更低一点,至于文风每个人都有不同的喜好,所以AI不点评。
- AI任务:只要求给个短评以及分数就好,然后综合所有面具给出的平均分即为AI对这个本的评分。
关于如何去评价一个剧本的一些拙见:
- 剧情:剧情是否连贯和合理,是否营造出玩家喜欢的氛围感,紧张感,是否有吸引力。(偷懒了,把文笔文风直接算进剧情设计,哈哈。)
- 角色塑造:人设是否合理;人设变化是否有其逻辑。
- 情感线:情感是否真实,能让玩家代入,打动玩家;有没有其发展和变化,变化是否符合逻辑。(最烦有些作者玩一些草蛇灰线,但没有后续。)
- 立意:作者有没有明确的主题和想表达的一些思想,体验结束后是否能激起玩家的讨论、是否有积极的反馈。
- 服化道:灯光、BGM、道具是否合理,全面。(诚然更多的是要看店家是否上心,AI也无法点评)
- 结局:有始有终,方得圆满。一个合心意的结局也是非常重要的,但这方面就见仁见智了。
- 演绎:这一方面,真的是良莠不齐,AI也无法点评,现实中也是完全看店家,只能靠广大玩家们互相传唱了。
[...]摸鱼纠结了好几天,到底是把评分展示功能单独写个Web方便以后扩展,还是能省则省,修改下typecho,把功能放在博客里。罗曼·罗兰说过“懒惰是人类进步的阶梯”,至少这句话对我很适用,最后还是决定选择后者。基于这篇博客的想法,第一份实验品已经出炉了,那就是《秦风颂》[...]