本帖最后由 edennow 于 2025-5-1 07:39 编辑
【更新内容】
目前脚本已经基本覆盖论坛原有的所有校对软件的功能,除了发现 Bug 进行修复外,近期不再进行更新,如果有希望补充到脚本词库的词条或规则,欢迎分享。
4 月 27 日更新,显著提升 文件全局搜索.bat 的搜索性能,并新增章节序号检测和重排功能,应该没什么别的功能还要处理了。
另外最近 google 的 gemini 2.5 pro 模型支持单次约三万字的校对,多开几个 tab 标签页,一次让它校对八九万字,一天起码能校对个几十万字,个人阅读肯定够用了,效果挺不错的。
可以直接上科技到它官方的 aistudio 网页里用,或者自己找一些平台接入 api 也可以,反正免费额度也够用,当然充钱会让你变得更强就是了。
3 月 17 日更新,在 【双击运行】1.书籍校正.bat 中新增“给生僻字注音”功能(4 月 7 日更新,支持每个生僻字只注音一次)。
词库主要来自 sigil 吧的生僻字注音插件,有的字不一定真的很“生僻”,可以自己在 src/maps/7.生僻字词库.php 中调整。
注意不支持“自动判断多音字”,如果注音时有多个拼音,需要自己在 BC 比较注音结果时进行选择(也可以尝试自己扩展那个生僻字词库,可查看“泂”字和“泂泂”的示例,通过增加固定词组来判断特定的多音字)。
3 月 1 日更新,新增 【双击运行】15.查找文本中的重复段落.bat,对文本中可能存在的重复段落进行简单的检测(之前的软件一个文件最多只能检测 30000 多行也太无厘头了吧)。
能够提前排查一些可能存在的重复章节内容,也能鉴赏一下某些作者是如何无节操复制粘贴水文的。

论坛里原先算是有了比较全的用于文本校对的工具,不过我自己使用体验下来,感觉操作流程还是有点机械重复了。
毕竟是十多年前到现在一直没有更新过的工具了,从以前论坛中经过软件校对发出来的文本内容来看,网文中很多常见的错别字也没有得到进一步修正。
因此另外写了一套自动修正的脚本,支持 epub 和 txt 两种格式的文件,支持自动嵌套递归批量修改书籍文件。
再也不想看到:
“半响”“嘎然而止”“诺大的”“按耐”“一颗树”“一柱香”
“臻首”(真想知道是哪位大才子最先开始这么写的,去和写“柔夷”那伙坐一桌) “附骨之蛆”(应为“疽”,百思不得其解的一个错词,到底为什么能写成“蛆”-_-||)
“一滩水/血/泥”(应为“一摊水/血/泥”,不用怀疑,“滩”并没有量词的用法)
这些令人哭笑不得(按“网文通假字”的写法可能是“苦笑不得”)的错别字出现在文本里了。
php 环境
现在把 php 8.1 版本的可执行文件也同时打包进来了,不需要额外自己安装环境,一键运行即可(Windows 系统中)。
因为本身代码写得很简单,为了减小压缩包体积,去掉了一些 php 扩展文件,如果执行有问题可以提出。 如果有在 mac 或者其他系统使用的需要,也可以私信问一下我,脚本本身的代码是跨平台的,只是改变一下调用方式就可以了。
|