楼主: edennow

[软件] 分享个人使用的网文常见字词替换校对表(含 php 脚本)

  [复制链接]

17

听众

0

收听

14

好友

贡士

Rank: 7Rank: 7Rank: 7

UID
155378
积分
3003
回帖
1031
主题
67
铜币
45362
威望
2448
银币
0
贡献
0
发书数
57
注册时间
2023-6-14
最后登录
2024-5-22
在线时间
1547 小时
 楼主| 发表于 2023-11-16 18:00 | 显示全部楼层
本帖最后由 edennow 于 2023-11-16 18:06 编辑
cumt313 发表于 2023-11-16 17:18
我还是习惯用ed的宏,PHP完全不懂。我之前用风遗尘的宏,不断扩充了词条,感觉校对也快了不少。没想到楼主 ...

代码最早的部分是很久之前写的了(不然可能也不会用 php 来弄),
之所以另外写一份 php 的代码,是因为我不太懂 emeditor 的宏写法哈哈。

现在写的 php 代码也比较随便,都是想到哪写到哪,功能也比较简单,主要是文件批量操作(包括对 epub 文件的一系列处理)这块没去了解用 emeditor 的 js 怎么写。
另外就是目前的 php 代码的词条替换这块有稍微优化过,用 emeditor 的话,词条上到一两万这种数量,我感觉已经有点慢了,但是用现在的 php 代码,即使是用 txtFormat 的完整词库(接近十万条)来进行替换,速度也还在我可接受的范围内,暂时不会有什么速度焦虑。

其实如果想试试用这个 php 脚本的话,只要知道怎么修改那几个词库文件应该就可以了,和改 emeditor 的词条也没有啥区别,其他就是鼠标双击运行一下那几个 bat 文件。

不过现在我的思路和做法都是基于自己维护词库来进行替换的,和 txtFormat 那些也没啥区别(十几年前的工具了),如果有大佬能够用现在的 ai 模型调出比较完美易用的中文校正,才算是事半功倍了。
回复 支持 反对

使用道具 举报

8

听众

0

收听

2

好友

举人

Rank: 6Rank: 6

UID
2230
积分
1641
回帖
2025
主题
1
铜币
9503
威望
628
银币
0
贡献
0
发书数
0
注册时间
2015-7-1
最后登录
2024-5-22
在线时间
812 小时
QQ
发表于 2023-11-16 17:18 | 显示全部楼层
我还是习惯用ed的宏,PHP完全不懂。我之前用风遗尘的宏,不断扩充了词条,感觉校对也快了不少。没想到楼主整了一个一万多的词条,直接是我的几倍。我会去除一些重复的,还有一些误伤的,剩下的精华词条添到我自己的宏里面,误伤的词条放到校对助手里面。我现在校对小说第一步是ed直接批量替换,然后用校对助手,最后再用黑马。这些软件随着词库的扩大,运行确实会越来越慢,但校对效率却会成倍提高。
回复 支持 反对

使用道具 举报

8

听众

0

收听

2

好友

举人

Rank: 6Rank: 6

UID
2230
积分
1641
回帖
2025
主题
1
铜币
9503
威望
628
银币
0
贡献
0
发书数
0
注册时间
2015-7-1
最后登录
2024-5-22
在线时间
812 小时
QQ
发表于 2023-11-16 16:57 | 显示全部楼层
楼主真的太强了,之前的帖子我都还在反复学习,没想到又更新了。
回复 支持 反对

使用道具 举报

17

听众

0

收听

14

好友

贡士

Rank: 7Rank: 7Rank: 7

UID
155378
积分
3003
回帖
1031
主题
67
铜币
45362
威望
2448
银币
0
贡献
0
发书数
57
注册时间
2023-6-14
最后登录
2024-5-22
在线时间
1547 小时
 楼主| 发表于 2023-10-10 21:16 | 显示全部楼层
白看一辈子 发表于 2023-10-10 20:04
直接脚本一建改错字容易误杀
如果搞完还要考BC的话还不如TXTformat一个一个校

对了,另外说一下,不是说用了这个脚本就不能用 txtformat 再校对了,这个脚本里的蛮多个词条都是我用 txtformat 校正的过程中记录下来的,应该说也算覆盖了一部分 txtformat 的词库。

可以试想一下每次打开 txtformat 都要把“提心掉胆”改成“提心吊胆”,把“谈笑风声”改成“谈笑风生”……
这种词条每校正一个文档就要手动改一遍,我个人是觉得蛮心累的。

我感觉一个负责任点的校对在最后发布之前肯定是要用 bc 比较一下以确认结果的,所以无非是“txtformat 改正->bc 对比”这个流程前面加上执行这个脚本而已,变成了:
“脚本校对->txtformat 改正->bc 对比”。

这个新加的步骤既不耗费时间精力,也能自动帮你把很多重复词条提前改正好。
回复 支持 反对

使用道具 举报

17

听众

0

收听

14

好友

贡士

Rank: 7Rank: 7Rank: 7

UID
155378
积分
3003
回帖
1031
主题
67
铜币
45362
威望
2448
银币
0
贡献
0
发书数
57
注册时间
2023-6-14
最后登录
2024-5-22
在线时间
1547 小时
 楼主| 发表于 2023-10-10 20:31 | 显示全部楼层
本帖最后由 edennow 于 2023-10-10 20:33 编辑
白看一辈子 发表于 2023-10-10 20:04
直接脚本一建改错字容易误杀
如果搞完还要考BC的话还不如TXTformat一个一个校

txtformat 一个一个校不是不行,是每次都要重复劳动很无聊。
而且就算是用这个软件校对,也还是会有误伤(特别是如果用了“全部替换”的话),事后还是要用 beyond compare 检查一下才知道有没有改错。

建议你花个 10 秒钟跑一下脚本体验一下,现在的误伤率应该已经没有这么高了,而且看事后结果总比一个一个往前推的效率高一点。
[发帖际遇]: edennow 在寺庙拜佛,偶遇功德箱破损,贪财贪财,捡得 2 铜币. 幸运榜 / 衰神榜
回复 支持 反对

使用道具 举报

6

听众

0

收听

5

好友

进士

Rank: 8Rank: 8

UID
151182
积分
6992
回帖
5332
主题
127
铜币
38600
威望
4254
银币
0
贡献
0
发书数
86
注册时间
2023-3-11
最后登录
2024-5-21
在线时间
541 小时

发帖系列:新手入门发主题系列:闻鸡起舞发帖系列:初尝滋味原创或校书系列:入门发帖系列:奋勇作战发书系列:乐于分享原创或校书系列:觉醒发书系列:有福同享发帖系列:初步成就

发表于 2023-10-10 20:04 | 显示全部楼层
直接脚本一建改错字容易误杀
如果搞完还要考BC的话还不如TXTformat一个一个校
回复 支持 反对

使用道具 举报

8

听众

0

收听

1

好友

贡士

Rank: 7Rank: 7Rank: 7

UID
125251
积分
2784
回帖
682
主题
444
铜币
20456
威望
2177
银币
0
贡献
0
发书数
443
注册时间
2020-7-3
最后登录
2024-5-22
在线时间
212 小时
发表于 2023-10-9 14:58 | 显示全部楼层
楼主好厉害,虽然我不怎么制作电子书,但是还是要感谢
回复 支持 反对

使用道具 举报

17

听众

0

收听

14

好友

贡士

Rank: 7Rank: 7Rank: 7

UID
155378
积分
3003
回帖
1031
主题
67
铜币
45362
威望
2448
银币
0
贡献
0
发书数
57
注册时间
2023-6-14
最后登录
2024-5-22
在线时间
1547 小时
 楼主| 发表于 2023-9-20 07:06 | 显示全部楼层

用新版本的宏附件再试试,不过这个宏的写法太过简单粗暴了,建议还是尽量用 php 脚本吧,速度比目前 emeditor 的宏快很多,词条也更完善一点。
回复 支持 反对

使用道具 举报

30

听众

0

收听

0

好友

举人

Rank: 6Rank: 6

UID
8401
积分
1369
回帖
2720
主题
3
铜币
61
威望
7
银币
1
贡献
0
发书数
0
注册时间
2015-8-30
最后登录
2024-5-22
在线时间
1794 小时
发表于 2023-9-20 01:32 | 显示全部楼层

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复 支持 反对

使用道具 举报

3

听众

0

收听

0

好友

儒士

Rank: 4

UID
155110
积分
347
回帖
268
主题
1
铜币
1260
威望
212
银币
0
贡献
0
发书数
0
注册时间
2023-6-9
最后登录
2024-5-14
在线时间
58 小时
发表于 2023-9-5 20:41 | 显示全部楼层
edennow 发表于 2023-9-5 18:20
那确实奇怪了,我用的是他那个 x64 的包,是能成功替换的(会卡一段时间),可能得等哪位大佬帮忙看看了 ...

宏报错的行数,看起来又没啥问题。就很奇怪。

bat 命令的话,直接 xcopy /s /i /y books booksBak 一条指令就可以了。
[发帖际遇]: seeyuer 今天运气很好,系统奖励 1 威望. 幸运榜 / 衰神榜
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2024-5-22 20:17 , Processed in 0.316581 second(s), 25 queries .

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表