查看: 1435|回复: 11

[求助] 论坛中是否有快速解决文本中隐蔽字的软件或者好方法吗???

[复制链接]

0

听众

1

收听

4

好友

荣誉版主

Rank: 14Rank: 14Rank: 14Rank: 14

UID
327
积分
900
回帖
46
主题
15
铜币
1707
威望
869
银币
0
贡献
0
发书数
2
注册时间
2015-5-12
最后登录
2017-2-19
在线时间
46 小时
发表于 2016-4-2 21:14 | 显示全部楼层 |阅读模式
本帖最后由 zengzheng520 于 2016-4-2 21:18 编辑

(-__-)b,最好是批量处理文本中的隐蔽字      

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
自古英雄多好色,未必好色尽英雄。
我虽并非英雄汉,唯有好色似英雄。
       -----张学良
回复

使用道具 举报

8

听众

0

收听

2

好友

贡士

Rank: 7Rank: 7Rank: 7

UID
431
积分
2452
回帖
2715
主题
1
铜币
13302
威望
1094
银币
0
贡献
0
发书数
0
注册时间
2015-5-14
最后登录
2021-11-19
在线时间
1359 小时
发表于 2016-4-3 06:51 | 显示全部楼层
自古破坏易而创造难,兲朝屏蔽乃人类历史上一绝。人脑补缺尚且困难,电脑解决更加不易。希望2300年能解决吧,呵呵~~~~

评分

参与人数 1铜币 +2 收起 理由
baizhai1704 + 2 说得对……ID这么熟,你这是换头像了么?

查看全部评分

回复 支持 反对

使用道具 举报

3

听众

0

收听

1

好友

儒士

Rank: 4

UID
803
积分
385
回帖
135
主题
1
铜币
3027
威望
317
银币
0
贡献
0
发书数
0
注册时间
2015-5-25
最后登录
2024-4-20
在线时间
699 小时
发表于 2016-4-3 09:19 | 显示全部楼层
有是有,但是不准确,这些屏蔽字的处理一般的做法都是根据常用的一些写进脚本里,根据可能的上下文来处理,不过效果嘛~就呵呵了
回复 支持 反对

使用道具 举报

24

听众

1

收听

1

好友

进士

Rank: 8Rank: 8

UID
251
积分
7711
回帖
6300
主题
5
铜币
27562
威望
4558
银币
16
贡献
0
发书数
3
注册时间
2015-5-7
最后登录
2024-5-7
在线时间
1238 小时
发表于 2016-4-3 14:33 | 显示全部楼层
这样的文本不要也罢。

评分

参与人数 1铜币 +2 收起 理由
baizhai1704 + 2 论坛中的很多校本最初就是这样子的……

查看全部评分

回复 支持 反对

使用道具 举报

10

听众

0

收听

1

好友

贡士

Rank: 7Rank: 7Rank: 7

UID
1402
积分
3073
回帖
3654
主题
3
铜币
7801
威望
1244
银币
0
贡献
0
发书数
0
注册时间
2015-6-3
最后登录
2024-5-7
在线时间
1559 小时
发表于 2016-4-3 15:20 | 显示全部楼层
晕死,这样的文章你也能看下去
回复 支持 反对

使用道具 举报

7

听众

5

收听

10

好友

阡陌书组

Rank: 13Rank: 13Rank: 13Rank: 13

UID
246
积分
3085
回帖
90
主题
64
铜币
27291
威望
2872
银币
0
贡献
65
发书数
56
注册时间
2015-5-6
最后登录
2024-4-30
在线时间
742 小时
发表于 2016-4-3 16:30 | 显示全部楼层
有的一定记得告诉我。
回复 支持 反对

使用道具 举报

11

听众

1

收听

1

好友

贡士

Rank: 7Rank: 7Rank: 7

UID
1061
积分
3588
回帖
2220
主题
1
铜币
14783
威望
2476
银币
0
贡献
0
发书数
0
注册时间
2015-5-26
最后登录
2024-4-25
在线时间
789 小时
发表于 2016-4-3 16:47 | 显示全部楼层
屏蔽字恐怕只能靠原文上下文来判断推测,尤其是现在屏蔽词越来越多的时代。
回复 支持 反对

使用道具 举报

20

听众

0

收听

1

好友

翰林

Rank: 9Rank: 9Rank: 9

UID
476
积分
11384
回帖
6321
主题
1904
铜币
38315
威望
7270
银币
0
贡献
0
发书数
16
注册时间
2015-5-15
最后登录
2024-5-7
在线时间
1561 小时
发表于 2016-4-3 17:13 | 显示全部楼层
这个,我想只能多上一句或者几句话才能判断出来是什么字词,不然的话,我想现在的人工智能还是达不到那种水平的。
回复 支持 反对

使用道具 举报

72

听众

0

收听

51

好友

版主

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

UID
10
积分
20589
回帖
988
主题
903
铜币
93739
威望
19554
银币
1011
贡献
34
发书数
218
注册时间
2015-5-5
最后登录
2024-5-7
在线时间
4405 小时
发表于 2016-4-3 17:20 | 显示全部楼层
没什么好办法,屏蔽字只能一个一个过,靠人脑自己判断,靠电脑很容易出错的。。。
真要屏蔽字太多,到lz文本这种程度的话,与其费力去还原,还不如另找别的版本。。。
或者这么说,屏蔽字的多少,可以直接衡量原始文本的质量,太多的话,说明文本太烂不值得去整理,直接淘汰掉吧。。。
回复 支持 反对

使用道具 举报

13

听众

0

收听

1

好友

贡士

Rank: 7Rank: 7Rank: 7

UID
949
积分
2234
回帖
2516
主题
1
铜币
3635
威望
975
银币
0
贡献
0
发书数
0
注册时间
2015-5-26
最后登录
2024-5-6
在线时间
705 小时
发表于 2016-4-4 00:00 | 显示全部楼层
以后中国的网络小说就是各种符号了!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2024-5-8 09:02 , Processed in 0.048076 second(s), 25 queries .

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表