阅读网 购物 网址 万年历 小说 | 三丰软件 天天财富 小游戏
TxT小说阅读器
↓小说语音阅读,小说下载↓
一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放,产品展示↓
佛经: 故事 佛经 佛经精华 心经 金刚经 楞伽经 南怀瑾 星云法师 弘一大师 名人学佛 佛教知识 标签
名著: 古典 现代 外国 儿童 武侠 传记 励志 诗词 故事 杂谈 道德经讲解 词句大全 词句标签 哲理句子
网络: 舞文弄墨 恐怖推理 感情生活 潇湘溪苑 瓶邪 原创 小说 故事 鬼故事 微小说 耽美 师生 内向 易经 后宫 鼠猫 美文
教育信息 历史人文 明星艺术 人物音乐 影视娱乐 游戏动漫 | 穿越 校园 武侠 言情 玄幻 经典语录 三国演义 西游记 红楼梦 水浒传
 
  阅读网 -> 明星艺术 -> 如何处理图片才能避免图中文字被OCR识别? -> 正文阅读

[明星艺术]如何处理图片才能避免图中文字被OCR识别?

[收藏本文] 【下载本文】
尝试加纹理,加水印都无效




我也不会做,利用线条粗细的变化,形成视觉文字,连ai和某度都无法识别,这些人是真聪明啊,能做出防和谐的图片文字。
送礼物
还没有人送礼物,鼓励一下作者吧
好问题。
先说说高赞里的这张图像,很有意思,那么为什么有些模型能识别有些识别不了,原理是什么呢?


目前的文字图片识别,主要是CNN-only、CNN+RNN、CNN+Transformer,总之大多包含CNN网络结构。
CNN网络结构包含一个池化层,池化层是卷积神经网络(CNN)中的一种 特殊层,它的主要功能是 对输入特征图进行下采样(降维)。
简单比喻就是缩小图像,但是下采样的方式其实有很多种,比如最大值或平均值或者随便挑一个,如果是最大值或随便挑的下采样,可以看到随着图片缩小,文字的特征很快就消失不见了。


但如果我们使用的是均值滤波,那么特征仍然能够很好的保留,甚至可以说识别的效率提升了


所以我估计不同模型有的能识别出来有的不能,与模型池化的方式非常相关。
那么回到问题。怎么处理图片才能避免图片文字被OCR识别?其实静态图片没什么太多好办法,就是加干扰,比如加一些不同颜色的或者噪点。但这些方法通过模糊,腐蚀、碰撞、缩放几件套下来,都能很大程度清除干扰,让文字被准确识别处理。
但是我们视觉上观察并不仅限于静态图啊,我们完全可以利用人眼的视觉残留效果,把图像做成动态图(因为录屏软件也就这样了,但实际视觉效果其实很清楚)


我们对图片切片,每一帧都是碎片化的






然后我们对各种模型测试一下


deepseek


豆包


ChatGPT


百度


Gemini
好的,全军覆没
上代码(基于PainterEngine):

#include "PainterEngine.h"
px_texture test;
px_int div_width = 20;
px_int div_i;
PX_OBJECT_RENDER_FUNCTION(MyRender)
{
	px_int i;
	div_i ++;
	div_i = div_i % (320 / div_width);

	PX_TextureRender(psurface, &test, 0, 0, PX_ALIGN_LEFTTOP, 0);
	for (i = 0; i < (320 / div_width); i++)
	{
		if ((i+div_i)%8!=0)
		{
			PX_GeoDrawRect(psurface, i * div_width, 0, i * div_width + div_width, 160, PX_COLOR_WHITE);
		}
	}
}

px_int main()
{
	PainterEngine_Initialize(320, 160);
	PainterEngine_SetBackgroundColor(PX_COLOR_WHITE);
	PainterEngine_LoadFontModule("assets/font.ttf", PX_FONTMODULE_CODEPAGE_GBK, 68);
	PX_TextureCreate(mp_static, &test, 320, 160);
	PX_FontModuleDrawText(&test, App.pfontmodule, 160, 80, PX_ALIGN_CENTER, "我是文字", PX_COLOR_BLACK);
	PX_ObjectSetRenderFunction0(root, MyRender);
	return 1;
}

这种写在噪点内的文字极难识别


人类认出来并不困难
接下来是测试环节,首先是QQ截图


豆包


deepseek


kimi


umiOCR


华为的智慧视觉


如果能优化噪点的大小和文字的灰度,会更难识别
雪花动图,静态时无法提取任何信息,播放时可以根据雪花区块的相对运动看到轮廓,当然你说在时间上做个差分再识别那没招了,有这图像处理功夫的手敲一遍字都成了
如果你自己做过OCR的模型,大概就能比较好理解,什么样子的文字图片很难被OCR了。
简单来说,那就是OCR背后模型,没有见过的类型,包括,并不限于,字体,字号,方向,背景,等等。
简单的纹理,水印,形变,等等,基本都是训练模型时候会添加的数据增强手段(data augmentation),所以,无效也很正常。
如果要加,那也要加到比较大的程度,比如,50%以上的噪声,形变,干扰等等。
但是其他的一些手段,比如,直接将文字变成竖排,或者转向90度等,都有可能起效。又比如,使用特殊的艺术字体,草书连笔这样的,也很可能奏效。
万变不离其宗 —— 你的操作,如果是在模型训练阶段已经被很好训练过的,那么大概率是无效的。想要有效,要么你引入训练阶段根本没见过的类型(草体竖排),要么引入见过的类型但是更难的样式(比如高噪声)。
当然,具体的还是要看背后使用的OCR模型 —— 你很难找到一招鲜,吃遍天的操作。很可能,对于这个软件可以免疫OCR的操作,换另个软件就没有那么有效了。
有一个简单合理的操作,那就是利用OCR模型弱智的“阅读顺序”。 通常模型的训练时候的文本都是从左到右,从上到下的。所以,你一旦改变这样的阅读顺序就会造成一个对于模型来说困难的情况 —— 它能认识你说的每一个字,但是它又不知道你在说什么。但是这招对于很多基于大模型的OCR,欺骗性有限。


文生图出来之后,提供了另外的玩法,比如下面这样的隐图,你必须离远了看,才能看出来。


NEWYORK


LIKE
不过这样操作的问题是,文字数量很有限就是了。如果你想文字数量上去,那么可以考虑采用间接的方式 —— 把文字藏在QR code里面,然后把QR code隐写在图片里面。


虽然我从没学过任何图片算法,但看到其他答主放的图,我觉得答案是显然的。
就大家提到的这几个噪点模式开启转化。噪点模式无非就是利用人眼的模糊判断能力做了个门槛儿而已,破解应该极其容易。
其实,这几个常见的噪点混淆,对于人眼来说也就是极限了。再复杂的噪点混淆,有可能人眼自己就先歇菜了,不具备推广价值。
先看第一幅图。


首先,确认问题成立:


首先降噪,用5*5卷积【卷积是我自己琢磨出来的算法,在我的图素论里这东西叫最小识别元素。只是恰好书本里叫这东西“卷积”】求灰度均值,把噪点图转化成模糊图:


这是很明显的几个灰域聚类,于是下一步,我们就开始Kmeans聚类吧。


可以看到,自动聚类成4个类别的灰度值了。最高接的两阶合并为黑,其余合并为灰,试一下。


识别效果:大功告成。


下一幅图片:


问题属实存在:


由于这里间隔比较大,所以模糊的像素范围扩大一点,采用9*9,试一下结果:


本想着炫一下技,结果第一步就搞定。连聚类+合并都不需要:




收工。
PS: 对可疑的高噪点图片,都这么识别一下,看下置信度的变化,也不是什么难事。
你直接提供图片内的文字,不需要OCR。这是唯一的办法。
根本就该直接提供文字内容。不该阻止网民复制使用。
晒钱又不肯分给看客,就是找揍。
OCR的原理,底层实现基本上是通过对特定的函数积分,实现边缘检测,所以如果你的图片文字没有一个有效的边缘,那就很难被识别
最简单的方法是使用字符画工具,画由一些小字符构成,文本识别会优先识别这些小字符,而不是小字符拼成的大画面
没有字符画工具的话,可以用手动蒙版:
1.首先找一些无意义的文字,比如唐诗三百首或者让ai水个文章,以小字打印成黑白图片
2.把你需要说的文字,以大字打印成黑白图片
3.以大字作为半透明蒙版叠加到小字上面
泻药。我最烦那种打!水!印!的,完全无法识别……
好好的文字间来几条线的也是。
竖排当然也能增加难度,主要是后期的整理难度,一两句话还好,一整本书就累觉不爱了。
跨页图底纹的,看似很俏皮,其实很毒瘤……
啊,我为什么要回答这个问题






看到有些同学说这属于是一种 Steganography 技术,其实不是的,Steganography 的目标正相反:机器可以解码而人类不能。


Steganography 的目标是人类无法从左图中看出右图
而题主想要是的人类可以轻松读出,而AI不能,这实际上是一种对抗攻击 (Adversarial Attack)。对抗攻击是一种通过向机器学习模型提供故意设计的输入来欺骗它们的技术。这些输入被称为对抗样本,是通过对合法数据进行修改而创建的。这些改动通常人类无法察觉,但却能导致神经网络以极高的置信度做出错误的预测。
在大模型时代,给图像在二维空间上加各种噪声没什么用了,AI 只会越来越趋近于人类看图的方式,人类轻松可以看出的,AI 一定可以搞定。甚至于人类很难认出的,AI 也可以猜个七七八八。比如上面有人给出的加噪声办法,我用豆包试了一下,虽然错误不少,但可以看出它已经能看出一些了。


剩下的交给时间就好。
目前纯视觉 OCR 方案有两种,一是各种 OCR 模型,像 Paddle OCR 或 MinerU,输入图片就把里面的文字全部提取出来。另一种是各大 AI 厂商都在用的 MLLM,输入一张图像以及一个对图像的问题,由 MLLM 回答,做 OCR 时就问图里的文字即可。这两个方案各有优缺点,但唯一不变的是基于一个由海量图像及对应文字标签训练出来的视觉编码器。
然而纯视觉的 OCR 方案对 3D 立体画里蕴含的文字的识别恐怕还比较困难,应该需要再加大量这类特定数据来训练,而且能不能训出来目前存疑,我并不确定现在的模型结构和训练方式是否利于充分准确的理解像素级的 pattern 平移和变形?加入这部分数据会不会损坏已有能力?
当然,如果要用 AI 专门解这个问题肯定有更好办法,比如用 agent 先做类型判定再接特定的解码算法应该能搞定,只是这个问题对各大团队的吸引力不高,斗胆预测至少一年内无法攻克。
随便生成一张非常简单的,平行眼的,你们可以大胆的去问问各路 AI 这里面是什么字。


另,生成这个图的程序是用 GPT-5 写的
如果你想要的结果是人眼一下就能看出来文字,ocr识别不出来,这是做不到的,不信把所有回答的方法都加上高斯模糊,或者直接用手机拍屏,没有一个ocr认不出不来的
【人类秒懂,但AI零分,它们根本不懂时间!-哔哩哔哩】 https://b23.tv/dhfvlsV
是个人,甚至有点智商的动物都能立即看出这种视频展示的图形,但是如今任何一个ai,看它都是完全看不到
攻方最差的情况会模仿正常用户,手工记录内容(语音/键盘输入)。
所以最好的方法是让图片没有ocr的价值(
我一看到这个问题就迫不及待想回答一下:
你可以去向傅恒请教经验。
傅恒等人编纂了一本《西域同文志》,里面包含了满文、汉文、三合切音、蒙古文、藏文、托忒文和察合台文。


主词条由这几种文字构成,里面还有大段的汉语注解,就像这样:


我们团队正在整理这本书,按理来说这种收录于《四库全书》的,网上应该很好找 OCR 资源,整理起来会很方便。但实际上网上根本找不到能用的 OCR 资源,为什么呢?因为这本书的整体观是这样的:


我相信有些朋友已经看懵了,我来标注一下这本书的阅读顺序:


大概描述一下就是,从右往左,上下两栏,互不干涉,上下交错。这种逆天排版基本上就已经可以拦住 OCR 了。
而且除了排版逆天,三合切音也是个严重的干扰项,因为三合切音就是用汉字书写的满文,OCR 当然也会把它识别为汉字,这更会增加数据的混乱程度。
以识典古籍为例,识别出来是这样的:


所以如果你问怎么避免 OCR,你只要想出一个人类能看懂,但是和傅恒这个一样逆天的排版就行了。
马赛克是识别里永远的神。
如果一重不够,那就再加一重。
我当年的方案是动图,并且文字要跨时间
主要是两个黑白无规律花纹图,然后对文字部分用异或叠加,并且两个图会运动
造成的结果是文字的轮廓是靠人脑分析出来的,任何一帧都是看不出文字的。
歪个楼,文字可以做成动图,用动的噪点和静的噪点构成反差,暂停是纯噪点了,现在的ai估计没办法识别
视频参考
(回答不完全切题预警!)
稿主本人是初学者,目前还在学习cv相关的基础知识,不是特别了解目前相关技术的实际应用情况(欢迎各位在评论区解惑),但是前不久偶然看到了这样一篇论文:


右图中山地风景中的某位著名明星人像,肉眼可以轻易分辨,但大多数基于深度学习的图像识别技术是无法识别出的。
事实上,目前计算机视觉领域还是有不少有趣的bug(划掉)特性。
ASCII Art组成的文字经常会被识别的一塌糊涂,不过实用程度不高,而且这种东西如果太多的话新训练一个OCR模型也能搞定。
[收藏本文] 【下载本文】
   明星艺术 最新文章
为什么都骂郭德纲,没人骂于谦?
中国住宅建筑质量在国际上属于什么水平?
如何处理图片才能避免图中文字被OCR识别?
拉丁舞比赛真的要赛前脱敏吗?
人民日报作为主流媒体转发广西贺州13岁李明
赵本山儿子赵大牛,是个怎样的人?
艺术是什么?当我们看展的时候应该抱有怎样
怎样快速制作线稿图?
可以分享一张你前任的照片吗?
为什么许多人认为wlop画的鬼刀并不好?
上一篇文章      下一篇文章      查看所有文章
加:2025-09-16 14:21:20  更:2025-09-16 14:36:04 
 
古典名著 名著精选 外国名著 儿童童话 武侠小说 名人传记 学习励志 诗词散文 经典故事 其它杂谈
小说文学 恐怖推理 感情生活 瓶邪 原创小说 小说 故事 鬼故事 微小说 文学 耽美 师生 内向 成功 潇湘溪苑
旧巷笙歌 花千骨 剑来 万相之王 深空彼岸 浅浅寂寞 yy小说吧 穿越小说 校园小说 武侠小说 言情小说 玄幻小说 经典语录 三国演义 西游记 红楼梦 水浒传 古诗 易经 后宫 鼠猫 美文 坏蛋 对联 读后感 文字吧 武动乾坤 遮天 凡人修仙传 吞噬星空 盗墓笔记 斗破苍穹 绝世唐门 龙王传说 诛仙 庶女有毒 哈利波特 雪中悍刀行 知否知否应是绿肥红瘦 极品家丁 龙族 玄界之门 莽荒纪 全职高手 心理罪 校花的贴身高手 美人为馅 三体 我欲封天 少年王
旧巷笙歌 花千骨 剑来 万相之王 深空彼岸 天阿降临 重生唐三 最强狂兵 邻家天使大人把我变成废人这事 顶级弃少 大奉打更人 剑道第一仙 一剑独尊 剑仙在此 渡劫之王 第九特区 不败战神 星门 圣墟
  网站联系: qq:121756557 email:121756557@qq.com