信不出门,字却能被“学会”读懂
社区档案室很安静。管理员把一封旧信摊在台灯下,墨色快看不清了,字也各有各的写法。麻烦在这儿:信里都是私事,连复印件都不能带出门。
有人提了个点子:很多档案室一起“教”同一个识字工具,但谁也不交出原信。管理员才发现大家常把两件事混在一起:教它认字,和让它来读一封新信。类比到医疗:信=影像和病历,工具=训练好的系统。要点:教的时候保密,不等于用的时候保密。
一起教的做法像这样:每家把信留在本地,让工具在本地练,然后只把“该怎么改”的小改动发出去。比起把信寄走安全多了。可这些小改动也可能露馅,碰上特别少见的内容更明显。有人会把改动“抹一抹”,加点随机扰动。抹得越重,越藏得住,识字就越容易跑偏。
还有人把这些改动装进“上锁的盒子”里,外面能合并统计,里面的内容不打开。隐私更强,但老电脑会喘,速度慢,有些常用的判断在盒子里做不了,只能用近似替代,教的过程中误差更大。也有人不想只信一个总管,就让几个人分着管,单点风险小了,配合却更费劲。
然后是第二件事:有个小档案室只有一封特别敏感的信,也没能力从零教出厉害的识字工具。它更想做的是“按次使用”:把信塞在遮挡板后面,通过一个小口请外面的高手帮忙誊写,高手只交回结果,看不到信的内容。小诊所也可能用同样方式借到强工具,但这条路常被忽略。
管理员想找个踏实的把握,却发现很多演示只在一份材料上试过,有的甚至不像真实来信,真正换一批外来的字迹去验的并不多。她把灯关小了点,盯着信纸边缘想明白:隐私强弱、读得准不准、花多长时间,总在互相拉扯。要让人敢用,得在更多不同来源的材料上一起验,包括影像配文字记录。