V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
yiqunz
V2EX  ›  Java

Java ITEXT 对 pdf 文本部分文本进行隐藏处理求助

 •  
 •   yiqunz · 191 天前 · 680 次点击
  这是一个创建于 191 天前的主题,其中的信息可能已经有所发展或是发生改变。

  JAVA ITEXT 对 pdf 文本进行处理

  需求:隐藏敏感数据,比如把 pdf 里的电话号码删除

  问题点:目前使用白色遮挡层去实现,生成的 pdf 表面是去除了电话号码。 但是在空白区域里还是能将电话号码复制出来。

      PdfContentByte canvas = pdfStamper.getOverContent(1);
      canvas.saveState();
      //白色遮挡层
      canvas.setColorFill(BaseColor.WHITE);
  

  不知道各位大佬有什么其他的实现方式处理

  9 条回复    2021-11-11 10:11:59 +08:00
  wowo243
      1
  wowo243  
     191 天前
  为啥不直接删除,还覆盖一层
  yiqunz
      2
  yiqunz  
  OP
     191 天前
  @wowo243 怎么删?
  yinzhili
      3
  yinzhili  
     191 天前
  如果是自己生成的 PDF ,在生成之前就抹掉敏感数据是最简单的
  yiqunz
      4
  yiqunz  
  OP
     191 天前
  @yinzhili 这。。我当然知道,处理别人上传的 pdf 。。
  buliugu
      5
  buliugu  
     190 天前
  读取之后处理敏感信息然后直接重新生成一份新的 pdf
  yiqunz
      6
  yiqunz  
  OP
     190 天前
  @buliugu 具体怎么处理呢?有参考的博客或者用到的技术么?难点在于我没找到这样做的方法。。。
  Jh1n
      7
  Jh1n  
     190 天前
  覆盖然后写入新的内容比如空字符串
  yiqunz
      8
  yiqunz  
  OP
     190 天前
  @Jh1n 没有用的。。贴图片盖住都不行,还是能复制。。能搜索出来
  buliugu
      9
  buliugu  
     189 天前
  @yiqunz 有个 PdfCopy 类可以看一下
  关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   4192 人在线   最高记录 5497   ·     Select Language
  创意工作者们的社区
  World is powered by solitude
  VERSION: 3.9.8.5 · 36ms · UTC 06:40 · PVG 14:40 · LAX 23:40 · JFK 02:40
  Developed with CodeLauncher
  ♥ Do have faith in what you're doing.