文本检测

文本检测算法:

  • 针对文本检测问题专门设计的框架
    • Top-down 和 bottom-up
    • CTPN、Textboxes、Textboxes++ Pixellink
  • Top-down: 先检测文本区域,再找出文本线
  • Bottom-up:先检测出字符,再串成文本线
  • bottom-up缺点:
    • 没有考虑上下文
    • 不够鲁棒
    • 太多子模块
    • 太复杂且误差逐步积累
    • 性能受限

文本检测算法改进方向:

  • 特征提取
  • 区域建议网络(RPB)
  • 多目标协同训练
  • Loss改进
  • 非极大值抑制(NMS)
  • 半监督学习
  • 等等

CTPN模型

  • 模型介绍
    • 可以检测水平或微斜的文本行
    • 文本行可以被看成一个字符序列,文本字符间上下文
    • 数据后处理阶段:合并相邻的小文字块为文本行
    • https://github.com/tianzhi0549/CTPN

计算机视觉     

本博客所有文章除特别声明外,均采用 CC BY-SA 3.0协议 。转载请注明出处!