DiffusionSTR: Diffusion Model for Scene Text Recognition (2306.16707v1)

Published 29 Jun 2023 in cs.CV

Abstract: This paper presents Diffusion Model for Scene Text Recognition (DiffusionSTR), an end-to-end text recognition framework using diffusion models for recognizing text in the wild. While existing studies have viewed the scene text recognition task as an image-to-text transformation, we rethought it as a text-text one under images in a diffusion model. We show for the first time that the diffusion model can be applied to text recognition. Furthermore, experimental results on publicly available datasets show that the proposed method achieves competitive accuracy compared to state-of-the-art methods.

References (30)

Citations (6)

View on Semantic Scholar

Summary

We haven't generated a summary for this paper yet.

Summarize Now

DiffusionSTR: Diffusion Model for Scene Text Recognition (2306.16707v1)

Summary

Related Papers