如果一张图片同时有中文/英文/日文，那么该如何选择模型呢？ #75

Null-Bot9875 · 2023-09-21T08:50:31Z

No description provided.

hiroi-sora · 2023-09-21T09:31:33Z

目前没有模型能同时支持中+日，只能中英或日英。

如果文字的位置相对固定（如双语字幕），可以先切割出中文 / 日文区域的图片，单独送入OCR。

如果文字位置随机，那么可以按以下步骤：

对同一张图片，分别用中文 / 日文库跑一遍，得到两份结果。
遍历两份结果，去除其中置信度（["score"]）较差的条目。
遍历两份结果，去除其中重叠的条目（比如含同一句英文，或者["box"]的位置相同）。
合并为一份结果。

Null-Bot9875 · 2023-09-22T03:15:19Z

目前没有模型能同时支持中+日，只能中英或日英。

如果文字的位置相对固定（如双语字幕），可以先切割出中文 / 日文区域的图片，单独送入OCR。

如果文字位置随机，那么可以按以下步骤：

对同一张图片，分别用中文 / 日文库跑一遍，得到两份结果。

遍历两份结果，去除其中置信度（["score"]）较差的条目。

遍历两份结果，去除其中重叠的条目（比如含同一句英文，或者["box"]的位置相同）。

合并为一份结果。

我的需求是需要知道这个图片上的文字类型，可能是中文，日文，英文、德文等。这种情况下也是分别用不同语言库跑一遍取置信度高的结果就可以了吧？

hiroi-sora · 2023-09-22T05:00:56Z

是的。据我所知，并没有一种好的办法或现成的开源项目，能快速检测图片中的语种，而不需要经过完整的OCR流程。所以，判断语种最靠谱的办法只有用多个语言库各跑一遍OCR，取其中置信度最高的语言。

hiroi-sora closed this as completed Oct 12, 2023

hiroi-sora mentioned this issue Oct 13, 2023

启动报python3.dll错误 hiroi-sora/Umi-OCR_v2#21

Closed

hiroi-sora mentioned this issue Apr 22, 2024

大佬您好，想请问一下模型更新的问题 hiroi-sora/RapidOCR-json#17

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

如果一张图片同时有中文/英文/日文，那么该如何选择模型呢？ #75

如果一张图片同时有中文/英文/日文，那么该如何选择模型呢？ #75

Null-Bot9875 commented Sep 21, 2023

hiroi-sora commented Sep 21, 2023 •

edited

Loading

Null-Bot9875 commented Sep 22, 2023

hiroi-sora commented Sep 22, 2023

如果一张图片同时有中文/英文/日文，那么该如何选择模型呢？ #75

如果一张图片同时有中文/英文/日文，那么该如何选择模型呢？ #75

Comments

Null-Bot9875 commented Sep 21, 2023

hiroi-sora commented Sep 21, 2023 • edited Loading

Null-Bot9875 commented Sep 22, 2023

hiroi-sora commented Sep 22, 2023

hiroi-sora commented Sep 21, 2023 •

edited

Loading