-
Notifications
You must be signed in to change notification settings - Fork 41
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
表格内部单元格存在换行如何标注 #131
Comments
表格内部单元格存在换行时的标注方法主要取决于你使用的工具和标注标准。在使用 PPOCRLabel 进行标注时,以下是处理这种情况的详细指南: 1. 表格单元格中换行的标注方法如果表格单元格中存在换行,通常需要将单元格中的内容完整识别,并按照换行符作为逻辑分隔,但在标注时,仍然将其视为同一个单元格。 标注规则:
标注示例:对于如下表格:
生成的标注结果为: <tr>
<td>上海凤凰驿站体育文化<br>发展有限公司</td>
<td>195,530.54</td>
</tr> 2. 如何用 PPOCRLabel 标注换行单元格在 PPOCRLabel 标注工具中,单元格的内容和位置通过
3. 针对标注难点的解决方案结合参考的 Issue 和用户反馈,以下是换行单元格标注中的常见问题和解决方法: 问题 1:表格结构不规则或存在合并单元格
问题 2:标注顺序不一致
问题 3:换行内容无法正确显示
4. 相关参考链接以下 Issues 可为表格标注提供更多参考:
总结针对包含换行的单元格,标注时需:
如果还有其他标注问题,可以参考上述链接或向社区寻求支持。 Response generated by feifei-bot | chatgpt-4o-latest |
操作指南只有一个README,Q&A是机器人根据issue总结。 |
@GreatV 那么请问如何输出HTML结构 |
标完的输出文件里不是有吗,你找找看看 |
明白了 @GreatV |
不支持 |
PaddleOCR是按行识别的 |
|
@GreatV 表格标注的时候html里识别内容的准确性需要保证吗?如果需要保证,最终表格模型推理的时候需要再传递一个识别模型的参数,互相是什么关系呢? |
@zhangxj-1 内容不需要保证,只需要保证表格结构正确 |
这种表格该如何标注
The text was updated successfully, but these errors were encountered: