代码拉取完成,页面将自动刷新
【2k vertical coordinates】k个anchor,每个anchor预测其y和h
【2k scores】k个anchor,每个anchor是背景和不是背景的得分
【k side-refinement】
第一个2k vertical coordinate和第三个k side-refinement是用来回归k个anchor的位置信息。
2k vertical coordinate表示的是bounding box的高度和中心的y轴坐标(可以决定上下边界),
k个side-refinement表示的bounding box的水平平移量。这边注意,只用了3个参数表示回归的bounding box,
因为这里默认了每个anchor的width是16,且不再变化(VGG16的conv5的stride是16)。
回归出来的box如Fig.1中那些红色的细长矩形,它们的宽度是一定的。
整个数据集划分为:
train_im:训练图片
test_im:测试图片
train_gt:训练标签
test_gt:测试标签
训练标签生成:
从文本框标签——>多个相邻小尺寸的文本框标签
bbox标签转为anchor标签
1.首先计算一张图可以分为多少个宽度为16的anchor,再计算文本框标签包含哪几个anchor,最左和最右的anchor分别为第几个
2.计算文本框内anchor的高度和中心是多少
3.将每个anchor的位置(水平ID)、anchor中心y坐标、anchor高度存储并返回
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。