Google推出全球最大人工地标数据集

谷歌作为全世界领先的科技企业，在图像分类技术上十分有经验。过去几年中。Google取得了显著的进步，这在一定程度上体现在Imagenet 分类挑战上，机器的误差率每年都在大幅下降。为了继续推进计算机视觉技术的先进水平，许多研究人员现在更多地关注细粒度和实例级的识别问题，而不是识别一般实体，如建筑物、山脉，当然还有猫，许多人正在设计能够识别埃菲尔铁塔、富士山或波斯猫的机器学习算法。

　　然而，挑战还是不少的。比如说，这一领域研究的一个重大障碍是缺乏大量带注释的数据集。不过就在今天，谷歌在其官方博客宣布，发布 Google-Landmarks 数据集来推进实例级的识别，这也是世界上最大的人工和自然地标识别数据集。

　　这款新产品Google-Landmarks 将作为 Kaggle 网站上地标识别和地标检索挑战发布，这将是 CVPR 18 地标研讨会的重点。该数据集包含二百万多幅图像，描绘了来自世界各地的三万处独特的地标，数据集类别的数量比常用的数据集大 30 倍。此外，为了促进这一领域的研究，我们是开源的深度本地特征( DELF )，我们认为这是一种非常好的本地特征描述方法，特别适合于这类任务。地标识别与其他问题有一些显著的区别。例如，即使在大型带标注的数据集中，对于一些不太热门的地标，也可能没有太多的训练数据。此外，由于地标通常是不动的物体，所以内部变化很小（换句话说，地标的外观在不同的图像中变化不大）。

因此，变化只会由于图像捕获条件而产生，如遮挡、不同的视角、天气和光照，这与其他图像识别数据集不同，其中特定类别的图像（如狗）的变化可能更大。这些特征也与其他实例级识别问题（如艺术品识别）有共同之处，因此，谷歌希望这个新的数据集也能对其他图像识别问题的研究有所帮助。这两项 Kaggle 挑战将为研究人员解决这些问题提供了获取带标注的数据的途径。识别轨迹挑战是在测试集中建立识别正确地标的模型，而检索挑战则要求参与者检索包含相同地标的图像。通过 Kaggle 网站就能访问到这个新的数据集。

科技范儿

星河系产品经理教学网站

谷歌推出全世界最大的地标数据库

该数据集包含二百万多幅图像，描绘了来自世界各地的三万处独特的地标，数据集类别的数量比常用的数据集大 30 倍。

Be the first to comment

Leave a Reply 取消回复

Related Articles

Be the first to comment

Leave a Reply 取消回复