camseq是一个地面数据集,可自由用于视频目标识别中的研究工作。该数据集包含 101 个 960x720 像素的图像对。 每个掩码都由文件名之外的“_l”指定。 所有图像(原始图像和真实图像)均为未压缩的 24 位彩色 png 格式。 该数据集最初是针对自动驾驶汽车的问题而设计的。此序列描绘了从一辆动感的汽车拍摄的剑桥市的动感驾驶场景。这是一个具有挑战性的数据集,因为除了汽车的自我运动之外,其他
svhn is a real-world image dataset for developing machine learning and object recognition algorithms with minimal requirement on data preprocessing and formatting. it can be seen as similar in flavor
streetscenes challenge framework 是用于对象检测的图像、注释、软件和性能测量的集合。 每张图像都是从马萨诸塞州波士顿及其周边地区的 dsc-f717 相机拍摄的。 然后用围绕 9 个对象类别的每个示例的多边形手动标记每个图像,包括 [汽车、行人、自行车、建筑物、树木、天空、道路、人行道和商店]。 这些图像的标记是在仔细检查下完成的,以确保对象总是以相同的方式标记,关
数据集介绍: 收集了 640 个在大小、纹理、背景杂波和照明等方面具有显着变化的光场。生成微透镜图像阵列和中心观察图像,并生成相应的地面实况图。 citation if you find our paper and repo useful, please cite our paper. thanks! @article{zhang2020, title={light field sa
该数据集包含 2d 深度图像,如下图所示。像 kitti 数据集中的 360 度 lidar 框架在传感器本身周围呈圆柱形。该数据集中的 2d 深度图像可以表示为您在 lidar 框架的圆柱体上进行了切割并将其拉直以位于 2d 平面中。这些 2d 深度图像的像素代表反射物体与 lidar 传感器的距离。 2d 深度图像的垂直分辨率(在我们的例子中为 64)表示用于扫描周围环境的 lidar 传感器
argoverse针对的任务:3d追踪和动作预测,两个任务对应的数据集其实是独立的,只是采集设备和采集地点一样而已。提供了360度的视频和点云信息,并根据点云重建了地图,全天候全光照。标注了视频和点云中的3d bounding box。3d追踪的数据集包含113段15-30秒的视频,动作预测中包含323,557段5秒的视频(总计320小时)。数据集的主要亮点还是在原始数据和地图的联动上。
本数据集来自于aim 2022 压缩图像和视频超分辨率挑战赛”中的前 5 名pg电子试玩链接的解决方案工作:swin2sr: swinv2 transformer for compressed image super-resolution and restoration please check our project swin2sr https://github.com/mv-lab/swin2sr ???? ????
该数据集已特别针对非洲地区进行了改进。 两个开源数据集仅用于提取非洲地区使用的交通标志。该数据集包含来自所有类别的 76 个类,例如 监管、警告、指南和信息标志。 该数据集总共包含 19,346 张图像和每个类别至少 200 个实例。