Visual Genome 是一个数据集,知识库,不断努力把结构化的图像概念和语言连接起来
和建立了两个被人工智能研究者广泛用来教会机器分类物体的数据库的李飞飞相似,李佳也着手了另一个重要多媒体数据库的建立。2016 年,李佳 ACM 论文YFCC100M: the new data in multimeesearch介绍了 Yahoo Flickr Creative Commons 100 Million Dataseta(YFCC100M)数据集,这是一个包含令人关注且科学上实用的数据集的参考库,也是有史以来最庞大的公共多媒体集合,包含总计 1 亿个媒体对象(大约 9920 万张照片,80 万个视频)和标签,它们全都是上传至 Flickr 并根据 CC 商用或非商用许可证发布。与许多数据集一样,YFCC100M 也处于不断演进之中。YFCC100M 数据集克服了影响现有多媒体数据集的许多问题,例如在形态、元数据、许可以及最主要的体积大小方面。
四
除了数据集方面的重要贡献,李佳在图像识别和场景理解领域也做出了自己的贡献。下图给出了 Semantic Scholar 统计的李佳的学术影响力和影响关系,可以看到,李飞飞和李佳的研究合作关系非常紧密。
转载请注明出处。