本篇文章4725字,读完约12分钟

机心报道

魔王,小船,杜伟

昨天,计算机视觉顶级会议eccv发表了最高论文等奖项,imagenet论文中邓嘉获得了最高论文奖。

召开了计算机视觉三大国际顶级会议之一的eccv。 受疫情影响,原定于8月下旬在英国格拉斯哥召开的eccv会议将在网上召开4天。

今年的eccv收到了5025篇比较有效的投稿,是eccv论文投稿数的两倍以上。 接收论文1361篇,接收率为27%,比上一次会议下降了约5%。 在接收论文中,oral论文数为比较有效投稿总数的2%,spotlight论文数约为3%,为161篇。

昨天,普林斯顿大学zachary teed和佳登发表了获奖的最佳论文等奖项。

最佳论文奖

论文地址: arxiv/abs/2003.12039

github地址: github/princeton-vl/raft

这项研究提出了用于光流的新深度互联网架构raft ( recurrentallpairsfieldtransforms )。 raft提取各像素的特征,针对所有像素对构建多尺度4d关联体( correlation volume ),通过循环单元反复更新流场,循环单元根据关联体执行搜索。

raft在多个数据集上实现了sota性能:在kitti数据集中,raft的f1-all误差为5.10%,比以前的最佳结果( 6.10% )减少了16%。 在sintel数据集中,raft只有2.855像素的端点误差( end-point-error ),比以前最好的结果( 4.098像素)减少了30%。 另外,raft具有强大的交叉数据集泛化能力,并且在推理时间、训练速度、参数计数方面具有高效率。

热门:ImageNet一作、李飞飞高徒邓嘉获最佳论文奖,ECCV 2020奖项全公布

raft体系结构设计

4.8m参数完整版模型和1.0m参数小模型的互联网体系结构详细信息。

作者个人资料

最优秀论文的第一作者zachary teed现在在普林斯顿读博,导师是邓嘉。 他研究的有趣之处是重建3d视频,包括结构流( SFM )、场景流( scene流)和slam。

论文2作是普林斯顿大学计算机科学系助理教授邓嘉,第一个研究方向是计算机视觉和机器学习。

现在的研究有趣的是3d视觉、目标识别、动作识别、自动定理说明。 获得了sloan research fellowship、pami mark everingham prize、yahoo ace award、google faculty research award、iccv marr prize等奖项。

值得一提的是,这并不是邓嘉第一次获得eccv最佳论文奖,而是在年的论文《Large-ScaleobJectClassificationusinglabelrelationgraPHS》中获得了当年的ECV最佳论文奖,

除此之外,他是imagenet论文的第一作者。 imagenet数据集是目前机器学习行业最常用的数据集之一,引起了极大促进人工智能快速发展的imagenet竞赛。 作为imagenet的一部作品,邓嘉为此付出了很多心血。

年,这篇论文获得了cvpr pami longuet-higgins (古典论文)奖。 邓嘉在接受机器心灵采访时说:“这个项目证明了imagenet不是最主流的,但我们都相信做这个项目的人会有很大的影响,所以我们做这个事件很辛苦。 确实,它给我的启示是做你认为最流行的事件,但有影响的事件。 “现在,2009年发表的这篇论文引用量超过2万。

热门:ImageNet一作、李飞飞高徒邓嘉获最佳论文奖,ECCV 2020奖项全公布

最佳论文荣誉提名奖

大会还发表了最高论文荣誉提名奖,有两篇论文获得了该奖。

论文1:towardsstreamingimageunderstanding

论文地址: arxiv/abs/2005.10420

论文作者:孟田里,郁雄王,deva ramanan (卡内基梅隆大学)

主体感知是代理自动感知环境并作出反应的能力。 代理的响应度很大程度上取决于解决过程的延迟。 迄今为止的业务首要关系到延迟和准确率之间的算法权衡,但缺乏决定针对不同方法的帕累托最优延迟准确率曲线的指标。 本文指出了算法解决特定的图像帧时周围环境发生了变化的标准离线判定和实时应用的区别.。 在该研究中,提出了“流准确率”( streaming accuracy ),即协调延迟和准确率合并为一个测量指标,用于实时在线感知。

热门:ImageNet一作、李飞飞高徒邓嘉获最佳论文奖,ECCV 2020奖项全公布

另外,该研究提出了基于该测量指标,可以系统地将任意图像理解任务转换为流图像理解任务的元标准。 研究者首先关注城市视频流中的目标检测和实例分割任务,制作了具有优质时间序列稠密标记的新数据集。

这项研究提出的处理方案及其实证分析结果如下。

帕累托最优延迟-准确率曲线具有能够最大化流准确率的最大优点。

异步跟踪和未来预测自然成为流图像理解的内部表现。

动态调度可用于克服“时间重排”( temporal aliasing ),并产生狡猾的结果,即什么都不做可能会使延迟最小化。

论文2:nerf:representingscenesasneuralradiancefieldsforviewsynthesis

论文地址: arxiv/abs/2003.08934

论文作者: ben mildenhall(uc伯克利),pratul p. srinivasan(uc伯克利),matthew tancik(uc伯克利),jonathan t. barron

在该研究中,提出了通过使用稀疏输入视图集优化基础连续体场景函数,在合成许多复杂场景的新视图任务中实现sota结果的新方法。 该算法使用输入到单一的连续5d坐标(空间位置( x,y,z )和视角方向(θ,φ) ),体积密度和作为该空间位置的视图相关emitted radiance输出的全连接深度互联网来表现场景。 在该研究中,通过查询沿着相机光线的5d坐标来合成视图,利用经典的体绘制技术将输出颜色和密度投影到图像上。

热门:ImageNet一作、李飞飞高徒邓嘉获最佳论文奖,ECCV 2020奖项全公布

由于体渲染本身很微小,因此该优化表示所需的唯一输入是一组具有已知照相机姿势的图像。 研究者介绍了如何有效地优化神经辐射场( neural radiance field ),渲染具有许多杂几何形状和外观的真实场景的新视图,而且神经渲染和视图合成方面的效果比以前的工作好

热门:ImageNet一作、李飞飞高徒邓嘉获最佳论文奖,ECCV 2020奖项全公布

古典论文: koenderink奖

koenderink奖旨在表彰计算机视觉行业的基础贡献研究,获奖论文都是发表时间超过10年,经过时间检查的研究。

这次eccv会议koenderink奖颁发给了以下两篇论文。

论文1:improvingthefisherkernelforlarge-scaleimageclassification

论文地址: lear.inri Alpes.FR/PUBS// PSM 10/PSM 10 _ 0766.PDF

论文作者: florent perronnin、jorge s´anchez、thomas mensink (施乐欧洲研究中心)

fisher kernel(fk )是结合了生成和判别做法优点的通用框架。 在图像分类行业,fk扩展了流行的视觉词袋( bov )模型。 但是,在实践中,这种丰富的特征没有显示出对bov的优势。

在论文的第一部分,研究者对原始框架进行了一些评级更改,提高了fk的精度。 pascal voc 2007数据集的平均精度( ap )从47.9%提高到58.3%。 改进的框架在caltech 256数据集上也显示了sota精度。 其第一个特征是这些结果只能通过sift描述符和线性识别器得到。 采用这一特征,fk框架可以用来搜索更大规模的图像分类任务。

热门:ImageNet一作、李飞飞高徒邓嘉获最佳论文奖,ECCV 2020奖项全公布

在论文的第二部分应用部分中,研究者以imagenet和flickr groups数据集这两个大规模注释图像数据集上的分类器训练状况为对象。 在关于数十万训练图像的判断中,我们发现基于flickr groups学习到的分类器的性能非常出色,可以用更精细的标注数据集补充学习到的分类器。

热门:ImageNet一作、李飞飞高徒邓嘉获最佳论文奖,ECCV 2020奖项全公布

论文2:brief:binaryrobustindependentelementaryfeatures

论文地址: CS.UBC.CA/~ Lowe/525/PaPers/Calonder _ ECC v10.PDF

论文作者: michael calonder,vincent lepetit,christoph strecha,pascal fua (洛桑联邦理工大学)

在该研究中,提出了将二进制字符串用作高效的特征点描述符brief。 结果表明,即使在bits比较少的情况下,brief依然显示出很高的判别性,可以通过简单的强度差测试进行计算。

另外,描述符的类似度的判定不是一般的l_2范数,而是使用汉明距离( hamming distance ),后者计算得非常有效率。

因此,brief的构建和匹配速度非常快。 本研究将brief与surf及usurf以标准基准进行比较后发现,brief可以实现同等以上的识别性能,执行时间只需要其他两者的一部分即可。

pami everingham奖

这个奖项的目的是纪念mark everingham,鼓励别人学习,推动整个计算机视觉社区的进一步快速发展。 pami everingham奖授予对计算机视觉社区做出无私贡献的研究者或研究小组,由ieee计算机协会模型分析和机器智能( pami )技术委员会颁发。

热门:ImageNet一作、李飞飞高徒邓嘉获最佳论文奖,ECCV 2020奖项全公布

今年的pami everingham奖颁发给了微软高级科学家johannes schönberger、mit教授antonio torralba和制作多个数据集的合作者。

johannes schönberger现在开发了colmap sfm和mvs软件库,以便微软混合现实和人工智能苏黎世研究所的高级科学家。

johannes schönberger之所以获奖,是因为它提供了开源的端到端pipeline,以及相关的支持、开发和文档。 现在,这是运动恢复结构( sfm )和多视点立体视( mvs )的参考软件。

antonio torralba现在是mit电气工程和计算机科学的教授。 10多年来,antonio torralba定期与其他合作伙伴推出新的数据集,并创建了这些数据集。 他们创建的labelme、tiny images、sun/sun-3d和mit-places等数据集对计算机视觉行业有很大的影响。

热门:ImageNet一作、李飞飞高徒邓嘉获最佳论文奖,ECCV 2020奖项全公布

示范奖

另外,大会宣布了游行奖。 获奖论文是“inter-ho mines:distance-basedriskestimationforhumansafety”。

这项研究的demo如下。

另外两项研究获得了eccv demo奖。

论文1:finger track:continous3dhandposetracking

论文2:objectdetectionkit:identifyingurbanissuesinreal-time

机心结合游戏科学技术开设网上公开课:零基础入门游戏天元megengine,6堂课支持开发者入门深度学习开发。

8月25日,科技移动商务团队高级工程师赵凯以shufflenet v2为例,介绍如何将预训练模型部署到android移动终端上,并与camera合作完成实时推理的实现。 欢迎大家小组学习。

© the end

转载请联系本公众号获得批准

寻求帖子或文章: content@jiqizhixin

原标题: imagenet一作,李飞飞高徒邓嘉获得最高论文奖,eccv奖全部公布”

阅读原文。

来源:印度时报中文版

标题:热门:ImageNet一作、李飞飞高徒邓嘉获最佳论文奖,ECCV 2020奖项全公布

地址:http://www.yqjqqwc.cn/ydxw/24751.html