1.deformable变形卷积pytorch实现(第二节deformable_conv2d 实现一)
deformable变形卷积pytorch实现(第二节deformable_conv2d 实现一)
修改理解:年3月,源码对num_groups参数的源码理解进行了修正。若仍有疑问,源码欢迎大家指出。源码源码锚点缩放
内容概述:这一节将介绍deformable_conv2d的源码实现细节及常见坑点。旨在帮助后来者简化实现过程。源码如有错误,源码敬请指正。源码文章已链接。源码
目标实现:仅实现所需的源码deformable_conv2d部分,deformable roi部分未实现。源码同城源码公众版复现旨在翻译原文,源码理解映射规则,源码结果易于推导。源码
原理说明:deformable convolution设计目的源码是让网络学习卷积核形状。通过额外的门店销售系统源码Conv2d层学习每个位置的位移和置信度参数。数据经过卷积后,输出用于变形卷积的offset和mask,接着进行卷积,最终输出。
参数解释:包含两个卷积核,memz源码如何编译一个用于变形卷积,一个用于学习。输入包括数据流、卷积核、offset、云南到缅甸源码mask,以及固定参数如stride、padding、dilation等。关注num_groups、deformable_groups、im2col_step,理解其功能。
实现细节:实现三个cuda核函数,分别为变形卷积前的im2col、卷积后的col2im、处理坐标信息的col2im_coord。核心在于计算卷积参数位置并进行线性插值,乘以置信mask。
代码实现:主要实现forward和backward函数。forward部分需要多次生成列矩阵以匹配结果。具体细节和cuda核函数可参阅源代码,核心在于定位参数并执行插值运算。
后续内容:其余部分如backward等将在后续文章中讨论。写作过程较为匆忙,欢迎讨论交流。