- 姚隆兴;韩江涛;张志毅;
针对径向畸变的针孔透视投影模型,提出了一种简单快速的相机标定算法。该算法在假设图像中心点与CCD或CMOS传感器中心重合的前提下,将相机的内外参数和相机模型的畸变参数分离,以进一步进行线性相机标定,避免了非线性优化带来的误差,降低了算法复杂度,可适当提高标定精度,节约计算时间。首先,根据透视投影的交比不变性原理标定镜头的畸变系数;然后,根据旋转变换关系和平移变换关系,充分利用径向畸变约束、旋转变换的正交性和旋转矩阵特有的性质约束线性求解出相机的内参和外参;最后,通过实验与Tsai氏相机平面标定算法进行对比,所提算法在标定时间上节约了35%左右,在精度上至少提高了15%。
2022年11期 v.44;No.335 1976-1984页 [查看摘要][在线阅读][下载 1068K] [下载次数:353 ] |[网刊下载次数:0 ] |[引用频次:21 ] |[阅读次数:0 ] - 陈锟剑;李竹;周依莎;盛庆华;
现有的指针式仪表读数算法常通过检测仪表的刻度进行示数识别,但仪表图像中的刻度包含的特征较少,从而容易出现误检测。针对此问题,提出了一种新的指针式仪表自动读数算法,该算法通过选取较大区域的图像特征大幅度地提高了仪表读数识别的鲁棒性。由于指针刻度值文本是各类仪表具有的共同部分且具有远多于刻度图像的特征,因此所提算法以刻度值文本作为识别依据,首先通过卷积神经网络检测仪表图像中的刻度值文本,并使用其位置坐标来拟合仪表的圆心,在得到圆心的基础上通过极坐标变换及图像二次矫正将圆弧形的刻度区域转换为水平直线型的区域,同时被识别的文本值也用于改进距离判读法。该方法与其他读数算法的比较结果表明,该算法具有较高的读数准确率,引用误差在0.5%以下,且在复杂拍摄条件下具有更高的鲁棒性。
2022年11期 v.44;No.335 1985-1994页 [查看摘要][在线阅读][下载 1523K] [下载次数:239 ] |[网刊下载次数:0 ] |[引用频次:16 ] |[阅读次数:0 ] - 张海燕;付应娜;丁桂江;孟庆岩;
作为目标检测的研究热点之一,无锚框算法摒弃大量预定义框的设置而采取逐像素的方式进行预测。即便如此,它仍不能够很好地处理重叠目标。此外,该算法获取图像的全局信息能力较弱且易出现感受野不匹配。因此,提出2种改进方法:多样性感受野注意力机制和全局信息指导特征融合。PASCAL VOC和MS COCO数据集上广泛的实验证实了改进方法的有效性。与基线FCOS相比,本文方法的检测精度在PASCAL VOC上提升了1.4%,在MS COCO上的精确度为42.8%,检测性能明显优于许多先进算法。
2022年11期 v.44;No.335 1995-2002页 [查看摘要][在线阅读][下载 1199K] [下载次数:175 ] |[网刊下载次数:0 ] |[引用频次:6 ] |[阅读次数:0 ] - 张睿萍;宁芊;雷印杰;陈炳才;
近年来,人们对于垃圾的分类与回收越来越重视,但垃圾分类耗费了大量的人力和物力且分拣效率低下。针对基于矩形边界框的垃圾检测方法在多分类环境下效果不够理想等问题,提出了一种基于改进Mask R-CNN算法的生活垃圾检测模型。该模型摒弃了传统的ResNet,采用改进的ResNeXt101作为主干网络进行特征提取,提高了目标检测的准确率和背景边界线分割的精确度。实验结果表明,与传统的Mask R-CNN算法相比,本文模型的mAP为91.1%,提升了2.35%;与当前流行的目标检测模型进行了对比,本文模型的分类准确率和分割精确度均表现优异,表明了所提模型在垃圾检测任务中的可行性与有效性。
2022年11期 v.44;No.335 2003-2009页 [查看摘要][在线阅读][下载 1115K] [下载次数:1480 ] |[网刊下载次数:0 ] |[引用频次:16 ] |[阅读次数:0 ] - 吴从中;董浩;方静;
遥感图像尺度变化较大,背景类内差异较大以及前景和背景之间的不平衡等问题,增加了遥感图像小目标和目标边缘分割的难度。在卷积神经网络中,下采样引起的混叠效应造成目标信息的失真和损失,容易被忽视。同时,扩张卷积虽然捕获到了丰富的感受野信息,但仍存在冗余的背景信息干扰。据此,提出了一种基于注意力机制自适应滤波分割网络(ARGNet)。在DeepGlobe Road Extraction数据集和Inria Aerial Image Labeling数据集上进行实验,结果表明,所提出的网络能够分割出更加精准的目标。
2022年11期 v.44;No.335 2010-2018页 [查看摘要][在线阅读][下载 1320K] [下载次数:471 ] |[网刊下载次数:0 ] |[引用频次:15 ] |[阅读次数:0 ] - 陈清江;李金阳;屈梅;胡倩楠;
由于环境的不确定性,捕获的图像存在亮度低、对比度低和信息丢失严重等问题,且利用现存算法增强后的图像存在曝光过度问题,不能满足计算机视觉任务的输入要求。针对此问题,提出了基于端到端双网络的低照度图像增强方法,该网络由Inception网络模块与URes-Net模块组成。首先利用Retinex理论合成低照度图像样本;然后运用双网络模型进行特征提取、特征融合与重建,根据测试集的损失不断调整参数以优化模型,最终使双网络模型具有较高的低照度图像增强能力。实验结果表明,所提方法的PSNR和SSIM的均值分别为28.659 8 dB和0.896 6,亮度、对比度显著提高,获得的图像更加符合人类视觉,优于其他先进的低照度图像增强方法。
2022年11期 v.44;No.335 2019-2026页 [查看摘要][在线阅读][下载 1242K] [下载次数:321 ] |[网刊下载次数:0 ] |[引用频次:9 ] |[阅读次数:0 ] - 权威铭;刘天一;张雷;
目前,深度学习已经在各种人体运动识别(HAR)任务中发挥了重要作用。但是,由于运动数据具有时间序列和包含肢体动作的特殊性,现有神经网络在进行卷积操作时会导致数据高度相关,并且随着网络影响到下一层,这限制了模型的识别效果。为此,提出了一种带有协方差矩阵的改进卷积神经网络用于HAR场景,通过矩阵变换搭建一种去相关的网络结构来消除相关性问题,可以在网络表现不佳时替代现有的批量归一化(BN)层用于归一化数据。在4个HAR公共数据集上进行实验,并与传统CNN和带有BN层的模型进行比较。实验结果表明,对比此前的深度学习网络,改进的神经网络有1%~2%的性能提升,验证了该方法的有效性,并将程序移植到了移动端进行实时运动识别。
2022年11期 v.44;No.335 2027-2036页 [查看摘要][在线阅读][下载 1454K] [下载次数:449 ] |[网刊下载次数:0 ] |[引用频次:9 ] |[阅读次数:0 ] - 蒋芸;刘文欢;梁菁;
视网膜血管分割在许多眼科疾病诊断和治疗方面至关重要。对复杂的视网膜结构及低对比度眼底图像来说,准确地分割视网膜图像的血管特征仍具有挑战性。联合注意力和Transformer的视网膜血管分割网络JAT-Net,通过对编码阶段特征的通道信息和位置信息联合关注增强编码局部细节特征,利用Transformer增强对长距离上下文信息和空间依赖关系建模的能力。在DRIVE和CHASE数据集上进行视网膜血管分割实验,其准确率分别为0.970 6和0.977 4,F1分数分别为0.843 3和0.815 4,在视网膜血管分割方面表现不错。
2022年11期 v.44;No.335 2037-2047页 [查看摘要][在线阅读][下载 1871K] [下载次数:575 ] |[网刊下载次数:0 ] |[引用频次:17 ] |[阅读次数:0 ] - 韩辉;麦合甫热提;吾尔尼沙·买买提;朱亚俐;库尔班·吾布力;
由于离线手写签名图像有效的笔画部分普遍比较稀疏,存在大量的无效白色背景,目前常用的特征描述方法会使得得到的特征数据存在大量冗余,影响识别准确率。识别准确率的提高,需要依赖大量的训练数据和提取多个特征并进行融合,但这样又会因特征数据过多和维度过大而造成计算困难,影响识别效率。为此,提出了一种基于Gist和IPCA算法的多文种离线手写签名识别方法,利用Gist特征聚焦图像的整体布局和笔画部分,同时利用IPCA算法的批处理能力来提高识别效果和运行效率。使用中、英、维3种语言的实验数据集,并使用SVM分类器进行识别实验。结果显示,3个数据集上的识别准确率分别为97.97%,98.43%和97.19%,3种数据混合后的识别准确率为97.70%。经过对比分析可知,提出的方法与之前的相关方法相比明显较优。
2022年11期 v.44;No.335 2048-2055页 [查看摘要][在线阅读][下载 1418K] [下载次数:296 ] |[网刊下载次数:0 ] |[引用频次:9 ] |[阅读次数:0 ]