12642867522
新疆维吾尔自治区和田地区九寨沟县国大大楼71号
浏览次数: 次 发布时间:2024-12-26 来源:
本文摘要:向量机分类的鱼识别方法;虽然这些方法都可以构建鱼类辨识,但是这些方法这类方法已呼吸困难用作当前的视频或图片数据,并且方法相当严重依赖人工自由选择特征,而人工自由选择特征往往不能自由选择表层特征,很难挖掘出有鉴别力的特征。
向量机分类的鱼识别方法;虽然这些方法都可以构建鱼类辨识,但是这些方法这类方法已呼吸困难用作当前的视频或图片数据,并且方法相当严重依赖人工自由选择特征,而人工自由选择特征往往不能自由选择表层特征,很难挖掘出有鉴别力的特征。和传统机器学习方法比起,近年来兴起的深度自学方法以数据为驱动,需要从大量数据中通过卷积等操作者自动自学特征回应,很好的解决问题了人工自由选择特征的问题。Abdelouahid等人[3]和顾郑公平人[4]都明确提出了使用深度网络模型展开鱼类辨识的方法,虽然这些方法在辨识性能上都获得了引人瞩目的效果,但是仍然不存在以下问题:模型辨识性能的提升必须大量的鱼类标示数据集用作自学训练,而标示数据工作费时且便宜,故在实际应用于中无法符合。
为此,针对以问题,本文明确提出了一种基于百度EasyDL自定义化图像识别平台的海底鱼类识别方法。利用百度EasyDL自定义化图像识别平台解决问题目标数据集训练数据过小和数据分布差异问题,而且通过引进伽马校正法和亮地下通道先验算法对数据展开预处理,使数据特征具备更佳的分辨能力,同时用于数据强化方法对模型展开调优,使得训练获得的模型的一般化性更加强劲。2 涉及工作2.1 海洋鱼类识别系统图 1 海底观测平台海底观测平台的系统结构如图1右图,坐落于海面以下的水下转乘器统一接管来自各个传感器的收集数据,还包括水下摄像机器材收集的视频数据,然后将数据传输至坐落于陆地上的岸基车站。
岸基车站接管并内存所有来自海底的数据,按誓约的协议和规则转发给大数据中心。大数据中心由多个子系统包含,负责管理对有所不同类型数据的转化成、存储、处置、分析,其中还包括本文即将研究的海洋鱼类识别系统,负责管理对海底观测视频的处置分析。
本文使用开源计算机视觉工具软件OpenCV来加载视频数据,将视频分解成为图片帧,同时用于背景差分算法过滤器多余帧后,针对每一帧展开预处理和辨识分析。2.2 数据预处理由于海底图像对各种噪声和阻碍是较为脆弱的,在有所不同光照条件下,悬浮物等都对最后光学和辨识有相当大的影响。而且从图像的构成过程考虑到,图像收集是将一个三维目标同构沦为一幅二维图像,不可避免不会有信息的遗失,所以本质上图像就具备一种模糊性。另一方面由于海水的能见度较低, 透明度只有空气的千分之一,使得收集到的图像信噪比较低、纹理模糊不清。
再度由于海洋中各种悬浮物的不存在, 也不会对光波(也就是电磁波)产生衍射和吸取起到 ,造成收集到的海底图像产生相当严重的灰白效应。再行再加海流的影响以及摄像机镜头的晃动等因素, 导致图像部分杂讯现象等因素都会影响最后辨识的效果。下面是几幅较为典型的海底鱼类图像,我们可以看见,收集的图像的对比度都较低,图像更为模糊不清:图1 海底鱼类图像图因此,本文再行用于提升亮度、提升清晰度对数据展开预处理的方法,尽量避免亮度较低和模糊不清带给的影响。
对于提升亮度的方法,本文自由选择伽马校正法[5],用于指数函数调整每个灰度单元,计算公式如下: (1)亮度的变化由参数γ来掌控:当γ1时,pi,j[k]的值不会变大,亮度不会提升。反之,则pi,j[k]的值会变小,亮度不会减少。对于提升清晰度的方法,通过参照基于亮地下通道先验算法去雾的研究[6]。
该研究指出雾天摄制图片的模糊不清是由空气中的杂质对光的衍射导致的。而海底摄制图片的模糊不清也刚好是由水中的杂质对光的衍射导致的,于是可以将其限于于海底摄制图片,所以在该研究的基础上,针对海底环境的特点不作了改良,对每个灰度单元展开优化,计算公式如下:(2)综合上述提升亮度和清晰度的过程,预处理的步骤如下:图3右图展出预处理方法对图片品质的提高效果:a完整图b预处理后图片图2 预处理效果对比图从图3中可以显现出,本文明确提出的预处理方法可以较为有效地提升图片的亮度以及清晰度。但是面临品质极差的图片,预处理方法也显露出了局限性,无法将其品质提升到鱼类各项关键特征都明晰的程度。
2.3 模型建构及训练本文以台湾电力公司、台湾海洋研究所和垦丁国家公园在2010年10月1日至2013年9月30日期间,在台湾南湾海峡、兰屿岛和胡比湖的水下观景台搜集的鱼类图像数据子集--Fish4Knowledge(F4K)数据集[7]作为实验数据。该数据集还包括23类鱼种,共27370张鱼的图像,数据集如图4右图。图3 Fish4Knowledge(F4K)数据集将实验数据上载至百度EasyDL数据中心,如图4右图,使用百度EasyDL自定义化图像识别平台建构鱼类图像识别模型,由于鱼类形状大小相近,品种差异小,可识别性较小,故自由选择AutoDL Transfer算法展开模型训练,AutoDL Transfer模型是百度研发的AutoDL技术之一,融合模型网络结构搜寻、迁入自学技术、并针对用户数据展开自动优化的模型,与标准化算法比起,虽然训练时间较长,但更加限于于细分类场景。
如图5右图。图4 数据上载图5 模型建构2.3 预处理有效性实验为了证明本文所托预处理方法的有效性,本文在F4K数据集上做到了完整的数据和基于预处理的方法的数据模型性能对比实验,实验在参数完全相同的条件下,用于百度EasyDL自定义化图像识别平台对数据展开训练,评估对比结果如表格1右图:表格2性能对比表格1的结果显示,在鱼类辨识上本文所提的预处理方法比用于原始数据有更佳的辨识性能,准确率及解任亲率等各项指标都要相比之下好于用于原始数据训练的模型。
2.4 模型更进一步调优为了更佳的提升模型辨识的准确率,本文使用数据强化的方法对数据展开扩展,减少数据的规模,提升模型的一般化性能。以前,若想对训练数据展开数据强化的操作者,必须手动调整图片来对模型训练样本展开拓展,例如转动、移动、图形、旋转图片等方式,过程如图6右图。
图6 数据强化处置如今,EasyDL的图像分类模型训练中,可以通过平台获取的徵荐功能来自动继续执行上述强化操作者,优化数据非常丰富度,开发者很久不必手工反复处置原始数据啦!表格3 数据强化后数据集大小表格4 数据强化后性能对比2.5 模型对比实验为了更进一步证明本文模型的优势,将本文模型与其他模型,还包括目前风行的深度网络模型VGGnet16、VGGnet19以及文献[3]中的PreCNN-SVM鱼类识别方法和文献[4]中Alex-FT-SVM鱼类识别方法,在F4K数据集上展开性能评估和较为,实验对比结果如表格2右图。表格5有所不同方法的鱼类辨识性能较为表格2的各种方法对比结果来看,本文的方法相对于其他方法辨识准确率有较小提高,取得了99.6%的鱼类辨识精度。本方法充分利用百度EasyDL自定义化图像识别平台优势,可以很好地解决鱼类辨识任务训练数据严重不足的问题,同时通过引进伽马校正法和亮地下通道先验算法对数据展开预处理,使数据特征具备更佳的分辨能力,用于数据强化方法对模型展开调优,进一步提高了模型辨识的准确率。
3 结束语海底观测环境亮度较低、场景模糊不清,造成收集的视频品质劣,必要辨识视频中的海洋鱼类效果很差。本文明确提出了预处理方法提升图片品质、百度EasyDL自定义化图像识别等方法,构建对较好品质图片的精确辨识。针对亮度较低和场景模糊不清的问题,在预处理时首先用于伽马校正法提升了图片的亮度,然后参照基于亮地下通道先验算法的去雾研究针对海底环境的特点不作了改良,提升了图片的清晰度。
由于目前还没大量标记数据,本文用于百度EasyDL自定义化图像识别及AutoDL Transfer算法,解决问题了训练数据较少造成模型效果劣的问题。从实验结果可以显现出,本文所托方法可以以超过99.6%的准确率辨识海底鱼类的图片,检验了方法的有效性。
然而,本文的方法还不存在严重不足,其中的关键在于海底环境的特殊性,提升图片品质的预处理方法还没几乎融合海底环境的特点,提升图片品质的能力受限。下一步的研究工作将是深入分析、挖出海底环境的特点,明确提出针对性更加强劲的、更加有效地的预处理方法。
参考文献:[1]Huang, Phoenix X., Bastiaan J. Boom, and Robert B. Fisher. Hierarchical classification with reject option for live fish recognition.Machine Vision and Applications2015,26(1): 89-102.[2]杜伟东, 李海森, 魏玉阔, 等. 基于 SVM 的多方位声衍射数据协作融合鱼分类与辨识[J]. 农业机械学报, 2015,61(3):39-43.[3]Tamou A B, Benzinou A, Nasreddine K, et al. Underwater Live Fish Recognition by Deep Learning[C]//International Conference on Image and Signal Processing. Springer, Cham, 2018,171(6): 275-283.[4]顾郑平,朱敏.基于深度自学的鱼类分类算法研究[J].计算机应用与软件,2018,35(1):200-205.[5]蒋明敏.基于FPGA的LCD伽马校正研究[D].南京,南京林业大学,2016:25-27.(JIANG M M.Research on LCD Gamma Correction Based on FPGA[D].Nanjing,NanjingForestryUniversity,2016:25-28.)[6]HE K, SUN J, TANG X. Single image haze removal using dark channel prior[J]. IEEE transactions on pattern analysis and machine intelligence, 2011, 33(12): 2341-2353.[7]B J, Huang P X, He J, etal. Supporting ground-truth annotation of image datasets using clustering[C]//ICPR. 2012,21(1): 1542-1545.版权文章,予以许可禁令刊登。下文闻刊登须知。
本文来源:OD·体育-www.naslllj.cn