基于机器学习的油气资产评估方法研究

发布时间:2019-10-28 16:00:00

机器学习用于帮助工程师识别目标和描述状态。

基于机器学习的油气资产评估方法研究

机器学习用于帮助工程师识别目标和描述状态。

在表面状态评估中,经验丰富的人员可以快速识别缺陷或损坏,因此目视检查是一种较好的无损检测方法。然而,这种方法的缺点在于缺乏对缺陷的目标量化和描述。利用机器学习、图像识别和目标检测的***发展,探讨了将机器学习应用于目标识别和状态描述算法的可行性。

本文采用fasterr-cnn算法构建inceptionresnetv2的网络结构。该算法在提高检测速度的同时,也具有较高的检测精度。该算法由四个步骤组成。

1)当检测到目标时,该算法将整个图像作为卷积层进行图像特征提取,并将提取的特征作为特征映射输出。

2)将图像分解为多个目标区域。在这些区域中,最多可以插入2000个边界框。该算法能够预测目标的可能位置。

3)边界框中的区域用作CNN的输入项,以识别对象的不同特征。每帧中的像素被转换成一个数字。

4)分类与回归。输出是已知对象类的概率分布。呈现***概率值的对象类被分配给相应的边界框。

5)为了达到步骤2的预期结果,算法可能需要在每个图像上插入数百个边界框。为了优化步骤3)和步骤4),有必要给出一个它将学习用于cnn算法检测的对象类的例子,该算法通过标记待检测对象周围的数千个感兴趣的图像区域来实现。这个手动给定的边界框称为地面真相。这些标签的图像存储在数据库中,形成ml处理的基础,这将允许cnn算法学习每个对象类。然后,将未标记图像展示给cnn,并对其在未标记图像上检测目标的性能进行了评估,验证了算法的有效性。

6)在cnn算法的训练过程中,使用了人工标记的图像。CNN将执行第2步,并在图像上放置边框。每个预测边界框中的图像像素被转换成数值并用作输入项。

7)基于这些由cnn连接的数百万方程,cnn可以使用数百万个参数进行调整。当cnn处理来自预测边界框的值时,将输出概率和确定的对象类与训练图像中手动标记的地面真值边界框进行比较。该方法利用预测偏差和地面真实度来修正方程的权重,从而提高预测正确目标类的概率。这个过程需要重复数十万次,直到cnn开始收敛。这是cnn机器学习算法过程的概述。在实际应用中,可以有效地完成操作过程。

8)为了评价cnn算法的性能,必须给出两个参数:总损耗函数和平均精度。如果cnn性能良好,总损耗函数应该收敛到零。训练cnn算法与此参数相关,通过调整方程的权重使总损失函数最小化。ap表示对象类的所有预测与成功预测数的比率。较高的ap值意味着cnn在预测给定训练数据集中的对象时表现良好。在训练过程中,如果cnn的自置边界盒与人工给定的地面真相之一重叠50%,则表明该算法能够成功地进行预测。

9)根据上述数据集,CNN使用每个对象类90%的数据进行训练,其余10%用于验证。本工作的主要目的是验证cnn能否根据油气处理设备的相关定义进行目标检测。主要结果是cnn根据定义的类给出了相关对象周围带边界盒的图像。此外,还进行了一项测试,以调查数据集大小的影响。在将数据集减少50%的基础上,进行训练,直到总损失函数收敛到稳定值。

10)当cnn使用更大的数据集进行训练时,通过ap值可以看到性能的提高。然而,本研究并非如此。cnn在多个对象类的结果预测方面表现不佳。目前尚不清楚造成异常结果的原因是数据集的质量或大小,还是算法训练不足。一般来说,一些对象类的数据集仍然被认为太小。结果表明,总损耗函数不收敛,但峰值不断增大,调整cnn参数时会产生噪声。

11)在图1和图2中,CNN预测的边界框为白色,手动插入的地面真值边界框为黑色。

12)图1cnn显示了多类检测的结果,无法检测图像中所有给定的对象类。

13)图2cnn显示了在良好视觉条件下检查的焊缝。它不会对所有焊缝进行100%检查,但提供选定区域的准确定义。

14)如果未来油气行业要引进智能机器人进行设备检测和维护,就必须让这些机器了解周围的环境。因此,在评价图像结果和ap值的基础上,训练cnn算法和ml框架来识别与油气处理设备检测相关的目标类别。ap值和总损失函数表明,为了提高算法的性能,需要增加数据集的大小。ml和cnn可以用来提高过程设备的检测效率,但算法的性能有待进一步提高。采用该自动检测系统,缺陷识别率仅为10%,明显不尽如人意,检测精度有待提高。