石油和天然气中的信息提取 - 使用AI找到油

迪伦亚祖尔
头像

迪伦是EMERJ金融服务的高级分析师,对银行,保险和财富管理的AI使用案例进行了研究。

石油和天然气中的信息提取 - 使用AI找到油

油和气公司面临许多与大型企业相同的挑战银行并建立保险公司在搜索他们积压的文件时。他们希望使用存储在这些文档中的数据来做出决策来钻取,并确定是否符合法律法规。

难度提出来,这些文件中的许多文件以物理格式存储:纸张,物理贴图,磁带。石油和天然气公司非常习惯于使用这些物理格式,这在将现代技术集成到工作流程方面时,这会带来一些挑战。

预测分析应用和类似的AI解决方案需要大量的有组织的数字数据,以便为石油和天然气公司产生洞察力和驱动价值。

例如,有许多AI供应商提供预测维护特别适用于石油和天然气公司。这些应用有望在机器或设备需要维修时提醒在石油钻塔和炼油厂工作的人员。

在这样做时,修理船员可以在崩溃之前修理机器或设备,并导致生产中的显着下降或严重伤害,这可能会使石油和天然气公司在法律费用和罚款中花费,以及急剧击中他们的声誉。

油和气companies will spend a lot more time on the initial setup of predictive maintenance applications if they’re storing notes on machine and equipment damage, downtimes, and repair frequency in the form of physical notes that maintenance crews might keep in their desks on site.

在石油和天然气公司数字化纸质文件

为了克服这一挑战并在未来几年准备AI应用,石油和天然气公司可能会受益于基于AI的文件数字化软件。文档数字化软件通常涉及机器愿景,一种方法,允许计算机“了解”数字图像或视频中的内容。

因此,石油和天然气公司的员工将能够扫描其物理文件和笔记并将其上传为PDFS或JPG。然后,文档数字化软件可以将这些文件中的字母传输到填充文字处理器或数字表单的键入文本中。

一旦文件数字化,有石油和天然气公司就可以利用这些解决方案提取信息和见解,这些解决方案比预测维护应用程序的资源密集较少。

铁山是一家AI供应商,提供石油和天然气公司的文件数字化和信息提取软件,其后者在自然语言处理(NLP)算法上运行。

我们谈到了Anke Conzelmann.钢铁山产品管理主任,关于基于AI的信息提取和文件搜索在石油和天然气行业中有用。在本文中,我们讨论了石油和天然气的基于AI的文档数字化和信息提取的若干用例,例如石油位置和合同管理。

有关II的更多信息,用于石油和天然气中的信息提取,下载铁山的白皮书主题

寻找石油的信息提取

根据Conzelmann的说法:

地质学家正在寻找地理位置数据,因此他们可以通过位置访问它。[使用AI],他们可以指向地图上的一个位置,并在单击时单击键获取与该位置相关的所有资产,无论信息所在的类型或格式如何

石油和天然气公司的地球科学家花了很多时间通过过去的钻探和井的日志数据和地震数据来辨别出来的地方,在那里他们可能会发现更多的油和它可能所在的岩石的结构。这项工作是耗时的,涉及各种地球科学专家,其时间有限。

在许多情况下,这些地球科学家只能假设他们拥有决定在何处进行地震测试或在何处钻探所需的所有信息和数据。

他们将经常搜索以不同格式和不同位置存储的物理和数字文件的经常无组织混合。

一家石油和天然气公司可以完全数字化这些数据并将其转化为数字,可搜索的数据库,不仅可以在每个研究会话上节省数十万次,而且还通过发现更快的新油田来驱动真正的收入。

基于自然语言处理和机器视觉的搜索功能可以实现这一目标。在数字数据库中编译和组织后,基于AI的信息提取软件可以帮助地质学家找到新的位置,以基于过去的地理位置数据来钻取石油和天然气公司可以访问。

自然语言处理

例如,地球科学家可能希望快速审查特定位置的所有油井数据,以确定附近是否存在可能含有更多石油的类似地质区域。现在,地球科学家需要搜索单个文件,包括物理文件和数字文件,有时还需要根据位置自行组织这些文件。他们不知道是否已经收集了该公司关于该油井的所有文件。

此外,它们可能需要收集存储在Web和公共数据库的各个位置的位置上的公共数据。利用基于NLP的信息提取软件,地质学家可以在数据库中搜索,并在公共数据库中搜索所有文档和/或与特定地理位置相关的信息。

根据集成的广度,软件可以能够在特定时间段内搜索更多粒度信息,在这些文档或数据中的特定类型的数据。

从理论上讲,地质学家能够在搜索功能中围绕“X'区域中的井中的井中的井中的井中的良好性能数据迭代”,并且该软件将提出所需的数据。

石油和天然气工业中的NLP采用挑战

也就是说,建立一种自然语言处理算法的石油和天然气工业的挑战,主要是由于行业在其中没有发现了许多特定的术语。因此,如果石油和天然气公司的专业员工打算将它们用于搜索,则需要在行业中使用的NLP算法“了解”这些单词和短语。

石油和天然气公司要么需要确保他们的主题专家能够讲我们称之为“数据科学的语言”,以便他们能够向内部数据科学家传达在他们的行业中有用的NLP算法可能是什么样子。

或者,公司可以与AI供应商合作,前提是该供应商在石油和天然气行业具有丰富的工作经验。如果他们这样做了,他们自己的数据科学家将有可能与公司的主题专家“交谈”。然后,他们可以合作建立一个有用的NLP算法,让公司员工用他们在工作中经常使用的单词和短语搜索信息。

在某些情况下,AI供应商向石油和天然气行业提供信息提取软件将会“预先培训”。换句话说,供应商的数据科学家可能只需要在算法准备发射之前响应客户公司主题专家的一点反馈而略微调整算法。

机器视觉

机器视觉还可以帮助地球科学家加快他们收集想要分析的信息所需的时间,以及最终决定在哪里钻孔所需的时间。石油和天然气公司当然希望他们的地球科学家在竞争对手面前找到尽可能多的富油层,机器视觉可以让他们比传统方式更可靠地选择富油地区进行钻探。

地质科学家可能会遇到地质入侵或地震仪的形象,过去已经导致表面下方的富含储物液。

具有机器视觉功能的基于AI的搜索功能可能允许地形分子搜索类似于他们发现的图像的图像,指示富含储物液。因此,他们可以发现他们以前忽视的新钻井地点或者公司拥有但尚未探索。

地震带

石油和天然气公司一直在探索地球的地下超过一个世纪。因此,它们具有跨越各种不同数据存储单元的万亿数据点。

其中之一是地震数据磁带,其中从石油和天然气公司进行的调查中储存地震录音,以确定地理定位是否可能留出油。铁山声称他们可以在完全退化之前将这些磁带的录音转移到数字格式,并且它们可以将它们添加到公司可搜索的数据库中。

因此,地球科学家可以使用40年前的地震仪机器视觉信息提取软件,更好地告知公司下一步的钻探地点。

协调来自不同来源的元数据

元数据,或描述其他数据的数据,在许多情况下对于基于NLP的搜索功能的开发至关重要,因为它通常将数据放入隐式类别中,从而优化搜索查询的结果。

换句话说,许多情况下基于NLP的文档搜索软件使用元数据来组织文档和其中内容的信息,从而加速了石油和天然气公司的地球科学家和其他员工的搜索过程。

例如,高性能井的物理位置是一个数据点,但存在数百万的理论数据点,可以描述物理位置:关于其地质的数据,购买它的实体以及其地震活动的数据,以及其地震活动其他。

在进行明智的建议时,这些信息对于石油和天然气公司应开始钻井的建议是至关重要的。

然而,这种元数据通常存储在各种位置,包括石油和天然气公司的文件(数字和物理)内。根据Conzelmann的说法:

已经有可用的元数据。与数字化内容同步很重要。能够将我们从ML角度生成的内容与现有元数据结合起来,并能够在它们之间建立关系,这就是让这些地球科学家能够找到所有这些东西并花费大部分时间进行分析而不是找到他们需要的信息的力量所在。

元数据通常还可以从第三方数据供应商购买或免费提供公共数据库。后者通常是石油和天然气公司最近购买的特定性质的情况。

创建基于NLP的信息提取软件的数据库将需要使用所有这些元数据标记公司资产,将元数据组合在单个位置中的一个位置,以便使用-case,称为数据协调的过程。

整合像铁山这样的人工智能解决方案需要在任何机器学习算法能够产生关于给定财产、油井或其他资产的洞察之前,在石油天然气公司的现有元数据(他们目前可能不知道)、采购元数据和公共元数据之间进行协调,例如

底线——石油和天然气公司需要知道什么

Conzelmann通过石油和天然气公司的地球科学工作来到了一个关键问题的核心:地球科学家(以及雇用他们的公司)宁愿花时间分析井和地震数据,以便在钻头做出决定;他们不希望他们的大部分工作日都要去寻找他们想要分析的信息。

很少有AI供应商专门迎合石油和天然气工业,其中许多人提供了预测分析软件,这需要需要数字化数据的卷。石油和天然气公司可能首先要将其专注于数字化其纸质文件,磁带和其他物理数据存储单元,然后再开始冗长的AI项目。

In doing so, they have a better chance of avoiding a scenario in which they hire several data scientists who at various points during the development process go to subject-matter experts and ask them where they can find data that the company simply doesn’t have digitally available.

与此同时,确定石油和天然气公司应该数字化的文件可能是通过公司数据科学家和主题专家之间的合作来进行数字化。然而,数字化之后,石油和天然气公司可能希望与AI供应商提供提供NLP和机器愿景的搜索软件。

Conzelmann简洁地将基于AI的搜索应用程序的潜在价值置于:

机器学习的力量和AI的力量是您可以在数百万个文档中以尺寸执行此操作,即使您正在处理不同的不同观望的内容。

信息提取软件可以帮助石油和天然气公司节省地球科学劳动力成本,并以较高绩效的油井的形式推动新的收入。

本文由铁山赞助,并在与我们的透明方面进行了编写,编辑和公布Emerj赞助的内容指南。了解有关我们在我们的ei-communustocomationience的信息了解更多信息Emerj广告页面

标题图像信用:Star.kiwi

保持领先于AI曲线

发现在业务未来将赢家分开获奖者的关键AI趋势和应用程序。

注册“AI Advantage”时事通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - check your inbox for a confirmation email">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
订阅图像
保持机器学习曲线的领先地位

加入20000多名专注于人工智能的商业领袖,接受我们每周发布的最新人工智能研究和趋势。

感谢您订阅EMERJ“AI Advantage”时事通讯,请检查您的电子邮件收件箱进行确认。