AI搜索合规性,合同和人力资源的申请

丹尼尔Faggella.
《阿凡达》

Daniel Faggella是Emerj的研究主管。在联合国、世界银行、国际刑警组织和领先企业的呼吁下,丹尼尔是一名在全球广受欢迎的专家,研究人工智能对企业和政府领导人的竞争战略影响。

AI搜索合规性,合同和人力资源的申请

有一个整个人工智能生态系统,用于企业搜索。大部分是纯粹的数字世界。大多数供应商有助于一层启用AI的搜索,以了解术语或短语,并且能够返回某人类型的问题的结果或答案。但是在寻找物理世界时,问题是复杂的。

银行可能需要寻找财务记录例如,回顾40年前处理一桩诉讼,他们可能不仅要调查数字文件,还要调查在不同地点不同存储设施中的缩微胶片和印刷纸张。

这是一个具有挑战性的问题,但对于不想花费两周的公司来说,这是一个重要的问题,这些公司将律师锁定在他们的房间里,以弄清楚某些法律问题或在过去的合同中找到某些条款。银行希望能够搜索它们,无论是物理还是数字,都会更快地找到他们正在寻找的东西。

这是本周剧集的主题AI在工业中.我们的客人是铁山产品管理总监Anke Conzelmann。铁山是一家位于波士顿地区的四十亿美元的物理存储公司。

他们处理一些最大的记录金融医疗保健, 和零售世界各地的品牌。Conzelmann与我们谈论了人工智能在企业内部搜索的未来潜力,不仅仅是数字文件,而是跨格式的搜索。

对于人工智能搜索应用的更深入的分析银行业,下载铁山 - emerj共同品牌白皮书关于这个话题。

订阅我们的人工智能产业播客使用您最喜欢的播客服务:

itunes-podcast
soundloud-podcast
Google-Podcast.
Stitcher-Podcast.

客人:Anke Conzelmann,产品管理总监铁山

专业知识:企业采用基于人工智能的搜索应用

短暂的识别:anke自2003年以来一直是铁山产品管理的总监。在此之前,她是在差别通信收购之前的Dragon Systems的产品经理。

采访亮点

(2:3)您在哪里看到基于AI的法律搜索的大多数机会?

交流:它实际上是一个很好的用例,契约。每家公司都有,我们都希望我们有很多这样的公司。

拥有更多客户合同是好的,但它也意味着我们已经有一个非常分布式的来源集。[它]可以通过产品...按地区......真的很难回答真正简单的问题,就像“这个特殊客户的所有合同在哪里?“当您考虑回答问题时,它变得更加困难,”这些客户中的哪一个有非标准付款条款?“一般来说,现在你开始阅读合同。当然,这没有规模。

另一个问题是,你不一定能确定你抓住了所有的问题。所以每家公司都有这个问题,每家公司都可以真正受益于使用一些机器学习和人工智能驱动的分类和元数据丰富,以使这类问题更容易回答。

(4:30)还有一些其他有趣的用例,不与人们扩展,但搜索这些合同会对机器有意义吗?

交流:另一个真正的好人实际上是人力资源......每个客户都有人力资源部门。每个客户持有员工数据。因此,随着在欧洲颁布的隐私法,在加利福尼亚州来了......明年巴西,这实际上即将成为一个普遍的要求。除非您实际上可以以规模执行这些事情,否则要求很难见面。

个人信息在哪里?我在哪里有员工信息,我可以找到它吗?我可以在员工请求时产生它吗?我可以在我需要删除它时删除它吗?

随着这些隐私法改​​变的事情之一是坦率地说,“我为每个保留政策保留所有保留政策的一切”是不再可行的。哦,顺便说一下,遵守这些隐私法规:如果你不能这样做,他们就是很大的罚款。您正在观察收入的2%至4%,或者为GDPR的收入为10欧元至2000万欧元。两者的较高,顺便说一句,不是较低的,所以非常大的罚款来了。

因此,能够识别个人信息在物理和数字中的文件中。例如,我一直在铁山很长一段时间。当我第一次来的时候,有填写的物理纸。那些仍然坐在某个地方,但是还有上个月我审查时收集的数字信息。那么我如何在物理和数字中跨越这些不同的信息存储库?其中一些可能是办公文件,其中一些可能是图像,其中一些可能是谁知道什么。

所以不同的内容,真的跨越它,能够回答每个源文件中的每个源文件的问题。“个人信息在哪里?”能够说,“好的,把这个员工在我摄藏的所有不同存储库中的个人信息。”可靠地发现,能够从安全性和访问控制的角度以适当的方式保留它,并应用保留策略,以便我明天退出,从现在开始七年来,这些文件的保留可能会升级,公司是obligated to get rid of this information when it doesn’t have a business need to keep it anymore.

人力资源文件中的隐私绝对是另一个用例,你不能真正地搂着人们。

(8:00)公司需要做些什么,其中一家在其中一个较大的搜索和挖掘纸张,数字,图像,整个九个码?

交流:它是现有的员工甚至。作为员工,或作为客户的客户,您有权询问您要么所雇用的公司,或者您正在与您的业务有关,他们正在遵守哪些信息,他们保持着您。首先,您需要能够及时回答这个问题并及时回答。

第二件事是,作为一名员工,我现在有权利纠正。意思是,我应该可以告诉你,“嘿,这是错误的。你需要纠正它。”然后我还需要得到这些东西。对我来说,“好的,安可,给你。这是我们拥有的包含你个人信息的所有文件。”你需要能够生成所有这些信息。

然后,最后,它是遗忘的权利,是它所谓的。这是一个没有业务的作品,你收集信息的原始经营目的不再相关...... [员工]不再为公司工作[S],现在我必须摧毁该信息。我必须这样做,以便我可以根据政策证明我做到了。

我需要能够表明我实际上根据该员工的终止,我实际上开始了我的时钟从保留的角度滴答。无论是退出,还是放手,并不重要。然后让那个时钟耗尽,让我有一个标准过程,我现在正在进行和销毁信息。无论是数字,无论是数字的。我需要能够始终如一地做到我持有这种信息的地方。

这就是在哪里,再次摄取所有这一点进入端到端的平台,在那里我不仅可以把物理信息数字化现在可能摆脱物理,以便我不必处理那条线。I can take all of the information that’s coming out of digital repositories, could be file shares, could be SharePoint sites, HR shared drives, and pulling that all into a common repository so that I can then very easily comply with what I need to do from a policy perspective.

这是找到所有这些东西的另一个好处,能够消化所有这些东西,能够丰富它,提取关键信息,比如,“这份文件是给什么员工的?”这是什么文件?里面有个人信息吗?”现在我可以用需要应用到它的政策来适当地对待它。

(12:00)还有其他你觉得值得指出的用例吗?

交流:绝对的。有一些非常简单的。当你开始谈论合同时,你会想到合法,但它实际上不仅仅是在一家感兴趣的公司内合法。你有一个非常简单的问题,也许一个销售人员刚刚被分配了一个新账户,他可以说,“好的,给我看这个账户的所有合同。”这是一个。

Then more in the legal realm, let’s say you went through an acquisition, and you now have a whole pile of contacts from that acquisition where, frankly, you really have no idea what kinds of clauses are in there and how they might compare to your clauses. That’s another use case: being able to actually compare something to your standard and being able to find areas where clauses are substantially different from your standard, being able to zero in on that. In other words, give the lawyer access to the ones that actually might be problematic or most important to be looked at.

另一个是责任限制。这个很受欢迎。GC走过一个初级律师,问他:“嘿,对于最近的收购,在这些客户合同中,我们的数据泄露责任限额会暴露多少?”你今天如何回答这个问题?你把一群律师关在一个房间里看合同可能几天,可能几周。你可以提取这些信息,然后在视觉搜索界面上点击几下就能找到那些责任高于标准条款的合同或者那些责任与我们有关的具体条款,比如数据泄露责任限制。

它确实穿过了。这实际上是一个思考你想要回答的问题,然后利用机器学习和人工智能来丰富信息,以便能够回答这些问题。

现实是,有时我们会谈判不同的术语。有时我们使用客户的论文,因为这是最终发生的事情。有时你有来自边缘和收购的东西,看起来完全不同。

真的,机器学习和人工智能的力量在于你可以做到这一点,即使你在处理看起来非常不一致的内容,所以能够找到我想要看的正确的条款。是的,它确实需要培训,但能够在一个平台上做到这一点,我们将其作为一个预先培训的模型,针对特定的客户进行优化,而不是客户自己做。

(16:00)铁山在金融服务、银行、保险, 和活力.在这些垂直的例子中,搜索和发现AI有哪些有趣的地方?

交流:事实上,能量就是一个很好的例子。再一次,我认为它说明了我们讨论过的事情的不同部分。在能源领域的一个用例是,你的地球科学家正在寻找公司所有的不同资产,以驱动决策,“我应该在哪里钻探?”或者,给定井的值是多少?

你要处理的东西可能是巨大的纸质地图,所以要将它们数字化并利用它们。他们的磁带上有地震数据。磁带上有大量的地震数据,所以能够打开这些数据,吸收这些内容,并让地球科学家可以获得这些数据,以及所有可以获得的数字信息。这些地球物理学家需要掌握大量的信息。

他们需要利用它的方式是,“在地图上给我展示关于某个地点的一切。”所以他们面临的困难是他们花了一半的时间在搜索而不是实际分析信息在所有不同的存储库中,坦白地说,他们不确定他们找到了所有的信息。

一些这些数据非常非常昂贵,因此您真的希望确保您使用的是您已经拥有的内容,而不是可能没有找到它并必须再次生成它。从输入的角度来看,跨越物理和数字的各种来源在这里重要。

然后,从处理的角度来看,一切都是关于添加正确类型的元数据,以正确的方式丰富信息。对于这个特定的用例,您正在寻找地理位置。你要确定这张地图,这张地震图,这张测井图是地球的哪个区域。你想要提取这些信息,这样地球科学家就可以根据位置获取信息。他们可以指向地图上的一个点,然后说,“给我地图上这个点的所有资产,这样我就可以决定我们应该在哪里钻井,或者我可以确定一口井的价值。”

这里重要的另一部分是已经提供的元数据。如果是物质资产,我们的客户正在保留许多关于他们与我们存储的资产的元数据。能够与数字或数字化内容结婚很重要,以便您不会丢失您对这些资产以及潜在的外部来源的任何信息。石油和天然气,也许是IHF数据库等。

能够从机器学习AI透视中获取我们生成的内容,就净新的富集元数据而言,与现有的元数据一起,并且能够在所有这些元数据之间创建这些关系,并且在所有这些资产中都是真正的电力非常迅速地实现那些地球科学家找到合适的东西,并花费大部分时间分析,而且很少试图挑选它们所需的所有信息。

石油和天然气还有另一个真正的力量,它正在寻找类似的图像......也许有一个地质侵入,这是潜在的发现石油的重要标志。嗯,您希望能够找到您所看到的任何其他图像,以便您可以在您想要钻取的地图上识别可能的良好斑点。在这种情况下,这将是石油和天然气的一个很好的例子,适用于地下记录。

显然,更快的分析,更好的决定是您在结果的内容。我认为显然,由于这种石油和天然气部门的新措施,很多人仍然必须冲出这些用例。除了慢慢地释放数字文件的元或物理文件并手动查看它们的方式以外的任何方式利用图像资产将是新的。

But clearly, if we have that kind of visual data inside a whole bunch of physical locations where we’ve done our drilling, maybe we’ll have an idea of where our higher yield domains might be, and we can allocate our funds in a more efficient manner.

(21:00)你的意思是元数据,可能来自内部或没有?

交流:它可以来自内部;它可以来自外部。它可能是存储库中已有的元数据;它可能是市场上可供购买的元数据,也可能是某些房产的公开信息。有很多公共信息。实际上,关键是能够创建所有这些不同的比特和碎片之间的关系,并使其成为附加到资产的元数据的一部分。

所以现在我知道这张地图属于地球上的一个特定地点,我也知道井的测井数据来自同一个地点,我还知道IHS的数据可以用于那个地点。这正是增加元数据并创建这种关系的力量,这样你就可以跨越不同的资产类型并以一种有助于快速找到正确信息的方式进行搜索,以帮助你做出决定或回答你需要回答的问题。

It’s really thinking through what the questions are you’d love to be able to answer, and then backing into, “what kind of information do I need to pull out of the different documents as part of the processing that we do with the machine learning in order to have that?” Or, “where is that information today that I already have? How do I now marry that up with these assets?”

它真的从结束开始,开始,“我希望能够回答什么问题?我希望能够解决什么问题?我在流程减慢的过程中我有什么手动步骤?“并向后向后工作,“我需要做些什么,以便能够加速,以便能够提供该信息并回答这些问题?”

(23:30)银行或保险范围内的一些特定用例是什么?

交流:很多银行都有微缩胶片,几十年的微缩胶片可能是账户报表的图像。他们把所有的账目记录,都放到了缩微胶片上。对那些不知道的人来说,这就像一个索引卡大小的fiche有几百张图片,像针头大小的图片。

那么你为什么要得到那东西?因为,显然,这不是去年的陈述或上个月的陈述。

这可能是一笔财产回到银行说,嘿,我们认为你欠我们X万美元的财产并且必须能够返回并生成,例如,几年的报表。仔细想想,找一张合适的缩微胶片,放在合适的盒子里,把它放在你的缩微胶片阅读器上,在缩微胶片上找到合适的方块,把它数字化,然后再做一次。那是第一个月。希望你只有一页的语句因为如果它有两页,你在那个月做了两次。所以做24个月需要很长时间。

顺便说一下,你并没有增加任何价值。您所做的一切都是响应客户的请求。能够提取所有的信息,在这种情况下,它实际上是非常具有说明性的,它是非常简单的,用例。我希望能够在一堆不同年份的数据中搜索一个账号,并找到一个日期范围的所有相关报表。这是一个非常简单的问题,但用物理缩微胶片很难做到。这在金融服务业非常普遍。

另一个例子是抵押贷款。作为一个客户,现在很多这些东西现在是数码的,所以我们可能会认为这不再有太多的纸张了。然而,有时当你最终在这个过程结束时,你仍然可以获得一堆论文。哦,顺便说一下,后端流程经常仍然涉及字面上的缺点,并具有物理纸张的运动。

所以这个过程首先需要很长时间。它需要的时间比应该更长,部分原因是有很多人工干预。真的,你想做什么?在进程的前端,您正在尝试弄清楚您是否拥有决定为提供某人提供贷款所需的所有信息。

这真的是对我们对分类和提取的操作的说明性?分类回答了第一个问题,即“我拥有应该成为这一贷款文件的一部分的所有文件?”

一旦我的答案是“是”或“不是”,我就会进入下一个步骤,也就是,“这些填写得完整且准确吗?”我有签名吗,还是我想要签名?我的名字和社保号是否都是这个文件里的?我是否有相同的APR,或者是否有任何文件有不同的名字,或者拼错了名字,或者拼错了社保号,等等?”

在文件中找到信息,即提取。我正在拿出这个名字。我正在拉出社会安全号码。我正在拉出4月。我正在拔出所有这些相关的位和碎片,以便能够回答第二个问题,即它完全准确地填写?你在这里看的是一周到不到一天的过程。在客户体验方面非常强大,所以据推测,我将更快地获得贷款,我的批准更快,也是从实际供应商的明显流程效率的角度来看,在这种情况下。

然后,另一件事是,现在我已经完成了所有这项工作,我真的很丰富,我可以以次要方式使用。例如,我符合公平的贷款法律吗?我现在实际上可以回答这个问题。最重要的是改进了我的过程,我现在有能力考虑其他次要用例,我可以支持,这样我就可以回答问题,“我符合公平的贷款法律吗?”

是的。所有这些似乎都与你提到的关于能源的重要观点有关,我们确实需要问自己,我们需要问什么问题?我们希望启用哪些流程?因为当你谈到出借时,为了建立这样的东西,当然,我们想知道我们把这些特定类型的文件存储在哪里,或者我们想要什么特定类型的术语。就像你说的,要建立一个流程,来得到一些东西,可能需要一周到一天的时间,我们需要提前做战略思考,建立系统,这样搜索就可以在那里工作。

(28:30)一家公司需要什么样的战略思维来整合人工智能搜索应用?

交流:你要有正确的人围着桌子和多个感兴趣的潜在早期围着桌子,这样您就可以确保,当你处理所有这些信息,你实际上添加合适的元数据,这样您就可以回答大家的问题。

现在,话虽如此,你当然可以从最紧迫的开始,或者最紧急的,然后随着时间的推移增加。所以这不是一个“我必须一次考虑所有事情”的问题。在我们的示例中,我们可能会意识到,一旦我们完成了抵押贷款流程,我们实际上也希望能够回答这个合规问题。

我们可以从处理的角度提炼我们正在做的事情再处理我们已经吸收的资产来添加我们现在正在寻找的额外元数据。所以你完全可以一点一点地来做,先解决最紧迫的问题,政策也是如此。

也许最初你是自动化一个过程。你不是在考虑应用你的保留政策,但你可能想要。Now that I know what I have, I can actually figure out how long I should be keeping it and process it for destruction when I don’t need to keep it anymore so that we start really getting our arms around this big, huge pile of unstructured data. Also, from the perspective of “should I be keeping it anymore?”

如果您认为您将想要更广泛地,您应该在早期考虑的部分是,“这方面是什么意思在我需要的那种工具方面?如果我需要跨越物理和数字信息,那是什么意思?如果我需要跨越视频,图像和办公文档,那是什么意思?“

所以没有让自己在你走的角落里,“好的。好吧,我们有我们想要解决的一件事,所以让我们拥有这个非常有针对性的解决方案。“但后来,你转身,你走了,“好的,我很乐意解决下一个问题。”

而现在,坦白地说,你已经把自己画在了一个角落里,就像“好吧,我们不能在同一个平台上处理视频。”

现在我们推出了第二个,第三个,第三个。因此,重要的是要考虑你可能想要的地方,但你不一定也不一定地用尽一切。You should be thinking about it as a first, second, third, but really do make sure that you understand where you’re ultimately potentially going to want to go so that, as you’re deciding to put in solutions, you’re not narrowing your choices down the line.

订阅我们的人工智能产业播客使用您最喜欢的播客服务:

itunes-podcast
soundloud-podcast
Google-Podcast.
Stitcher-Podcast.

本文由铁山赞助,并在与我们的透明方面进行了编写,编辑和公布Emerj赞助了内容指南.了解有关我们在我们的ei-communustocomationience的信息了解更多信息Emerj广告页面

标题图片来源:Twitter

保持在AI曲线的前面

发现在业务未来将赢家分开获奖者的关键AI趋势和应用程序。

订阅《人工智能优势》通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - check your inbox for a confirmation email">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
subscribe-image
保持领先于机器学习曲线

加入超过20,000名以上的可调性的商业领袖,并收到每周提供的最新的AI研究和趋势。

感谢您订阅EMERJ“AI Advantage”时事通讯,请检查您的电子邮件收件箱进行确认。