AI在味道和艺术中 - 当前机器学习状态理解偏好

丹尼尔Faggella.
《阿凡达》

Daniel Faggella是Emerj的研究主管。在联合国、世界银行、国际刑警组织和领先企业的呼吁下,丹尼尔是一名在全球广受欢迎的专家,研究人工智能对企业和政府领导人的竞争战略影响。

AI在味道和艺术中 - 当前机器学习状态理解偏好

人工智能和机器学习促进了技术创新市场营销电子商务和其他几个行业。许多人体验AI和ML系统的好处甚至不知道它每次搜索谷歌或点击Spotify中的歌曲。

AI可以帮助推荐电影和音乐 - 将这些相同的系统在葡萄酒中或美术(如石油绘画或雕塑)中保持着挑剔的味道

在机器中开发艺术或烹饪“味道”的挑战在某种程度上与推荐电影或音乐的挑战不同。

建立艺术或烹饪“味道”到AI系统的挑战

似乎搜索和推荐引擎已经变得相当擅长了解用户迟到的意图。特别是,推荐发动机可以在许多情况下推荐产品到网站用户只在首次出现在网站上并单击产品列表后。就好像推荐引擎能够弄清楚用户在音乐或服装中的味道。

Netflix推荐电影或亚马逊推荐产品的方式与人类相互推荐的方式非常不同。机器还不能像人类理解的那样使用我们所说的“味觉”和偏好——它们只能通过在大量数据中寻找模式来理解味觉。在某些情况下(如电影或音乐推荐),与人类偏好相比,这些代理可以非常有效和可伸缩。

人们可以争辩说,一台机器最终能够欣赏一个好的波尔多,但它不是在当前的现状中这样做的任何地方;机器不能“欣赏”任何东西 - 在人类的感觉中,因此他们无法确定“好”或“坏”葡萄酒,“好”或“坏”的味道,没有人类用户的反馈。机器只能根据他们从人类投入接收的数据确定品味的品质。

此外,机器尚无法以任何合理的准确度确定这些质量,而无需访问大量的量化,可重复数据。此类数据并不总是可用的。每当一个情况要求对难以量化的特定刺激的主观评估(换句话说,味道),机器将没有依据进行评估。

然而,AI模型可以在特定条件下精确地训练以预测味道偏好。在某些情况下,这些味道的代理决定因素很容易获得。在其他人中,它需要大量的人类努力,以产生机器学习模型可能培训以理解味道的必要数据。

以下是AI和机器学习模型如何且目前无法确定用户的味道:

音乐 - Spotify如何确定用户偏好

AI准确预测人类口味的一个具体示例是音乐。2016年,美国的音乐行业在2016年销售额超过70亿美元,其中68%可归因于Spotify等订阅流音乐平台。这些音乐平台使用机器学习通知他们的推荐发动机.这些推荐引擎通过向Spotify的听众提供与他们的品味相关的推荐,为他们提供订阅的理由。反过来,听众可能更愿意自己购买音乐文件。

像Spotify这样的平台在销售音乐方面如此成功的原因在于它们是基于个性化的。他们能够根据用户的个人历史和成千上万拥有相似资料和人口特征的其他用户的参与情况,确定哪些类型的音乐可能会吸引特定用户。

Spotify具有来自其数百万用户的数据点,它用于向特定用户提供相关的建议。它具有可量化的数据,了解倾听某些歌曲的人,往往会倾听其他歌曲,其中AI解释为“喜欢”或“品味”。推荐引擎注意到某种类型的用户侦听歌曲或音乐的长度,他们暂停或重放某一部件的频率,以及它们在播放列表中的频率多久包括歌曲。

在Barcelona的DataEngconf演示文稿中,Spotify数据/后端工程管理器Gandalf Hernandez分享了一些进程,Spotify用于确定推荐音乐,并从音频轨道中学习:

Spotify——通过各种途径——使用这个数据来衡量“喜欢”,当它积累足够的数据(播放歌曲,歌曲评级,将歌曲添加到播放列表,等等),它可以准确地预测用户听接下来会想听到某首歌,并相应地提出建议。Spotify还会注意到某个用户拒绝某个推荐的情况,以便完善未来的推荐。

例如,Spotify的首次用户可能会选择收听两首歌曲,这些歌曲都是古典音乐作曲家Sergei Rachmaninoff的碎片。这不会给出关于用户的AI资料,以提出良好的建议。但是,推荐引擎后面的AI具有来自其他用户的大量数据,这些数据也会收听这两个特定的RachmanInoff块,因此它看出其他用户点击下一步,以便为此新用户提供一些建议。

即“来自[国家]的其他用户,下载Spotify并立即听取拉赫玛尼诺夫最后通常会喜欢其他歌曲。让我们推荐一些其他的歌曲来吸引这些用户。”

当新用户点击下一首歌曲时,AI将使用此附加数据点来为此特定用户提供未来的建议。随着时间的推移,推荐引擎背后的AI将变得更好地“了解”这个用户在音乐中的味道或者至少更好地推荐他们的音乐。

这所谓的“理解”的关键是可以提供大量数据的可用性,可以进入推荐引擎后面的机器学习模型。AI没有真正推断或假设可能落在用户味道内的音乐类型;它使用基于响应反应和行为来使用用户提供的数据来实现这一确定。这是“理解”的方法是关于概率和评估各种代理的“喜欢”音乐的各种代理商从数百万和数百万用户的音乐。

组成机器学习模型的算法处理这些数据的能力,在模型做出预测和建议的能力中扮演着重要角色。这些算法往往会不断变化,因为很多数据科学家在任何给定的时间都在研究它们。

然而,即使是最好的算法,如果没有可以运行的数据,也毫无用处。对音乐行业来说幸运的是,这些数据可以通过流媒体音乐服务轻松获取。我们的听觉在数字世界中可以很好地转换。但我们的其他一些感官以及与之相关的味觉却并非如此。

葡萄酒 - 感官味道和ai

人们可以争辩说,如果一台机器可以训练为“了解”或至少推荐产品,或者在谈到音乐方面的味道时,应该可以训练它在葡萄酒中做同样的事情。假设,是,机器学会如何识别用户在音乐中的味道时所展示的相同过程适用于用户在葡萄酒中的味道。然而,采样音乐与采样葡萄酒不同。它们涉及两种不同的感官,物理味道不会赋予数字化。

当用户点击音频文件时,他或她可以在纯粹的数字环境中体验它,并通过聆听音乐的整体,重播它,选择类似的音乐,或者放弃它 -玩和可能跳过完全不同的东西。所有这些数据点都被数字上捕获,并且这些数据点立即用于通过机器学习模型进行处理。

量化人们如何决定他们是否喜欢某种特定的葡萄酒并不像预测特定用户喜欢哪种类型的音乐那么容易。舌头并不像耳朵那样适合数字化。为葡萄酒收集数据所需的参与发生在物理世界,而完全存在于数字空间的机器学习模型无法立即获得这种参与。

如果想要确定一个机器学习模型可以训练的用户对葡萄酒口味的代理,他们需要在机器学习模型可以找到模式的物理世界中收集大量数据。

此外,葡萄酒的味道是臭名昭着的主观。机器学习模型没有味蕾,所以它永远无法理解人类可以的方式信息信息。因此,确定用户的偏好是更困难的,或者品尝,葡萄酒。它只能根据其化学成分和每种特征的感知值分配给葡萄酒的特定属性的值,使其成为人类投入定义的“好”葡萄酒。对于机器学习模型来说,准确预测对人们可能吸引什么类型的葡萄酒,建立模型的数据科学家需要以某种方式收集与葡萄酒偏好相关的可量化数据。由于这种数据需要在物理世界中收集,因此可能不是不可能的,但它可能是非常困难的。

量化因素可能包括:

  • 葡萄酒中发现的化合物
  • 葡萄酒中各种化合物的相对量(毫毫升)
  • 葡萄酒的颜色
  • 胜利的粘度
  • 葡萄酒的类型(波德,Zinfandel等)

更具挑战性将是人类感知中的人类“味道”实际标签的蒸馏,例如:

  • “光滑的”
  • “橡木”
  • “果味”
  • “馅饼,但顺利完成”
  • 等等…

为了实际蒸馏到可以可靠推荐葡萄酒的质量的这些主观经验,以各种味道偏好的人们对葡萄酒中的人们进行巨大的受控味觉测试,以及葡萄酒中的可量化因素(其化学化妆,其颜色等等)必须在这些主观上的经验中可靠地“映射”来自数千(或成千上万)的人类的经验。

还有其他挑战。人类在一天中听取100首歌是完全合理的。用100杯酒做同样的意思是急诊室的旅行。事情进一步复杂于食物的存在 - 因为可以用相同的葡萄酒训练,但是用相同的葡萄酒训练的可靠系统 - 但有数十种不同的食物菜肴(从奶酪蛋白质到鱼叉,更多)。

它可能需要在不同的地点有一个高度仪器化的、受控的环境,大量的参与者,以及几个品酒会议。这些参与者将被要求品尝随机选择的几种葡萄酒。每一种葡萄酒都将事先进行分析,以获得它们的化学成分,并将选定的属性指定为编码质量。

然后,每位参与者将被要求根据这些品质,如pH值、气味和甜度,对每种葡萄酒进行评级。根据评分,参与者将在1到10的李克特等级上判断葡萄酒。该量表将量化参与者的判断,从理论上讲,机器学习模型可以利用这些判断来确定葡萄酒的“好”和“坏”成分。

这种数据收集方法需要大量的时间,金钱和努力。培训机器的数据所需的数据量需要几个月的时间需要几个月的时间。它将仅仅30分钟就会收集相同数量的数据。

也就是说,李克特规模判断是主观的,通常是异想天开的。同一个人可能会判断一天的葡萄酒是一天的“5”,另一个取决于他们的心情。另一种方法可以涉及更多客观的措施。例如,亚马逊将历史重大购买历史,以其推荐引擎。如果参与者为了评价葡萄酒,但在品酒时购买3瓶,那么机器学习模式可以将购买作为“喜欢”的代理,而不是参与者的判断。购买3瓶特定葡萄酒的人可能会认为葡萄酒是以某种方式的“善”。

由于这些挑战,今天的葡萄酒建议更有可能从购买数据中解散,而不是从葡萄酒化学化妆的任何强大评估,或者将该化学化妆的“映射”放在人类主观术语上,如“平滑”或“果味”.购买数据很容易。味蕾数据很难。

当所有人都说完成时,在线购物者可能能够查看一瓶酒的产品页面,并被推荐其他葡萄酒。页面上推荐引擎背后的机器学习模型可能能够确定葡萄酒品尝的参与者,评为葡萄酒的葡萄酒,购物者正在高度观看的葡萄酒也很可能高度评价另一葡萄酒。建议引擎然后将其他葡萄酒展示给购物者。

视觉艺术-人工智能模型如何理解图像

最近,谷歌公布了实验与人工智能这试图拍摄图像并编辑它以使其更加令人愉悦。根据Google AI,机器学习“模仿专业摄影师的工作流程,从谷歌街道视图漫游景观全景,然后搜索最佳的组成,然后执行各种后处理操作来创造美学上令人愉悦的图像。”

但是,重要的是要注意“美学上令人愉悦”是一个非常主观的概念。有些人可能会令人愉悦,可能不是其他人。这一切都归结为上下文。AI可能能够模仿专业摄影师的特殊用途的质量和工作,例如广告滑雪胜地,但人们希望在博物馆中看到广告。存在特定图像的上下文影响人们是否喜欢它。

从艺术角度来看,视觉媒体很难判断为葡萄酒。为了教导AI获取对视觉艺术的味道,有必要将机器“理解”的可量化代理将其分解为可量化的代理。这可以通过将值分配给颜色,形状,手势和其他可视元素的组合来完成,并让人们再次评估那些在李克特级上存在这些组合的图像。

幸运的是,收集视觉数据比收集感觉品味的数据更容易,因为视线转化为数字世界。Google Images,Facebook和其他Visual Media平台将图像上的数百万个数据点降至这些图像中的特定像素中的特定颜色。

机器学习模型可以消耗这些数据点并使用它们来对特定用户如何响应人脑解释为图像的这种像素数据 - 像素数据来进行预测。例如,机器学习模型可以确定加利福尼亚特定县中的人们更有可能回应主要涉及来自美国其他地区的人的颜色蓝色的图像。此确定可以向推荐推荐产品推荐给该国家的人的推荐引擎。它也可以通知营销活动以那个国家的人为目标投放视觉广告。

AI并不真实地理解那个县的人更喜欢蓝色图像,但它预测他们对基于数据,数字,统计数据的那些图像的响应。

AI的当前状态为理解味道

机器没有知觉。因此,他们现在既不能拥有自己的偏好和品味,也不能真正理解使用它们的人类的偏好和品味。他们很有可能在未来做到这一点,但那是一个相对遥远的前景。

目前,他们依靠数据来制作预测并确定可能性,模仿人们“了解”彼此的偏好,而无需真正掌握能够对人类大脑的完整理解。及时,这些统计机器学习方法可能延伸到化学感变(味道和嗅觉),但是这样做的遗漏挑战,我们试图在本文中突出。

标题图像学分:共和国,华盛顿

保持在AI曲线的前面

发现在业务未来将赢家分开获奖者的关键AI趋势和应用程序。

订阅《人工智能优势》通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - check your inbox for a confirmation email">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
订阅镜像
qwfwef.

Wwefwef.

wefwefwef