语音助手是否梦想着电动力学?Tatiana Lando访谈:Google分析师语言学家



8月24日,我们与Google语言学家Tatiana Lando进行了现场交谈。塔蒂亚娜(Tatiana)正在研究Google助手,并参与了生产与开发之间的项目。她探讨了人们如何互相交谈,以及他们在教导助手更多的人类行为时使用了哪些策略。来到Google从事俄罗斯市场和俄语助手的工作。在此之前,她在Yandex工作了8年。她从事语言技术,从非​​结构化文本中提取事实。塔蒂亚娜(Tatiana)是AINL:人工智能与自然语言会议的创始人之一。



我们与您分享广播的笔录。









当我说我是一名语言学家时,他们充其量只能问我是否读过Strugatsky小说,其中涉及到“结构语言学家”。在最坏的情况下,我被问到我知道几种语言。语言学家不是懂多种语言的人。具有任何专长的人都可以了解多种语言,但它们之间没有联系。语言学家是一个了解语言如何工作,人与人之间的沟通如何工作的人。这是一门很大的科学学科,除了我所做的以外,它还有很多其他方面。对文本进行分析以确立作者身份,法医学中就有语言学-例如,当语言学家确定文本中是否存在极端主义时。这是一个例子。



我从事的计算语言学一方面主要旨在开发技术,计算机与人之间的语音接口,并将数值方法引入语言处理。语料库语言学的整个领域-当我们尝试自动处理大量文本以根据获得的数据得出有关语言工作方式的结论时。我正在使用Google助手-这是电话或计算机与人之间的语音接口。



在移居伦敦并开始在Google工作之前,我在Yandex工作了7.5年,在那里我还研究了计算语言学。我在Yandex从事的任务涉及计算语言学的相当广泛的任务。我们研究了词法,语法-单词如何变化,单词如何组合;在这方面,俄语比英语更复杂,因为英语没有格,名词只有两种形式,一切都相对简单(俄语-6-9格,奇怪的复数形式-好吧,所有母语人士都知道这些特征)。因此,当我转到Google时,虽然现在我已经在做其他事情了,但我还是被聘为俄语专家。



俄语版Google Assistant的开发是否有空缺?您如何获得Google助理工作?



俄语版本的Google Assistant没有特殊的空缺。谷歌试图一次针对最大数量的语言开发方法论,应该使用数据而不是特定的方法来解决语言的特殊性。也就是说,尽管有一些细微差别,但俄语,英语,德语,中文的算法-所有受支持的语言都是相同的。有很多共同的部分,处理特定语言的人员主要监视数据质量并为每种语言添加特殊模块。例如,对于俄语和其他斯拉夫语言,则需要形态(这就是我刚才所说的-格,复数形式,复杂动词)。在土耳其语中,形态甚至更加复杂-如果俄语中只有12种名词形式,那么在土耳其语中则更多。因此,我们需要某种特殊的模块来处理依赖于语言的部分。但这是在了解自己语言的语言学家和使用数据编写算法的通用语言工程师的帮助下完成的。我们将共同努力,以提高这些算法和数据的质量。因此,我们没有俄语的特殊空缺,但是Google Assistant的开发存在空缺,主要是在加利福尼亚州的苏黎世,纽约的纽约-伦敦。我们没有俄文的特殊空缺,但是Google Assistant的开发中有空缺,主要是在伦敦的苏黎世,加利福尼亚,纽约等地。我们没有俄文的特殊空缺,但是Google Assistant的开发中有空缺,主要是在伦敦的苏黎世,加利福尼亚,纽约等地。



, ?



4年前,我移居伦敦时仍是欧洲。实际上,他现在是欧洲,尽管不是欧盟。我真的很喜欢伦敦,每个人都说英语,不需要学习另一种语言。并不是说我不想学习另一门语言,但是此举的进入是微不足道的。这里也有很棒的剧院,我真的很喜欢去剧院。当然,现在伦敦在文化和娱乐方面的所有优势已得到一定程度的平衡,但让我们希望最好。此外,与苏黎世相比,这里的签证要容易得多-由于某些原因,瑞士的签证法规会定期更改。事实证明,将我和其他几个人放到伦敦要容易得多,我们就在这里定居。我在这里喜欢它,我不想搬到任何地方。前往加利福尼亚的商务旅行使我忧郁-您必须在远处乘车。尽管那里有更多的职业机会。



?



它比英语难。实际上,几乎所有语言都比英语更复杂。这种复杂性有两个方面。首先,非常复杂的形态。另外,俄语具有自由的单词顺序,这使构造算法时的工作复杂化。如果它是固定的,那么对于条件“妈妈肥皂框架”,需要使用一句话来教系统理解“主题-谓语-宾语”。但是,如果这些单词可以以任何顺序排列,则需要更多数据。同时,有很多现成的英语资源。整个科学界都使用英语,因为所有公司都在美国市场竞争,所以所有公司都使用英语。涉及其他语言的内容更少,资金更少,公司更少。如果仍然有可用于德语或法语的数据块或数据,可以重复使用,那么俄语就更糟了。有现成的箱子,但它们很小,并不适合所有情况。也就是说,与英语相比,俄语需要更多的数据,但是可用的数据却更少。加上其他语法层;您可以尝试分别理解相同的形态,然后可以减少俄语(与英语相比)的高质量解析器工作所需的数据量。俄语(与英语相比)高质量的解析器工作所需要的。俄语(与英语相比)高质量的解析器工作所必需的。



因此,事实证明俄语像其他斯拉夫语一样很难。突厥语甚至更难; 东方语言还有其他问题:例如,中文在单词之间没有空格,您需要了解如何将文本数组分解成几段才能确定每段所说的内容。通常,每种语言都有自己的笑话,但是由于要解决任务的大量语言数据,因此基本上所有问题都可以解决。一切都基于这样一个事实:俄语用的语言很少,因此很难使用它,而英语则很难使用。



例如,在与地面人员进行谈判时,计算语言学能否重构出难以理解的地方?



哦没问题。基本上,执行此操作的算法将类似于搜索建议。当您在搜索中输入查询(针对任何语言)时,系统会为您提供最受欢迎的查询,并进行一些过滤。当然,该算法会稍微复杂一些,但为清楚起见,我们将忽略它。系统建议查询中最频繁的单词组合,从您已经输入的单词开始。可以使用类似的技术来恢复晦涩难懂的地方。谈判很多,这是大量的文本,您可以对其进行分析,看看哪些部分是最常见的。我本人从未处理过飞行员与地面之间的谈判主题,但我怀疑应该有许多类似的提案,信息的结构相当规范,沟通方式是标准的-这样的事情很容易预测,因此可以轻松恢复。



告诉我们有关语音助手中声学和声音信号清洁的信息



关于这一点,我几乎一无所知,我只处理书​​面文本。语音,声学不是我的专长。但是我敢肯定,有音频方法可以帮助清除信号,并且在音频信号和预测引擎之间的交汇处,您可以过滤掉假设并恢复文本。



什么是最难处理和理解的语言?



它们都很复杂。并不是说它们本身更复杂或更简单。有很多英语数据,因此使用起来更容易,每个人都在做。



事实证明这是一个恶性循环:当会议上的人们想要尝试一种新算法时,他们会采用著名的语料库,并观察指标上的数字如何增长。要衡量您的算法,您需要一个良好的语料库;英语中有很多很好的语料库,因此他们用英语运行算法,获得了增长,从而刺激了其他研究人员制作更多的语料库,以发现算法中的漏洞。这是一项很容易获得资助的任务。例如,有10种算法可以自动回答问题。在现有语料库上,这些算法或多或少相似,研究人员决定创建一个新的语料库以查看它们之间的区别。这是一项很好的任务,它可以更好地调整算法。他们做到了,英语的语料更多-语料越多,出现的算法就越多。如果您看一下过去几年中NLP领域的工作,会议所衡量的甚至不是百分比,而是质量提高的一小部分。



通常,这在实际问题中不是很有帮助,并且实际上不是计算语言学。如果工程师不与语言学家合作(即平庸或理论性很强),这就是工程师处理语言的方式。



为什么没有足够的俄语数据?



这个问题困扰着我学习应用语言学的大学多年来的俄语学习。



我不知道。也许俄罗斯科学上根本没有足够的资金,因此俄语的数据很少。俄罗斯的会议通常有点过时。有关于应用语言学和自动自然语言处理的会议,但是很少有大型团队参与。科学家们去了大公司-Yandex,ABBYY,现在MTS也雇用了语言学家。随着语音助手的出现,对该行业的需求越来越大。他们也出国了。初创公司有很多语言学家,亚马逊和谷歌。

唯一的大型语料库是俄罗斯国家语料库。我的朋友也制作了一个语料库-俄语开放语料库;但是,总的来说,为此很难获得资金,而且很少有人对此感兴趣。



在算法竞赛中,针对特定任务创建了小型语料库-例如,比较系统如何回答俄语问题或理解俄语命令-但是这些数据不足以训练大型系统。事实证明,这是另一个方向的恶性循环:没有要训练的东西,因此没有要训练的东西,因此没有要测量的东西,因此没有数据。另外,比英语需要更多的数据。拿到文凭后,我几乎立即去了Yandex,所以很难说为什么它在这里行不通。



Google对语言处理采取了哪种方法?神经网络还是算法?



神经网络也是算法。我一点也不理解这种二分法,但是我将尝试告诉您在计算语言学中对语言的分析处理中我们所使用的(通常)方法。



历史上最古老的方法是基于规则的方法。语言学家几乎像编程语言一样手工编写规则。假设在感知的文本中,首先是主语,然后是动词,然后是谓语;如果谓词在一种情况下,则-一个结论,依此类推。例如,对于用户说“ OK Google,将闹钟设置为上午7点”的情况,您可以制定以下规则:早上将-任何单词-闹钟-接通-数字。这是一个可以描述并向系统介绍的模板:如果使用这样的模板并且可以使用,则需要在以数字形式指示的时间设置警报。当然,这是一个非常原始的模式,您可以做的复杂得多。它们可以组合:例如,一个模板提取日期和时间,然后在其上写一个用于设置警报的模板。



这是一种非常古老的方法,已经有70年的历史了-这就是1966年编写的第一个聊天机器人Eliza成为心理分析者的方式。那时人们很惊讶。有故事说这个聊天机器人的创建者向同事展示了这个故事,然后他们将他们踢出了房间,与“真正的”心理分析家交谈。而且该机器人只按规则编写-这是一种突破性的方法。现在,我们当然不愿意这样做,因为需要很多规则-想象一下,您可以仅使用几个不同的短语来设置警报,如果使用纯规则,则必须手动描述每个规则。很久以前,我们切换到混合系统:它们可以感知模式,但是总的来说,我们尝试使用神经网络进行机器学习,并将监督方法应用于监督学习。即我们标记数据并说:好的,在用户可以说的这个数组中,这部分是时间,它像这样归一化;此部分是用户要在其上设置警报的设备,例如,该部分是警报的名称。这样您就可以在上午7点在iPhone上设置一个名为“学校”的闹钟。接下来,我们设置一个大型语料库,在其上训练解析器,然后将解析器应用于用户请求,从而识别它们。这就是Google Assistant现在的工作方式,这就是我们现在使用的方法。接下来,我们设置一个大型语料库,在其上训练解析器,然后将解析器应用于用户请求,从而识别它们。这就是Google Assistant现在的工作方式,这就是我们现在使用的方法。接下来,我们设置一个大型语料库,在其上训练解析器,然后将解析器应用于用户请求,从而识别它们。这就是Google Assistant现在的工作方式,这就是我们现在使用的方法。



这听起来很原始,现在在文献和新闻中经常泄露有关神经网络如何在巨大的语料库上自行学习,它们回答一切并支持对话的信息。当然,这是对的,而且很酷,但是这种方法在您不仅需要系统进行应答而且还需要更改其状态(至少通过设置警报)的情况下无用。都一样,需要内部表示,必须以某种方式将用户所说的内容带到内部。即使我们有大量文本要求用户设置警报,而不会对其进行标记,那么我们也将无法训练解析器以使其更改系统。我们将能够训练他,以便他说“是的,我正在设置闹钟”而什么也没做。但是要训练系统,使其使用未标记的数据来更改其状态,尚不可能。因此,OpenAI和DeepMind-Google母公司Alphabet的一部分-最近发布的内容很酷,它们是可以响应人类的良好聊天机器人技术,但是没有排除手动劳动来更改系统状态的技术。因此,不幸的是,从这个意义上说,该行业现在的标准很低-不仅对于Google Assistant,而且对于所有助手的工作方式大致相同,并且需要大量人工工作-处理解析器的数据或编写规则(我们不希望这样做)。我们尝试在合作伙伴公司的帮助下进行手动工作。排除体力劳动改变系统状态,不。因此,不幸的是,从这个意义上讲,该行业现在的标准很低-不仅对于Google Assistant,而且对于所有助手的工作方式大致相同,并且需要大量人工工作-处理解析器的数据或编写规则(我们不希望这样做)。我们尝试在合作伙伴公司的帮助下进行手动工作。排除体力劳动改变系统状态,不。因此,不幸的是,从这个意义上讲,该行业现在的标准很低-不仅对于Google Assistant,而且对于所有助手都以大致相同的方式进行工作,并且需要大量的人工工作-处理解析器的数据或编写规则(我们不想这样做)。我们尝试在合作伙伴公司的帮助下进行手动工作。我们尝试在合作伙伴公司的帮助下进行手动工作。我们尝试在合作伙伴公司的帮助下进行手动工作。



告诉我们有关Google Assistant开发的有希望的方向。



实际上,我们刚才讨论过的。指导-提出一个新的培训系统,该系统可以从数据中更改系统状态,而无需手动数据处理。那肯定很棒。但是到目前为止,尽管我已经有很多与助手一起工作的经验,但我什至很难想象这样的系统在原理上将如何工作。我了解神经网络,教学方法,混合方法如何变得越来越复杂,用于训练的数据准备如何变得越来越复杂-但我不了解如何在没有老师和改变系统的情况下直接建立数据之间的联系。必须有某种内部表示形式可以允许这样做。如果有人可以革新并重新发明这部分,那将是很棒的。



另外,现在在内部表示的生成上投入了大量资金-也就是说,如果我们不能直接从没有标记的数据转到更改系统状态,则我们需要制定一种算法,以帮助在两者之间做些事情。假设从文本生成系统视图,然后人们会对其进行清理-而不是从头开始构建它。这是一个非常有前途的方向,尽管没有什么进展,但研究人员正在寻找确切的方向。



加号-答案和助手对话流畅性的新信号。以及评估方法。现在,我们(也就是说,在整个行业中)没有一种评估对话系统质量的适当方法,也没有一种可以比较Assistant,Alice,Alex,Siri等的度量标准。您可以轮询用户,尝试使用不同的助手解决相似的情况并从中得出结论,但是没有合适的量化指标。对于机器翻译,有一个度量标准,或多或少是正常的,但为此-没有任何内容;这是业界在会议上正在讨论的问题之一。英语会话语料库终于开始了。也很少。没有什么可以衡量指标,没有人可以衡量。如果有人有一个好主意,然后此人将在会议上收集所有桂冠,创建一家初创公司并将其出售到任何地方。我本来会撕碎任何能够在数量上定量地帮助衡量助手之间差异的项目。



另外,还有一项混合研究,这是我目前最多的研究-去年,我从俄语转到了该主题。我正在做一些有关如何使助手更对话,更自然的项目。我们看着人们互相交谈。这里使用的不仅仅是单词(“设置/设置闹钟”);实际上,尽管仍有许多例程需要完成,但这部分是原始的,并且已经解决。未解决的任务是,例如,当用户以各种形式说:“为我设置警报”,“可以设置警报吗?”,“可以设置警报吗?”大致相同,但是在一种情况下使用命令,在其他情况下使用问题。我们正在研究语言学的这一层次-语用学,即超越意义的-语义学。对于那些学习语言学或语言的人,文本中的语义标记不是一个新术语,但语用为它添加了更多上下文。也就是说,不仅是“他们说什么”,而且还包括“他们怎么说”,“他们为什么说”。粗略地说,如果用户对助手说“你是愚蠢的吗?”,他不希望回答“是/否”-这是另一个信号,因此您必须先询问系统行为出了什么问题。这不应归为问题,而应归为投诉。



我所在的小组-我搬到另一个部门后现在只剩下三位语言学家-现在正试图了解人们之间的互动方式,人们与助手的互动方式以及如何将其转化为机器学习的信号,并真正训练系统以更好地理解事物非言语和间接传播。



问题陈述中与该问题相关的重试和存根的数量如何?



这是一个很好的指标,但是不幸的是,它仅考虑了助手不理解用户的短语数量。它并没有告诉我们这些短语有多难,用户体验如何。播出后稍后再给我写信,每个有比较助手想法的人都可以单独讨论-但是那里需要做一些非常复杂的事情。通过单独的部分,我们已经学会了理解某些内容-例如,将语音翻译成文本,在文本本身上,或者在更改时的其他地方,理解了某些内容-例如,用户请求的系统百分比是多少,或者从N时刻开始才理解,并且哪里有错误。系统。但是,评估系统的响应能力已经更加困难:实际上,什么是“充分响应”?还有各种各样的“蛋糕上的樱桃”,例如用户将系统称呼为“您”的情况她回答“你”-是好是坏?看来不好,助手是下属。



通常,有很多小芯片很难在定量测量中考虑。



是否有中间通用语言用于简化处理,然后切换到所需的语言?



这是一个很好的问题,但不是我,而是多年来一直试图做到这一点的ABBYY代表。也就是说,在语言学中,所有的语言都是以类似的方式构建的,您可以创建通用的语法,字典以及其他所有内容,以获取所有语言之间的中间链接。然后可以将一种语言翻译成一种元语言,然后再翻译成任何其他语言。尽管花了很多人年的时间来完成这项任务,但事实证明-尽管想法很美-语言仍然存在很大差异,并且几乎不可能进行这样的映射。目前尚不清楚如何自动执行此操作-并非手动操作。结果,该话题消失了。



事实证明,如果您输入大量数据并运行神经网络,则机器翻译的质量就足够了,而且没有元语言。神经网络擅长计算包括语法在内的各种模式,因此,如果数据量足够,则它们本身可以应付而无需中间链接的提示。在机器翻译中,如果有良好的平行文本,一切都会很好。例如,俄语和英语之间有很多平行文本,但俄语和某些美洲印第安人语言之间根本没有平行文本-但是英语和英语之间有很多平行文本,也就是说,英语可以扮演中间语言的角色。通常先将俄语翻译成英语,然后翻译成第三种语言;这种技术很常见这样一来,英语实际上就替代了相同的元语言-毕竟,翻译最多的数据是英语。质量当然会受到影响,但总比没有好。如果没有什么可以教该系统的知识,那么最好教这种分步翻译而不是什么都不做。

通常,从理论上讲,这个想法很漂亮,但实际上使用英语。



您能举例说明您在Google工作的问题吗?有趣和例行任务的百分比是多少?



当我启动俄语助手时,有很多例行任务-仅仅是因为算法是通用的,并且大部分工作都减少到手动修复错误和准备俄语语言数据上。我们检查了质量,有时我们手工写了数据。听起来很难过,但我们无法使用用户数据,因此不得不从某个地方获取数据。为了获取数据,您还可以编写规则并生成数据。或打开数据。有趣的是,可以处理形态学,从而看到文本的生成和理解更加巧妙,并且不必在列中写出所有形式的“闹钟”。不幸的是,有很多“再次运行,查看质量修复,运行正确的数据等等”的循环。刚开始很有趣,但很快就成为常规。现在,因为我更多地从事研究,所以从某种意义上说,我们制定了自己的议程。我只是在创建新的数据,这些数据将来对度量标准很有用,并研究人们之间如何与他人以及与助手交谈,以了解可以使用哪些信号来训练模型。我们分析质量。我当前正在做的部分工作是产品,我们正在尝试创建一个人与助手之间对话交互问题的路线图,以了解如何对其进行分类,以了解我们现在可以解决的问题,以及以后的解决方案。也就是说,现在我几乎没有例行任务了,我对自己的设置感到满意。将来对于度量标准,研究人们如何与他人以及与助手交谈以了解哪些信号可以用于训练模型很有用。我们分析质量。我目前正在做的部分工作是产品,我们试图在人与助手之间的对话交互中创建问题的路线图,以了解如何对其进行分类,以了解我们现在可以解决的问题,以及以后的解决方案。也就是说,现在我几乎没有例行任务了,我对自己的设置感到满意。将来对于度量标准,研究人们如何与他人以及与助手交谈以了解哪些信号可用于训练模型很有用。我们分析质量。我当前正在做的部分工作是产品,我们正在尝试创建一个人与助手之间对话交互问题的路线图,以了解如何对其进行分类,以了解我们现在可以解决的问题,以及以后的解决方案。也就是说,现在我几乎没有例行任务了,我对自己的设置感到满意。我们正在尝试在人与助手之间的对话交互中创建问题的路线图,以了解如何对其进行分类,了解我们现在可以解决的内容,以及以后的解决方法。也就是说,现在我几乎没有例行任务了,我对自己的设置感到满意。我们正在尝试在人与助手之间的对话交互中创建问题的路线图,以了解如何对其进行分类,了解我们现在可以解决的内容,以及以后的解决方法。也就是说,现在我几乎没有例行任务了,我对自己的设置感到满意。

对于不同的语言学家来说,这种平衡看起来是不同的。我们最近有一个周年纪念日-公司中有100名语言学家,现在还有更多。这很酷,因为4年前我加入公司时,我们只有30个人,我们的需求肯定在增长。



您是否使用上下文定义来分析文本?



我不知道问题的作者是否还在寻找-请重新制定,我不理解。

当然,我们使用上下文。没有它,就没有对话互动。当然,我们正在尝试解决问题,例如,用户不会每次都说“闹钟”,而是可以使用自然代词(“将闹钟设置为7,不,将其更改为8”)。这对于英语已经很好用;我不记得它是否已经针对俄罗斯推出。



为什么没有启动俄语专栏?



据我所知,谷歌有很多不同的语言。应该根据市场的数量和价值来安排优先级,俄罗斯市场并不是最有趣的。令人兴奋的是,俄罗斯有Yandex,您可以与它竞争,但是从实际的角度来看,没人愿意。另外,在通过有关个人数据的法律后,Google已关闭了在俄罗斯的开发机构。



是否有用于语音识别和生成的开放库,以及用于训练神经网络的数据数组?这项技术的开放程度如何?



是的,充满了开源算法。Google最近发布了Bert,这是一个超新的库;现在,会议上都充斥着各种更新,这些更新被称为各种有趣的词,其中包含“伯特”(阿尔伯特)。这都是开源的,由我们在柏林的杰出科学家制作。你可以训练任何东西;科学界拥有训练神经网络并观察会发生什么的数据。就像我说的那样,这些数据对于俄语来说还不够,对于英语来说还远远不够,所以每个人都对他很开心。



也就是说,您没有用户日志文本?



我们无法读取用户日志。唯一的例外是在用户抱怨并且特别要求他们共享最后这么多语句的情况下。但是即使在这种情况下,我们也只能从经过特殊训练的支持和汇总统计数据中看到问题的重述,例如“助手回答他不理解的次数和百分比如此”。 Google非常小心地处理用户数据。我的团队正在做的部分工作是考虑如何生成现实的数据或从有特殊待遇的人那里收集数据。对于所有工业团队来说,这是一个重要的方向,因为绝对不能侵犯隐私。我们必须寻找新的数据收集方法,编写新工具;在过去的六个月中,我一直在非常仔细地进行此操作。不幸的是,细节尚未公布。我们想为这次会议写一篇文章,但这种流行病阻碍了这种情况。当您在公司工作时,原则上只需要一篇文章即可参加会议,而这会以公司为代价而闲逛。现在所有会议都已在线上,您将无法进行聚会-写文章的动机真的消失了。现在该流行病将结束,无论如何我们将继续这样做。现在该流行病将结束,我们将采取行动。现在该流行病将结束,无论如何我们将继续这样做。



, , ?



我不会向您显示任何测试项目,但是我可以告诉您有关面试的信息。就像我说的那样,我们现在有100名语言学家,并且访谈以工程师已知的格式进行-池中的访谈。我们会连续采访语言学家,如果有优秀的语言学家,我们会寻找空缺并将其分配给团队。我们的语言学家各不相同;有人编程,实际上有人不编程。我来自第二类:我更多地处于研究阶段,我自己不训练模型-团队中有一些人在做这个。现在我们有8个不同规模的语言专家团队,并且我们还有一个内部化团队,我是俄语专家:这些人负责监视助手的质量(现在我只是一名语言学家,我从事的工作与特定语言无关) ...根据他们的个人资料,语言学家属于这些团队之一。



如果任务是针对特定语言的,则需要使用特定语言的发言人;他们会收到使用这种语言的特殊任务-我们正在尝试确定该人是否很好地理解了功能。例如,如果我们正在招聘使用俄语的职位(虽然现在不存在),我们会问俄语为什么比英语更复杂,存在哪些克服这些困难的方法,俄语形态如何工作,计算机需要什么才能理解这一点,它如何影响通过数据量。如果作用是一般性的,那么我们将询问一个人对语言学当前现状的理解程度,他对算法的思考程度。尽管我几乎没有自己编程,但我很了解机器学习的工作原理,训练系统所需的知识,信号,有监督/无监督学习等等。其实这就是我通常在面试中问。最常见的例子是:“您如何解决错别字?有无数的资金和开发人员,但是还没有产品-从语言的角度来看如何构建它,有哪些步骤?”通常,人们可以询问任何包含自然语言的成分。据受访者说,它是如何建造的?一个人如何建立一个相似的人,他看到什么问题?如何将经验从英语翻译成中文,从汉语译成俄语,从俄语译成印地语?他将如何使用他不懂的语言来组织工作?有很多选择。步骤是什么?”通常,可以询问任何包含自然语言的成分。据受访者说,它是如何建造的?一个人如何建立一个类似的人,他看到什么问题?如何将经验从英语翻译成中文,从汉语译成俄语,从俄语译成印地语?他将如何使用他不懂的语言来组织工作?有很多选择。步骤是什么?”通常,人们可以询问任何包含自然语言的成分。据受访者说,它是如何建造的?一个人如何建立一个类似的人,他看到什么问题?如何从英语到中文,从中文到俄语,从俄语到印地语传递经验?他将如何使用他不懂的语言来组织工作?有很多选择。



您是否监视用户行为:用户发出了什么命令,设备采取了什么动作?



我们无法监控用户行为。我们只能提出模拟它并测试系统如何响应的方法。这就是我们实际上正在做的:尝试弄清楚如何测量它,并尝试收集数据来训练算法。



如何跟踪对话的上下文?为此使用了多少内存?会话之间是否存在持久性?



是否有大量的内存使用-我不知道细节,甚至我工作的部门也没有。我们的部门更加关注质量,但是有些部门会监视是否有足够的内存,是否有泄漏,助手是否愚蠢地跌倒了10分钟以设置警报。



我们跟踪上下文。到目前为止,很遗憾,只能在一个会话中进行。这是我们部门-我的团队和邻近的工程团队-明年要解决的任务之一。一个非常酷而有趣的任务:保留上下文多长时间,在什么时候认为对话结束,是否始终保留用户的上下文,系统将在用户自身中存储哪些有关用户的信息。相对而言,如果用户说“我讨厌披萨”,那么最好永远保持这种环境,并每年询问一次情况是否有所变化。并且,如果用户回答他没有更改,则不要提供披萨递送。虽然助手不知道该怎么做-不幸的是,他们还远远不够完美,但他们需要更多不同的环境。



现在,我们可以在一个会话中理解代词(“设置闹钟,将其设置为上午8点”)。我们致力于扩展此上下文,并分别进行研究以了解什么上下文有用,需要多少,在什么地方存储多少。当然,Google有很多服务器,因此我们不需要省钱,但是我们希望助手不要在3个小时内处理每个请求。现在速度很快,但还不完美。如果我们使其完美,我们希望它能够继续快速运作。



你们之间有比赛吗?



是的,没有。当然,根据Google内部的工作安排,您可以进行单独的广播。我们有很多地方倡议;人们可以尝试制作任何东西的原型,并建议给老板-老板总是很开放,他们会向高级老板求婚。有人尝试做某事,他成功了,因此产生了很多项目,因此决定以适合发布的质量来做。当然,在某些情况下,人们会同时在5个地方产生相同的想法,并获得10个原型。此时,有时您必须选择其中一个原型,但是通常他们会尝试将人们团结成一个团队,以便他们可以一起开发新功能并将其发布到生产中,每个人都很高兴。



因此,存在竞争,但是我们试图保持竞争的健康,从而避免过多的政治活动。总体而言,气氛很好。我们现在正处于研究和生产之间,带来想法,我们与产品经理,项目,以及每个人都处于震中—每个人都得到协调和合作。混乱,但一切都是精神的。



更快发生的事情-他们会成为一个智能的语音助手,使他的理解能力不比一个人差吗,还是Elon Musk发明了神经接口?



我对神经接口的阶段一无所知。但是,一个既能理解又能与人相处的聪明语音助手仍然很遥远。到目前为止,还没有人知道如何使助手理解。强大的神经网络上的所有聊天都是模仿。我看到了一个关于Turing测试的问题-这也是一次模仿测试,测试系统假装自己是一个人并假装自己理解的程度,但毕竟,没有系统能理解任何东西。有一个聊天机器人Eugene Goostman赢得了其中一项测试-通过了一定比例的必须被欺骗的法官。他假装是一个来自敖德萨的15岁男孩,与他的父亲,妇科医生和豚鼠在一起(不是在开玩笑-他在谈论自己)。该漫游器稍微保留了上下文,并问:“您来自哪里?” -并从答案中记住了这座城市,然后过一会儿使用记忆,引起哇的效果。尽管现在用语音助手创建哇音效果并不困难;他们并不完美。此外,由于比赛是用英语进行的,因此该机器人语音中的不合规定归因于他来自“敖德萨”的事实-他们相信一个外国男孩。



问题是什么叫“理解”,什么是“像人类一样好理解”,以及我们从聊天机器人中基本想要什么。也没人知道这个问题的答案。我们是要他像最好的朋友一样与我们聊天,还是要他稳定地控制智能家居和汽车并设置警报?他能做什么?他可以称呼我们并嘲弄我们吗?不是我们最好的朋友都称呼名字和嘲笑,而是有特殊的方式与亲人交流。也许我们不希望该系统与我们很好地交谈并开玩笑吗?






之前发生了什么



  1. Facebook高级软件工程师Ilona Papava-如何获得实习机会,如何获得报价以及有关在公司工作的所有信息
  2. Bodex Yangel,Yandex ML工程师-如果您是数据科学家,如何不加入愚蠢的专家队伍
  3. , EO LastBackend — , 15 .
  4. , Vue.js core team member, GoogleDevExpret — GitLab, Vue Staff-engineer.
  5. , DeviceLock — .
  6. , RUVDS — . 1. 2.
  7. , - . — .
  8. , Senior Digital Analyst McKinsey Digital Labs — Google, .
  9. «» , Duke Nukem 3D, SiN, Blood — , .
  10. , - 12- — ,
  11. , GameAcademy — .
  12. , PHP- Badoo — Highload PHP Badoo.
  13. , CTO Delivery Club — 50 43 ,
  14. , Doom, Quake Wolfenstein 3D — , DOOM
  15. , Flipper Zero —









All Articles