您的位置::科雷娱乐网 >> 山下祐树

苹果最终想法希望Siri完全体更加真实更像人类陈占美

时间:2022年06月26日

苹果最终想法:希望Siri完全体,更加真实&“更像人类”

苹果最终想法:希望Siri完全体,更加真实&“更像人类”...

Siri或许将会在苹果的未来中扮演非常重要的角色,但在那之前它还得达到一个基本要求,那就是成为一个更合格的语音助手。要达成这一点,它首先得让人们觉得它真的像个人类。那么一切的关键,就在Siri的语音上。如何让Siri的声音听起来更真实,苹果是这样做的。

更真实的Siri

很快iOS 11的正式版就将来到每一位iOS用户的手中,新系统带来了大量的新变化,足够人们试玩上很久。即使你已经很长一段时间没碰Siri了,到时候也推荐再去试一试。如果你还记得它原来的声音,那么就可能会发现现在的不同。

很难精确地描述iOS 11的Siri和过去相比多了哪些东西,你可能就是感觉它听起来好像更加真实了。在说话的时候,Siri会在句子间加入更多的停顿,更多的长音,更轻快的语调变化。总的来说,它将会比过去更流畅,更像“人”。苹果认为,这样的Siri你会更喜欢听它说话,也就更愿意和它说话。

事实上,苹果对Siri语音真实度的执着可能会超出你的想象,因为它在Siri语音组主管阿莱克斯·阿赛洛(Alex Acero)的主导下,已经进行了长达数年的研究和优化了。直到iOS 11到来,他才终于拿出了满意的成品。“它很自然!一点都不像机器人!”阿赛洛兴奋地评价新Siri说。

当然了,现在距离苹果理想中的“爱上你的虚拟助手”还远得很,但阿赛洛和他的团队认为现在已经前进一大步了。这些研究者坚信,只要Siri说话能够更自然流畅,那人们也就会更加信任它,最终接受它。

开始成长

尽管现在Siri表现出了相当的潜力,但谁都不会忘记它在过去的几年里存在感有多低。很多人觉得它已经远远落后于竞争对手。相比之下,亚马逊的Alexa有更多开发者支持,而谷歌的Assistant则“知识面”广得多。

对此苹果倒也是满腹委屈的,它表示Siri过去的控制权不完全在自己手上,后端技术是由其他合作伙伴提供的。苹果的产品营销高级副总裁格雷格·乔思维亚克则很露骨地说:“这就好像是在赛跑的时候,你知道吗,有人在拖我们的后腿。”

这个“拖后腿的人”到底是谁,所有的证据都指向Nuance公司,虽说双方从来都没承认过存在合作关系。但不管背锅的人是谁,总之苹果对Siri确实有“很大的计划”,而且对它的控制力也比以前更强了,这是乔思维亚克承认的。

接手Siri并全权控制它的就是阿莱克斯·阿赛洛带领的团队,这使得它不再依赖过去的算法,而是接纳了更先进的AI技术和深度学习理念。Siri要做到的不再仅仅是识别准确(苹果官方的数据称其语音识别准确度可以达到95%),它还需要能够在各种声音中无误地识别出用户的声音来,这也才能够在个性化这方面更进一步。

在这方面Siri凭借新的机器学习机制就可以逐渐做到这一点,它获取的数据越多,其建立的模型就会变得更好,更智能,甚至可以识别很重的口音。这一点非常重要,因为有研究者最近发现Siri是能够听到人耳听不见的超高频声音的,这就造成了潜在的安全威胁。苹果重视隐私,那就必须要在“区分”上下功夫。

学会说话

Siri学会一门新语言的过程很有意思。团队首先会在当地寻找堪称标准的人,然后让他读书、读报纸、读网页,还有各种各样的东西。然后苹果将这些声音和文字一一对齐,更重要的是识别每一个音。Siri对这些音素的判断,是最有趣的地方。

在那些已经录制好的音频中,Siri团队试图找到每一个音所有的说法,比如连读、轻读、重音、长音、升调、降调等等。我们都知道,同一个音表达肯定和表达疑问的时候都可能会有不一样的变化,而这些变化都会有不同的声纹,要让苹果的算法分析之后放进它认为最合适的地方。如果我们把每个音看作一个个点,那么句子就是连成的线。你可能过去会认为Siri读的每一句都是预先录好的内容,其实并非如此。

不同意思的不同句子中相同的词语,如果要表达的东西差别很大,那么这词语中的一切音素都很可能不是来自同一段录音的。

值得一提的是,Siri在这方面表现得之所以一直不太理想,处理性能也是一个很重要的因素。几年前的机能水平不足以让系统以很高的频率在一个庞大的数据库中寻找最完美的组合。如今这已经不是问题了,所以阿赛洛开始希望自己能拥有的数据量越庞大越好。所以苹果在iOS中推出了听写功能,让人们能够将自己的录制片段上传上去,从而大幅增加数据量。在这样的反复优化和升级中,Siri对语言的掌握就逐渐被建立起来了。

Siri完全体

苹果眼中最理想的“Siri生活”是什么样的呢?当然是它要尽可能包揽一个人日常生活里的方方面面了。在一则广告里,主角巨石强森用Siri检查了提醒事项,叫来了车,查看了天气,以及各种各样的事情。

有一点非常值得注意,那就是像乔思维亚克这样的人其实很不喜欢人们去“调戏”Siri。“我们做这个东西不是用来玩问答游戏的!”他说。尽管不少人现在觉得这才是Siri的乐趣所在,但苹果一直很注意不将它打造成一个真正的聊天机器人,而是专注在自动化上。

你不能用Siri来做任何事,而苹果也不打算这么做。苹果在设备的功能实现上一向十分功利,这在Siri的定位上也有体现。它能够帮助你完成各种操作和服务,除此之外的就不擅长了。苹果不以为意,因为它就是要这个。

当Siri变得更好用之后,怎样才能让早就不抱期望了的用户重新关注起它来呢?苹果的意思是让时间来解决问题。“人人都有自己做事的习惯。如果他们习惯了打字,一下子去改变,那得要时间。”阿赛洛说。当然不只是等,它还会试图引导人们到“正确”的方向上来。很可能,Siri将会变得更加主动。

至于很多人都要求的让Siri更开放的问题,因为开发者能让Siri的功能迅速激增。然而尽管苹果在其他领域是这么做的,但在Siri这边却并非如此。乔思维亚克认为,关键不在Siri能做多少事。它认为无论是Alexa还是Assistant,要给它们下指令,用的语句都太模板化了。开放给第三方之后,这个问题会更加严重。

那么解决之道在何处呢?最终苹果心中的答案还是落在了“更像人类”上。当Siri的声音变得更加真实可信时,一切问题都会迎刃而解。

宁波哪家阳痿早泄医院正规

郑州西医治疗皮肤病

溃疡性结肠炎怎么治疗

合肥做输卵管造影医院怎么样

金华做人流手术哪家医院安全

郑州治疗白癜风医院哪家好

友情链接
男士脱毛的最好方式 慢拉伸应力腐蚀试验机 巴中男科医院哪家好 养血生发胶囊产后脱发可以吃吗 经常心慌心悸头晕恶心怎么回事 腱鞘炎 广州学生床垫订购 液压万能材料试验机WAW-600C 爱依瑞斯沙发 穗宝护脊床垫 高温网带 万能试验机 工程服订做 早泄药物饭前吃还是饭后吃 赤鹿西地那非每次吃多少 同仁堂坤宝丸是治什么的 老人手指关节肿大可以吃尪痹胶囊吗 脑梗死冠心病吃中药可以吗 心律不齐和心律失常有什么区别 宝宝上火有哪些症状 宝宝有痰咳不出来怎么办 小儿氨酚黄那敏颗粒抗流感吗 神经衰弱烦躁易怒怎么解决好 虚火会导致口腔溃疡反复吗 得百宁可以缓解带状疱疹疼痛吗 一岁多孩子拉肚子怎么办 两周的孩子不爱吃饭怎么回事 受寒导致关节疼痛用药酒治疗效果怎么样 用完亮甲可以涂达克宁吗 上海口腔门诊 早期肝硬化怎么治疗 药品库 跑步机专卖 知名离婚律师事务所 上海离婚财产律师热线 流感症状 脑梗后遗症舌头麻木怎么办 锦星服装定制 新冠阳了发烧怎么降温 经常做脚底按摩的人会传染灰指甲吗 治灰指甲达克宁好用还是亮甲好用 灰指甲轻度感染怎么处理 找医院 东阿阿胶阿胶块 山东济南治疗皮肤病专科医院哪家好 深圳市离婚律师服务 双鸭山肿瘤专科医院哪家好 好的离婚律师 湖州癫痫病医院哪家好 曲靖肿瘤专科医院 江苏南京白癜风 双螺线网带价格 婚姻家庭 Plastic Machinery 爱修维修 石家庄工作服定制厂家 Testing Machine Bathroom Fittings Accessories 寻医问药 成都牛皮癣哪家医院治疗好 无锡人流哪家医院治疗好 云南不孕不育哪家医院治疗好 成都治疗通风医院哪家好 风和网 Manufacturers 孩子肚子胀气怎么回事 小儿柴桂退热颗粒的成分与功效 小儿肺热咳喘口服液的成分有哪些