网盛创新研究院 - AI、区块链、云计算、大数据技术的研究与应用交流平台!

网盛创新研究院/应用/正文

谷歌I/O大会:让AI更具人文关怀

作者:来源:猎云网

2019-05-08

在过去,谷歌的任务是组织好来自世界各地的信息,用户只需点击几下就能知道大白鲨的大小或白俄罗斯的首都。如今,谷歌有了更大的野心。这一点在今年的谷歌I/O大会上表现的很明显,作为公司的年度开发者大会,谷歌高管们展示了他们对公司未来的愿景——其服务无处不在,为所有人服务,为所有事情服务。

为了做到这一愿景,谷歌正在从事各种大大小小的开发。它试图让Google Assistant更加无缝地融入你的生活——例如,你可以简单地说“停止”来关闭手机闹钟,或者不必在每个请求之间说“嘿,谷歌”。它正在帮助自动化一些在线生活中的无聊任务,比如用Google Duplex填写网络表格。它也在深入研究将数字世界和物理世界融合在一起的任务。想了解那条大白鲨的大小吗?在谷歌上搜索一下,然后增强现实可以让鲨鱼在你眼前出现。

所有这些都来自于首席执行官Sundar Pichai和其他谷歌高管的主题演讲。

Pixel 3A和3A Plus

谷歌I/O大会全纪录:让AI更具人文关怀

多年来,智能手机的价格一直在稳步攀升,甚至到了我们需要花费1000美元买一部新手机的地步。然而,这一趋势将不再出现,谷歌最新的Pixel设备——Pixel 3A和3A Plus,只需半价,就可以获得所有高级功能。只需花费400美元,你就可以获得Pixel的一些最好的功能,比如相机中的夜视、自适应电池、谷歌地图内置的增强现实,甚至还有耳机插孔!你不会发现像无线充电或1440p显示屏这样华而不实的东西。但是,尽管你节省了很多钱,我们仍然认为你不会注意到它们的区别。这两款手机都将于5月8日上市销售。

Android Q

由于推出了最新版本的Android,无论你选择全新的Pixel 3A还是坚持使用你的旧Android手机,都将很快实现更多的功能。这一尚未命名的Android系统有一些很酷的更新,比如智能回复功能,该功能可以在你所有的信息应用中运行;还有一个实时字幕工具,可以在声音未开启的时候翻译视频。谷歌说,这里的关键是这些数据都不会离开你的手机,也就是说,这些技术的重点是设备上的机器学习。你可以更容易地监控应用权限,谷歌会提示你查看哪些应用可以访问你的位置等数据。对于家庭来说,新的家长控制功能可以更好地监控孩子的屏幕时间,而新的聚焦模式可以让你在努力提高工作效率的时候,屏蔽邮件和新闻等分散注意力的应用。

Android Q还为我们展示了谷歌对移动技术未来的一瞥:它旨在支持可折叠手机、5G连接和黑暗模式。目前,测试版已经向21种以上的Android设备推出,完整版本将在今年晚些时候推出。

Google Assistant

谷歌表示,Google Assistant现在可以十倍的速度,更快地提供答案和回应请求。在今天的演示中,谷歌展示了如何在任务之间、在应用之间流畅地切换,且无需在请求之间说“嘿,谷歌”。Assistant还可以更好地理解请求一个动作(比如“给Jessica发送电子邮件”的命令)和口述消息本身之间的区别。全新版本的Assistant将于今年晚些时候配置到Pixel手机中。

当然,谷歌还在演示中展示了其他几个手机功能:当你说“妈妈家的天气怎么样”或“给我看我儿子的照片”时,Personal References能让Google Assistant更好地理解你的意思。当你在驾驶汽车时,驾驶模式会弹出一个个性化的仪表盘。只需说“嘿,谷歌,让我们开车吧”,它就会用语音控制来显示你开车时最可能需要的东西——比如最喜欢的播客和导航等——你无需手动来控制一切。这项功能将于今年夏天与Google Assistant一起向Android手机推出。

更强大的Duplex

还记得Duplex吗?它是谷歌推出的一个怪异的拟人化机器人,可以通过电话为你预订餐厅和安排约会。现在,它也能在网页上帮助你。假设你要去旧金山旅行,需要租车。打开租车网站,Duplex会自动填写所有必填字段,比如旅行日期、到达时间等,你无需亲自动手输入任何信息。在预订前,你可以仔细检查一切是否正常。

Live Relay

去年,谷歌面向全世界4.66亿耳聋或重听的人,推出了一套名为Live Transcribe和Sound Amplifier的无障碍应用。这些应用利用谷歌的语音到文本技术,智能实时地转录对话。

现在,谷歌又有了一些新把戏。一个叫做Live Relay的辅助聊天功能让人们可以选择“键入”而不是通过电话交谈。Pichai表示,这项功能可以让那些言语难以理解的人——中风患者、耳聋患者或ALS患者——更容易打电话。为此,谷歌还在构建一个更大的语音数据集来训练其技术,以便Google Assistant和其他语音界面能够更好地理解那些具有非典型言语模式的人。

Nest Hub Max

谷歌的新智能显示器Nest Hub Max就像是智能家居的指挥中心。它可以控制你的Nest Thermostat或智能灯。它有一个摄像头,所以你可以用它在YouTube上观看烹饪教程;它还有一个麦克风,所以你可以对着Google Assistant喊来关掉定时器。相机和麦克风也支持视频聊天。像谷歌的其他家用设备一样,这款设备支持多个用户。语音匹配功能可以通过每个人的声音来进行识别,而新的面部匹配功能则通过摄像头来进行区分。这款设备将于今年夏天发售,售价为229美元。

无障碍功能

人文关怀成为了这一次Google I/O开场演讲的重点之一,其中,多款无障碍功能的发布也成为收获掌声最多的一个环节。前不久,谷歌发布了一款应用 Live Transcribe,运用语音识别技术将实时对话转录称屏幕上可阅读的文本,目前已经支持超过 70 中语言和方言。发布会上,谷歌发布了Live Caption,这是一款视频和音频被实时转录成文字的工具,它能够覆盖在用户使用的任何应用上,比如 YouTube、Instagram,或者视频聊天应用上。它能够分析源音频,即便在音量调成静音的情况下,Live Caption也能够正常工作。

Live Relay通过语音识别和文本语音转换来帮助聋哑人进行电话交谈。Live Relay利用了Smart Compose和Smart Reply功能,预测性回复建议和及时反映能够帮助打字者跟上语音通话的速度。

Project Euphonia是AI for Social Good项目的一部分,团队与非盈利组织 ALS TDL 和 ALSRI 一起记录肌萎缩侧索硬化患者的声音。Google Assistant是为大多数语言功能正常者提供的服务,并不适用于有语言障碍的少数群体。为了解决这个问题,谷歌在全世界各地收集语言障碍者的声音样本,弥补有限的训练数据所造成的人工智能偏差问题,谷歌希望通过收集这些数据来改进算法,最终整合到Google Assistant中。

关于隐私的说明

像硅谷其他公司一样,谷歌对隐私问题越来越重视。至少,它希望你这么想。今天的演示不止提到了谷歌对隐私的承诺和一些让你可以更好控制的功能。你现在可以在谷歌地图中启用匿名模式,这样你所搜索和导航的地方就不会链接到你的帐户;很快,你也可以在YouTube上做同样的事情。你的所有隐私和安全设置都已被移动到谷歌帐户中一个更容易访问的位置,最相关的控件会将最先出现。此外,你也可以选择在多少月之后自动删除你的数据。


标签:
【版权提示】网盛创新研究院网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至wzy@netsun.com,我们将及时沟通与处理。
关于我们创新研究院大讲堂服务介绍
© 生意宝(002095) 版权所有  浙公网安备 33010002000015号 工商执照 浙ICP证  网络工商