首页 今日头条 正文

Google公布一览視覺“高科技”:检索3D化,编码仅100KB,不用高档设施只能运作-万博娱乐_万博体育官网登陆_万博体育ios版

美国时刻 5 月 7 日,谷歌 2019 年 I/O 开发者大会在山景城总部开幕,为期三天。

在开幕式上,谷歌宣告了许多亮点,比方更靠近用户的查找功用,更强壮的 AI 与语音辅佐,内置在安卓体系中的语音转文字功用,新款 Pixel 3a 和 3a XL 中端手机,Nest Hub Max 智能家居设备,还有安卓 Q 体系更新等等。

“To Be Helpful”是整场大会的主题之一。因而,不管是产品演示,仍是讲演者,简直全都从安全、隐私和有用的理念动身,透露出与往届 I/O 大会不同的务实风格。

图 | 谷歌AI领武士 Jeff Dean: 为每一个人打造一个更有协助的谷歌

即使是终究上台的谷歌 AI 领武士 Jeff Dean,也是以现有研讨效果动身,着重了 BERT 模型在自然言语处理范畴获得的建树,以及 AI 技能在健康和环境范畴的运用潜力,并未带来令人眼前一亮的冷艳机器学习新效果。

不过从另一个视点来看,这或许才是科技本身应有的姿态:一项高科技,不管初见有多冷艳,终究只需成为像空气一般的存在,让咱们简直发觉不到它,却又依赖于它,才干让咱们开端享用它的价值,然后实在地享用日子。

这也是谷歌 2019 年 I/O 开发者大会带给咱们的启示。

图 | 谷歌I/O大会开场

“黑科技”开场,奠定务实风格

一开场,谷歌就遵从一向风格,直接亮出了人们脍炙人口的“黑科技”。

副总裁 Aparna Chennapragada 首先介绍了谷歌的最新视觉技能:奇妙地整合摄像头和增强实践(AR)技能,强化谷歌查找成果的互动性和有用性。

她在谷歌上查找出的二维图片,能够直接转化成三维模型,并经过摄苍猊吧像头放在实在环境中。

不管你查找的是人体骨骼,一双鞋,仍是一条鲨鱼,都羊哥好声响没问题,只需谷歌制造了 3D 模型,就能够经过摄像头,展现在实践场景中,供用户检查效果。它们不只能够活动,还能够承受扩大、缩小、运动和搬运等操作指令。

能够必定的是,3D 化的查找成果不只仅停留在风趣这一阶段,它能够给用户带来更直观的运用体会和感触,加深对物体运作机制的了解程度。

幻想一下,假如你想知道心脏长什么姿态,除了看到什物,有什么东西能比一个会跳动的、能够扩大缩小和分化的立体模型愈加形象的呢?尤其是它能够随时随地出现在任何地方,AR 技能的jbdxbl价值进一步得到了发掘纸牌屋第一季。

图 | 查找出的大白鲨以 AR 方法出现在讲演台上

除了强化查找成果,谷歌还经过 Google Lens 程序,让手机摄像头变得更有价值。

假如你新到一家饭馆,不知道有什么特色菜,不要紧,只鞭辟入里要拿出手机,翻开 Google Lens 程序,对准菜单,它就能够依据已有点评,标示出大多数人引荐央视一套节目表的特色菜。

假如你去法国旅行,却不会法语,看不constant懂路标,不要紧,只需拿出手机,翻开 Google Lens 程序,对准路标,它就能够辨认上面的法语,直接翻译成中文和英Google发布一览視覺“高科技”:检索3D化,编码仅100KB,不必高级设备只能运作-万博文娱_万博体育官网登陆_万博体育ios版语等新上映的电影十多种言语,还能够直接朗诵出来,让言语不再成为交流和旅行的妨碍。

假如你想看菜谱学做菜,没问题,Google Lens 合作食谱制造商,录制预先制造的烹饪视频,只需将镜头对准菜谱文字,就会有实践演示视频跳出来,为你展现怎么操作。

这些都是十分靠近日常日子的有用功用,假如实践操作效果与演示效果相符,那么将极大地便利咱们的日子。

图 | Google Lens能够翻译多种言语的不同标志

谷歌在现场播映了一段视频,叙述了印度的试点项目。视频中,一名不识字的印度母亲依靠着 Google Lens 程序,总算能够以听的方法了解书上的内容,孩子的作业,路上的标识,饭馆的菜单等等,终究无需他人的协助,独自完结许多使命。

虽然在普通人看来,她完结的都是些琐碎小事,比方去 ATM 取钱和预定火车票,但关于她来说,这就像翻开了日子的另一扇门。

由此可见,谷歌遵从的“To BeGoogle发布一览視覺“高科技”:检索3D化,编码仅100KB,不必高级设备只能运作-万博文娱_万博体育官网登陆_万博体育ios版 Helpful”的理念,意味着技能应该能够实在协助有需求的人进步日子质量。

图| 印度母亲运用Google Lens 协助自己看懂包装盒上的字

谷歌终究着重,这种技能结合了自然言语处理、机器视觉、以及谷歌 20 多年来的查找信息才干完结,但代码只需 100 KB 左右,所以无需高端设备就能够运转。

这项功用将参加 Google Go 运用中。对视觉妨碍者,以及不会外语的人来说,这无疑是获取信息的新方法。现在,Google Go 现已能支撑数十种言语,价格为 35 美元。

不得不说,谷歌挑选用直观的视觉技能作为开场,十分机敏。不只符合主题,突出了有用性,还成功塑造出眼前一亮的感觉,调动了观众的积极性。但是稍显惋惜的是,这些演示或许是整场大会最有亮点的部分了。

更强壮、更懂你的AI语音辅佐

在上一年的 I/O 大会上,谷歌的语音助理技能推出新功用 Google Duplex,让 AI 打电话预定餐厅,因其腔调口气适当传神,接电话的人没发觉,该技能一举成名,但引起了一些争议。

在本年的 I/O 大会上,谷歌也演示了新功用,包含一句话敞开驾驭形式和更先进的 Duplex on the web,也便是“Duplex 能够协助履行网页上的使命”。

例如用户能够呼出语音助理,要求它上网帮你预定一台车,然后语音助理就会进入租车网站,帮你填写名字、住址,乃至是偏好车型等信息,并要求你承认。

图 | 语音辅佐帮你租车

它还运用常识图谱来进行个人引荐。依据用户的运用习气,AI 能更好地了解用户的语音指令,能够经过语音瞬间翻开 App,而且能够运用接连的语音指令,而不需求每次都说出唤醒词。比方 AI 能够追寻一连串语音指令:翻开地图,播映音乐,翻开相册,查找有动物的相片,发送给或人,它能依据一系列语音指令按次序完结相应动作。

谷歌认为此功用具有很大的运用远景,并着重跟着深度学习的开展,把 AI 模型放置到移动装置将是一种范式的转化。他们期望Google发布一览視覺“高科技”:检索3D化,编码仅100KB,不必高级设备只能运作-万博文娱_万博体育官网登陆_万博体育ios版能够把 100GB 的语音辨认模型缩小到 0.5GB,并放在终端设备上,让用户更便利运用。

不过谷歌表明,现在该功用还在完善阶段,估计本年晚些时刻才会发布更多细节,并透权利的游戏第七季露在本年晚些会推出新的 Pixel 手机。

安卓内置语音转文字功用

作为一家以人道化为中心的公司,谷歌这次分外考虑到了听觉或言语妨碍人士,推出了 Live Caption(实时字幕)技能。

图 | 实时字幕技能演示

该技能由循环神经网络支撑,能够把手机中的视频和音频内容实时转化成文字,类似于微信的语音信息转文字。

不过更重要的是,Live Caption 是原生存在于安卓体系中的功用,意味着它能够符合一切的运用,适用于视Google发布一览視覺“高科技”:检索3D化,编码仅100KB,不必高级设备只能运作-万博文娱_万博体育官网登陆_万博体育ios版频谈天、电话、录像,乃至是游戏中,而且运用全程可在设备端进行处理,不需求联网,然后进一步保证用户隐Google发布一览視覺“高科技”:检索3D化,编码仅100KB,不必高级设备只能运作-万博文娱_万博体育官网登陆_万博体育ios版私。

关于普通人来说,假如不想外放语音,一副耳机就能够处理。但关于听觉或言语妨碍人士来说,这项功用能够发挥很大的效果,协助他们更好地与人交流。

在此根底上,谷歌推出了 Project Euphonia,经过机器学习来了解言语妨碍者的对话形式,来完结精准的语音转写。

安卓Q环绕安全和隐私等优化

虽然谷歌有许多渠道,像是 Chrome,但安卓体系依旧是最重要、装机量最大的那一个,现在全球已有超越 25 亿台安卓设备。

谷歌在今日也发布了最新安卓 Q Beta 3 版别,环绕安全和隐私等中心问题进行优化,12 家 OEM 厂商的 21 个手机机种都能够晋级,包含华为、小米、Vivo 等。

除了支撑上述的 Live Caption 功用,安卓 Q Beta 3 还适配可折叠屏幕,游戏运用能够直接在两种形式下无缝流通转化,而且参加了用户期待已久的漆黑主题。

图 | Q Beta 3 适配折叠屏施华蔻

此外,谷歌还推出了其它新功用,比方 Focus Mode 专心形式,能够让用户暂时停止运用一些简单打扰人的运用;Smart Reply 功用,能够猜测和供给智能回复主张,能够经过任何运用快浏览器哪个好速发送回复;以及针对小孩的爸爸妈妈管理机制。

值得一提的是,安卓 Q 现已增加了 5G 网络支撑,为未来 OEM 厂商推出 5G 手机打下了根底。

着重隐私维护,Nest Hub Max 诞生

智能家居一直是各家业者都想争夺的商场,Nest 是谷歌旗下专心智能家居的独立团队,已有家庭安全摄像头和带有显示屏的 Home Hub 等智能家居产品。

图 | 推出新版 Nest Hub Max

谷歌在大会上表明,智能家居有必要十分重视用户的隐私,而且宣告,将 Home Hub 更名为 Nest Hub,一起推出晋级版 Nest Hub Max,装有更大的 10 英寸显示屏,直接与 Facebook Portal 和亚马逊 Echo Show 同等类产品竞赛。

谷歌着重,没有用户答应绝不会发动摄像头,别的拍下或录下的数据只会存在终端Google发布一览視覺“高科技”:检索3D化,编码仅100KB,不必高级设备只能运作-万博文娱_万博体育官网登陆_万博体育ios版上,并运用 FaceMatch 面部辨认用户,支撑手势操作。

屏幕较大的 Nest Hub Max 价格 229 元,现有的 Nest Hub 则降价 20 美元至 129 美元。

推出两款Pixel,进军中端智能手机商场

随后谷歌带来了两款 Pixel 系列手机,Pixel 3a 与 Pixe老公的姐姐l 3a XL,价格分别是 399 美元和 479 美元,前者本日起开售,后者本年暑期上市。这也是谷歌初次推出中端智能手机。

图 | 新款Pixel 3a价格399美元,本日出售

两个机型在外观上仍然连续 Pixel 宗族的特色,无刘海屏幕,后置单摄像头,提高摄影质量主要靠搭载谷歌自研 Pixel Visual Core 图画处理单元,还继续运用后置指纹辨认,保存有 3.5mm 耳机孔,一次充电能够支撑 30 小时,而且配有 Titan M 安全芯片,专门用来维护用户隐私。

至于硬件装备,谷歌大会上并没有给出具体参数,但已有媒体爆出了比较可信的数据,其间 Pixel 3a 搭载高通骁龙 670 处理器,装备 4GB 内存+ 64GB 存储,分辨率为 10802160 ;Pixel 3a XL 搭载高通骁龙 710 处理器,装备 4GB 内存+128GB 存储,分辨率为 22201080。

比较 Pixel 3 的 799 美元价格,两款中端手机的价格愈加亲民,这在必定程度上能够生果姐影响现在较为疲软的 Pixel 销量,但跟着全球全体智能手机商场逐步饱满,再加上谷歌在大会上暗示本年晚些时候将推出新 Pixel 高端机,它们终究能够为谷歌带来多少收益还不得而知。

就像在刚刚曩昔的第一季度财报会议上,谷歌 CEO Pichai 表明的那样,“在硬件之路上游聚,谷歌还处于前期阶段”。

Jeff Dean上台,压轴的谷歌 AI

在大会的终究,谷歌 AI 领武士物 Jeff Dean 压轴上台,介绍了自己团tempte队一直以来的研讨方针和方向。从推进核算机视觉琳的极限,到语音辨认,他们研讨的范畴包含日子中的方方面面。

图 | Jeff 介绍谷歌AI 团队的研讨开展

在Jeff 看来,最让他激动的AI技能开展是言语了解

遵从这一思维,谷歌 AI 一直在努力进步核算机对言语的了解能力,期望有朝一日能比美人类的水平。最新的研讨效果便是自然言语处理范畴大名鼎鼎的 BERT 模型(Bidirectional Encoder Representation from Transformers)。

BERT 模型打破了传统 RNN 模型的约束,不再局限于单个关键词词义的了解,而是结合上下文剖析语义,能够在大段文字下更好地了解语境和全体内容。

该模型于 2018 年 11 月捕蛇者说推出,直接改写了自然言语处理使命的 11 项纪录,一起启发了多个研讨团队,后续衍生模型不断改写着新的纪录。

谷歌团队更是将其直接界说为:BERT 模型敞开了自然言语处理的新时代!

随后,谷歌 AI 介绍了 AI for SocGoogle发布一览視覺“高科技”:检索3D化,编码仅100KB,不必高级设备只能运作-万博文娱_万博体育官网登陆_万博体育ios版ial Good 项目,旨在将 AI 技能推广到各个范畴。

图 | 谷歌用AI 检测肺癌

他们将 AI 运用于医疗保健,建立了 CT 扫描图猜测模型,能够协助检测肺癌。他们还将 AI 运用在自然灾害猜测范畴,建立了一个洪水猜测模型,猜测洪水会出现在何时何地。该模型结合了深度学习、卫星印象与以实践为根底的情境仿照,而且会将信息同享给可能会受到影响的个人。

除此之外,谷歌的 AI for Social Good 项目还包含地震余震猜测、全球渔业活动猜测等等,都突显出 AI 技能的有用价值。

图 - 用 AI 模型猜测地震余震

结语

最近一两年,数据隐私和 AI 品德问题继续困扰着美国科技巨子们,特别是用户体量巨大万里长城、把握海量数据的 Facebook 和谷歌。

上星期的 Facebook F8 大会,扎克伯格三句话不离数据隐私维护,力求拯救形象,而在谷歌 I/O 大会开幕式上,咱们好像也感触到了谷歌的故意“保存”。

上一年,谷歌在大会上演示了 Google Duplex,让 AI 打电话订位,AI 仿照人类太成功,接听电话的店员底子没有发觉有异,不料却引起外界忧心技能被用来诈骗人类。

随后,谷歌遭人诟病的事一桩接着一桩,一会儿职工联名对立用 AI 做军事生意,导致云核算部分高管的离任潮,一会儿又对立 AI 品德委员会的某些外部成员,使得该安排才建立一周就被逼闭幕。这让从前建立“AI 优先”战略的谷歌不得不从头考虑技能的开展走向和展现战略。

所以,本年的 I/O 大会在展现 AI 技能时,更多演示 AI 关于人类带来正面效益的运用,塑造出一种“谷歌是你的好辅佐”的感觉,例如协助听力或言语妨碍人士更好地与国际交流,在议论服务及硬件设备时,也不断重申数据维护、摄像头绝不会监督用户等,深怕又被外界抓了小辫子。

或许正是由于如此,本年的大会才略显平平,少了从前的冷艳。

但就像最初所说,以创新力出名的谷歌能带来颠覆性技能打破当然令人兴奋,但是比较于过火急进,转型成为这样一种辅佐型人物,关于普通用户、谷歌本身和社会开展来说,limit未尝不是一件功德。

科技之于人类,本就应该扮演这样的人物。

-end-

声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间服务。