10倍TPU 算力、3D全息视频通话、首个量子AI园区,你谷歌还是你谷歌
智东西(公众号:zhidxcom)
编译 | 孙悦
编辑 | 云鹏
智东西5月19日消息,谷歌I/O(开发者大会)2021大会在今日凌晨1点线上召开。在本次大会中,谷歌涵盖了芯片TPU、会话式语音AI(人工智能)、搜索模型MUM、Android 12系统、实时AR地图、智能办公、全息3D视频聊天等方面的技术探讨。
此外,谷歌还重点关注了,用户的隐私安全和环境保护这两大块问题的解决方案。虽然今年大会受到了疫情的影响,只能在线上召开,自然是让人们少了些参与感。但“感觉”不够,“内容”来凑!这次谷歌带给大众的惊喜丝毫不少于大会的线下体验。
一、力推前沿计算:第四代TPU算力飚两倍,首个量子AI园区来了
在谷歌I/O 2021开发者大会的主题演讲期间,谷歌研究与健康部门副总裁Jeff Dean披露了张量处理单元(TPU)芯片的相关细节,它可用于开展AI训练,然后生成AI模型,并有望用于智能扬声器、手机等设备中。Dean解释:“谷歌将4096个四代TPU整合到一个Pod中,使一个Pod就可以提供超过一个Exoflops(浮点算力为10^18)的AI计算能力。”
得益于系统内部的互联速度及架构优化,TPU v4算力可达v3的两倍,实际性能更是比v3提升了十倍之多。
之前的AI Pod主要是采用了TPU的集成设计,而在第四代版本中,谷歌运用了光纤线路,不仅使不同板块组合到一起,还使维护工作更加轻松。此外,谷歌对单独的AI系统进行训练,用以识别语音、文字、照片和视频等信息,还试图通过研发MUM(多任务统一模型)技术来改进相应的AI软件。
谷歌TPU AI加速器
大会上,谷歌表示将在美国加利福尼亚建立一个全新量子AI园区,包括第一个量子数据中心和量子处理芯片制造设施,预计在十年内打造一台商业级量子计算机,这将在帮助他们建造机器、研发新材料方面发挥巨大的作用。目前谷歌的首个量子计算实验室已经雇佣了数十名研究人员和工程师,未来将会有更多技术人员加入。
“由于数据处理最基本元素的量子比特易受到外加干扰,所以增强量子比特的稳定性是目前构建量子园的首要任务。加上量子计算依赖于控制超小粒子的怪异物理定律,这也使研发过程受阻。”Jeff Dean说道。
谷歌计划将现实世界中的多个量子比特,组合成为一个有效的虚拟量子比特(又称“逻辑量子比特”),两者的比例约为1000:1。此前技术人员预计需要1000个逻辑量子比特,才能完成实际的计算工作量。但对于目前只有数十个量子比特的谷歌来说,这个项目目标确实比较遥远。
二、突破性会话式AI:从冥王星聊到纸飞机无需重训练
在今年的谷歌I/O会议上,谷歌强调了其对AI语言理解的工作,推出一个名为LaMDA的实验模型。研发人员在大会上展示了用户与LaMDA充当的冥王星和纸飞机的对话,可以看出对话自然合理,并不像普通聊天机器人那般毫无逻辑。谷歌称该模型有一天可以增强其对话式AI助手的功能,并允许进行更自然的对话,这对于软件和网页翻译功能起着巨大作用。
LaMDA模型最初是一种被称为Transformer的机器学习技术,它在处理计算机语言方面非常出色,并支持AI公司OpenAI的GPT-3(一种回归语言模型)的兼容。一直以来,AI和LaMDA模型就像是面包和黄油的关系。AI技术为LaMDA模型助力的同时,它也推动着语言理解和运用的融合。
AI语音系统逻辑图
AI语音助手的构建,有助于更好的理解用户所需的信息诉求,因为谷歌部分产品都是基于对计算语言的解读,而AI语音则是它的核心技术。谷歌首席执行官Sundar Pichai在演讲中提到:“语言的丰富性和灵活性使其成为人类最伟大的工具之一,它也是计算机科学的最大挑战之一。虽然现在与LaMDA的智能对话,可以根据上下文内容提供建议和答案,让对话不违和地进行下去,但它仍是处在研发初期,想要达到AI助手的对话功能,还需要时间的磨合”。
三、比BERT强1000倍的搜索模型MUM,提供更灵活可靠的搜索结果
谈论到搜索功能,谷歌在此次I/O大会上公布了一个全新的多任务统一模型MUM。它是建立在一个Transformer架构之上,但却比BERT要强大1000倍。MUM可以理解语言、接受75多种语言的培训,还能同时处理文字、图片、视频等信息,并最终得到统一且具有极强参考价值的信息。
在发布会上谷歌演示了一个MUM的使用案例,当用户想去攀登富士山时,自己需要做哪些准备?MUM通过用户提供的照片,视频,路线图等信息,并针对富士山和亚当斯山的季节、地质等差异,提出最合理的攀登路线、时间和装备需求。
在这个例子中,MUM结合用户所提供的信息,综合分析后的提出最适合的解决方案。但目前MUM和LaMDA一样还处于开发阶段,何时能正式推出,时间尚不明确。
四、AI+图像处理强强联手,做动图、诊疗皮肤、升级AR地图
当下用户电子相册里的照片可谓是越来越多了,但要如何在需要的时候准确找到目标照片呢?谷歌推出了一个名为称为小图案(Little Patterns)的全新AI功能。这个模式可以将用户相册里,三个类似对象的照片归类为一类,方便用户查看。Little Patterns还将利用电影中画面转场技术,把两张相似的照片制作成动画图像。
此外,谷歌还透露正在研发一种新工具,可以轻松地从照片库中删除某一人的全部照片,例如,想忘记却频繁出现在相册中的前任。
在医疗健康方面,谷歌之前研发的AI深度学习系统,它能像皮肤科医生一样准确识别26种常见的皮肤病,该项技术还曾在春季刊的科学杂志《Nature》上发表。
基于此项技术,谷歌正在尝试利用AI,通过检测皮肤、头发和指甲,帮助人们了解自身身体状况。具体点说就是,人们使用手机拍摄下身体出现异常的部位,然后该技术将从具有288例的数据库中进行症状识别,并给出相应的治疗方案。
据悉,该项技术通过了对数百万张患病皮肤图片和健康皮肤图像的学习,还对6.5万张临床环境图像模型进行了培训。在测试阶段,谷歌技术人考虑了患者年龄、皮肤类型、性别和种族等不同因素的存在,并对不同患者约1000张患病皮肤图像进行了模拟。
谷歌健康首席健康官Karen DeSalvo说:“我们每年大概会收到100亿次关于皮肤症状的查询,大多数人们都喜欢自行在互联网上了解治疗方案,由此我们想到用AI来解决这个问题。”DeSalvo希望这项技术可以帮助轻度患者们高效、快速、准确地获取相关信息,同时也为皮肤科医生减小就诊压力。
今年大会宣布了将加强Live View(实时视图)功能,可以让用户增强现场感,实现“环游世界”的体验。
自2019年推出Live View测试版以来,人们就可以通过谷歌地图看到一些公共场所的实时视图,像机场、购物中心、公园等区域。现在,谷歌将推出大范围的Live View,并将为用户整合出更多有用的信息,比如通过餐厅的实时视图,人们可以了解其繁忙程度,然后估算出大概的用餐时间等。同时,谷歌地图还提供用户评论及上传照片的功能,便于人们对该地区的了解和判断。
谷歌地图预计到今年年底,将在包括柏林、圣保罗、西雅图和新加坡等50个新城市,提供更加详细的Live View。当用户打开地图时,不仅能知道路线规划,还能了解当前地理位置下,周边环境、建筑的具体信息。同时,地图还将为人们推荐周边的酒店、餐厅或是娱乐等服务。
不仅如此,Live View还在一些复杂的十字路口街道设置了“标签”,它将自动根据用户常用的位置信息(如家或工作的地址)来提供更准确的定位服务。“谷歌地图今年有望增加,多达100多项人工智能的程序设计。”谷歌地图技术部门的Liz Reid说。
谷歌地图另外一个重点升级是,它将利用人工智能识别来预测用户的“紧急刹车事件”。简单来说就是地图根据对于道面信息路况的监测,有意识地提前对用户发出危险警告,帮助用户规避因紧急刹车而出现的交通事故。据谷歌表示,在这项技术的指导下,每年可以预防1亿次紧急刹车事件的发生。
对于谷歌Pixel手机来说,它最大的亮点是,升级了图片处理器的相关技术,使其更具有包容性。“这项技术旨在让相机里的有色人种,能够毫无保留地呈现他们的自然之美,使照片上的颜色更加精准。”谷歌技术研发人员解释道。
更准确地说,这项技术主要是改变了相机的白平衡和曝光算法,让它更广泛的搜集深色人种的数据信息,避免照片中过亮和不饱和的有色人种,从而提高图片颜色的准确性。同时,谷歌还表示之后将会把这项技术应用到更多的产品设计中。
此外,在手机相机的应用上,谷歌还推出了新的人像自拍模式,为卷发和波浪发型创建深度准确的图像信息抓取。虽然目前该技术还是存在一些问题,但还是个值得研发的项目。
五、智能画布改变协作办公:让你一边编辑文档,一边视频沟通
在企业办公方面,谷歌在 Google Workspace中推出了一项新协作工具——Smart Canvas(智能画布),它可以更高效地将文档、表格和幻灯片进行组合,提供无缝的工作体验。
同时,谷歌将Google Meet功能也整合进了Smart Canvas中,方便用户在编辑文档时能实时交流。Google Meet还支持AI 自动缩放以实现最佳人脸显示并提供自定义视图。最后,Google Meet在消除噪音方面做了改进,整合AI来提升视频质量、优化取景和对焦,以及提供翻译能力。
六、实时全息3D视频聊天:相隔千里也犹如面对面
在I/O大会上,谷歌介绍了一项名为Project Starline的视频会议新技术。它能够借助 3D成像技术来获取用户信息,然后通过实时数据压缩技术,以借助现有网络来传输大量数据。其特点是让用户产生“面对面”交谈的真实感。
Project Starline技术通过大量设置摄像头、深度传感器、专用照明和其他定制的硬件,可以达到毫无距离感的现场交流效果。这个技术目前仅在谷歌旧金山湾区、纽约和西雅图的部分办公室中启用。谷歌希望,这项技术在未来能够进一步降低成本和获取性,最终实现人们能在察觉不到硬件设备的前提下,全身心地投入视频交流中去。
在技术应用方面,谷歌计划将Project Starline介绍给包括医院和媒体机构在内的商业部门,并与之合作。
七、谷歌Wear OS与三星Tizen可穿戴操作系统深度整合
当提及可穿戴设备,尤其是智能手表时,大家的第一印象可能是Apple Watch,但谷歌才是这个领域的早期玩家。
从最开始的Moto 360 ,谷歌智能手表就赚足大众眼球,后来因为种种原因,技术和软件没有得到推进,其产品也就无疾而终了。以至于后来推出的Android Wear也未能让谷歌逆袭。
如今,之前的Android Wear早已更名为Wear OS。谷歌在今年一月收购了元老级的穿戴设备玩家Fitbit,原以为将会在这次的大会上宣布穿戴设备新品,但出乎意料的是,谷歌只是宣布与三星Tizen系统联合打造全新的可穿戴平台。
依目前信息来看,谷歌意识到可穿戴产品的大趋势,是运动监测和健康追踪的功能。因此,他们将研发重点放在了Fitbit的健康监测系统上。通过迄今为止已售出1.3亿台的Fitbit获得大量数据,技术人员对研究人群进行数据分析,从而得到更准确的运动、健康数据,用于开发新一代的Wear OS。
本次I/O大会还透露,Wear OS可支持用户的个性化体验,并添加多样性的手势操控。例如,双击手表的一个按钮将转换到其他页面,像此类的快捷方式用户可以自定义设定。此外,谷歌与26个国家合作,推出Wear OS版的谷歌地图。YouTube也将推出Wear OS版本,将在晚些时候发布,其功能包括在线听音乐或是下载音乐。
八、Android 12风格全翻新,手机充当车钥匙
谷歌I/O 2021大会的主题演讲公布了Android 12公测版,除了谷歌Pixel手机外(Pixel 3及更高级版本),它还适用于OnePlus、联想、华硕、OPPO、Realme、夏普、Tecno、TCL、vivo、小米和中兴的设备。
本次Android 12可以说是历上最大的变化,给用户带来了全新的页面视觉设计语言Material You,用户将能够通过自定义调色板和重新设计的小工具来完全个性化自己的手机。Material You提供了各种丰富的界面主题,操作系统的颜色也会随着壁纸的改变而改变。
Android 12页面设计
但值得注意的是,并不是所有新功能都同时推出,它会随着系统版本的更新而相继出现。在未来Material You设计将适用于包括智能手机、平板电脑、可穿戴设备、智能显示器、物联网项目、智能家居在内的所有设备。
Android 12版本发布的时间线
此次Android 12简化了互动和重新设计了整个底层系统,不仅提升了系统的流畅性和效率。还使CPU使用时间减少了22%,并将系统服务器对大核心的使用减少15%。
在用户体验上,Android 12通知栏会变得更加直观、有趣,用户可以一目了然地看到应用通知、或是目前正在收听和观看的内容。同时还支持快捷设置,让用户通过滑动和点击来控制大部分的操作系统。
全新的Android 12支持管理Android TV设备上的内容,当找不到电视遥控器或是车钥匙的时候,这项技术可以算是那些丢三落四用户的福音了。
数字汽车钥匙也正在投放市场。谷歌Pixel和三星手机将支持Android 12使用数字钥匙。目前,宝马是唯一一家确认使用此新功能的汽车制造商。
九、安全至上
在 Android 12中,谷歌引入了Android私有计算核心(Private Compute Core),可以安全地存储用于机器学习的数据,用以增强保护用户个人信息的安全性、私密性。私有计算核心能让用户在音频和智能回复等方面与网络隔离,是所有操作都在设备上执行,与网络隔离,以此来以保护用户的隐私。同时,私有计算核心的保护措施是开源的,完全可以由安全社区检查和验证。
在I/O大会上,谷歌推出了浏览器内置密码管理功能。当它发现密码有可能被泄露时,它会建议用户及时修改密码。目前这个功能会先在Android的Chrome中推出。
关于个人账户的隐私安全问题,谷歌系统推出了一个密码保护文件夹的功能。这项技术可以通过设置密码,帮助用户保护那些最私密的照片。与此同时,谷歌还为用户提供了自动删除功能。系统将会自动删除,在账户保留时间超过18个月的活动记录。目前,有20亿账户开启了自动删除功能。
Android 12具有了一个名叫Privacy Dashboard的隐私面板,类似于之前系统的My Activity面板。面板上面记录了用户在过去一段时间内都做过什么操作、浏览过什么页面、生成了哪些数据,它允许用户快速对这些信息进行管理,包括删除操作记录和相关的数据,驳回特定App的权限等操作。
十、到2030年实现运营中使用无碳能源
保护环境,人人有责。今年的大会,谷歌除了带来技术层面的惊喜,Sundar Pichai还立下环保战书:到2030年,成为第一家全天候零碳的公司。注意,这里的零碳指的是包括全球所有的谷歌办公室。这个想法的提出,就如同立下“在10年内建设量子计算机”的目标一样大胆。
不管怎么说,这都是一项艰巨的任务。去年,谷歌发布了首个业界所谓的“碳智能计算平台”,它按照清洁能源的供给情况,智能地进行计算负载分配。简单点说就是,谷歌把高性能、高消耗的计算负载给分配到风能更充足的夜晚,以及太阳能更充足的正午,让风能和太阳能去转化这些计算负载。
目前这个碳智能计算平台通过升级后,可采用机器学习对计算负载的日间变化进行预测,然后提前完成冗杂的分配和备案等操作。谷歌还提到,这将不影响业务的实际运行效率和用户的正常使用。“到明年的这个时候,我们应该有能力把超过三分之一的非生产用途计算负载,给分配到清洁能源更充沛的地区去。”Sundar Pichai说。
结语:Android 12为大会造势,AI应用才是大会重点
由于疫情原因今年谷歌I/O大会只能以线上形式举办,但谷歌作为科技领域的顶端技术创造者,每次发布会都为大众带来不一样的惊喜。
这次大会正式发布了Android 12系统,但还是以AI领域的应用为主,谷歌推出了自然语义模型LaMDA和用于医疗领域的AI治疗。另外还有谷歌地图Live View技术的全面应用、虽然万众期待的Wear OS手表没有推出,但还是透露了些相关信息,值得期待。
来源:The Verge
评论