29汽车网

热门|李彦宏拆解“百度大脑” 语音和图像正顺应主流

发表于:2024-06-11 作者:29汽车网编辑
编辑最后更新 2024年06月11日,李彦宏拆解百度大脑,语音和图像正顺应主流。百度选择了在9月1日开学季这一天,举行了2016年百度世界大会。这个一般作为百度发布战略内容的大会,看做是它给自己的新学期也不为过。 作为百度的大家长,李彦宏Robin在大会上不谈金融、不谈O2O,全部的内容就围

  李彦宏拆解“百度大脑”,语音和图像正顺应主流。百度选择了在9月1日开学季这一天,举行了2016年百度世界大会。这个一般作为百度发布战略内容的大会,看做是它给自己的新学期也不为过。

  作为百度的大家长,李彦宏Robin在大会上不谈金融、不谈O2O,全部的内容就围绕着一个关键词“百度大脑”。“互联网的下一幕,就是人工智能”,李彦宏在大会的主旨演讲再次强调。

  “人工智能对百度意味着什么?那就是“百度大脑”。三年前,百度就讲过百度大脑这个概念,那个时候的百度大脑已经具备了大概两三岁孩子的智力水平。”

  在大会上,李彦宏就百度大脑的语音识别与合成、图像识别、自然语言的处理和用户画像的处理四个方面,进行了讲演。

李彦宏拆解“百度大脑” 语音和图像正顺应主流.jpg

  李彦宏拆解“百度大脑” 语音和图像正顺应主流

  李彦宏称,“百度语音识别的准确率能够达到97%,已经超过了人对语音的识别能力。” 而百度的新型情感语音合成系统能够让机器摆脱平铺直叙的发声,为用户带来更自然、更接近真人朗读的听觉体验。

  百度世界大会的现场播放了一段张国荣的合成声音,是根据张国荣在影视、电台等留存下来的原声进行建模,最终实现智能模拟。任何一个人只要用30分钟按照要求录制50句话,就可以用百度大脑的语音合成技术模拟出来这个人的声音。

  不出意外,周末刚在朋友圈刷屏、载狗狗参加驾校测试的百度无人车也别拿来当做例子来讲解图像识别。

  在现场播放的视频中,两个屏幕分别展示了汽车驾驶当中,人所获取的信息百度汽车获取的信息。除了路面上的车、路标以及各种各样的障碍物等,百度无人汽车的探测范围还包括了马路周边的各种建筑物信息,像是门牌号、停车场标识等等。

  李彦宏在现场演讲中透露,百度地图的全流程数据生产自动化程度已超过80%,全景图像的自动化识别提取准确率高达95%。百度地图与图像智能识别技术的结合,让数据无限逼近现实世界。

  今年加入篮球解说界的度秘,这次则被李彦宏拿来讲解”自然语言的理解能力”。他还透露,“现在人们与度秘的交互,有56%是通过语音或者图像来完成的,语音和图像的交互正逐步超越传统文字的使用频次,成为人们表达需求的主流方式。”

  至于用户画像的能力,李彦宏用《魔兽》利用它提升票房的方法来解释在实际应用中可能存在的使用场景。

  据《魔兽》制作公司传奇影业首席分析师Matt介绍,传奇影业把影片目标人群分了三类,一类是肯定会去看的,不需要做宣传了,一类是肯定不去看的,他宣传了也没有用。主要着力点是怎样把那些摇摆的、可被说服的人群转化为真正去电影院看的人群。传奇影业运用百度的工具和数据进行人群筛选。最终,百度用户画像能力为《魔兽》带来了200%的票房提升。

  “百度大脑”无疑是这一届百度大会的核心,李彦宏在回答百度大脑智力水平的时候,称其很难与人脑相比较,因为百度大脑和人脑的正常发育过程很不一样。百度大脑的构成,主要包括了三个部分:

  第一部分,计算方法。包括超大规模的神经网络、万亿级的参数、千亿样本和千亿特征训练;

  第二部分,百度的计算能力。包括数十万台服务器构成了“百度大脑”的实体,几年前百度便开始自建中国最大的GPU集群;

  第三部分,数据。全网的网页数据、十多年来累积的搜索数据,以及百亿级的图像、视频、定位数据。

  作为BAT中以技术见长的百度,不管是在大会前做的“载狗测试”公关,还是大会上请来杨毅给度秘背书,请来胡歌给”用户画像能力”造势,反正将核心回归到技术领域的百度,应当还是让人欣慰的。

  相交于国外不时就曝光一个又一个的黑科技,国内的科技领域太过于“平淡无奇”。不管是百度,还是别的技术公司,有一家有技术信仰,忠于科技的企业,能够经常给我们脑洞大开的创新,能够让我们对于未来有着更多的畅想,这才是国内技术团队应当追求的理想。

  忘掉那些凭空创造的伪需求,时不时给业界来一个惊天的“小惊喜”,这才是技术人员的骄傲,不是么?

  文章转载自钛媒体。

0