“我们有超大规模的神经网络,已经使用了万亿级的参数,人脑的神经源大概是千亿级的,我们也有千亿的样本和千亿的特征进行训练。”在9月1日的百度世界大会上,李彦宏这样向在座参会者这样阐述着百度大脑,其中,语音、图像、自然语言处理和用户画像是其最核心的四大能力。
作为百度大脑四大核心能力之一,图像的能力近来已有长足的发展。“其实用比较专业的词来讲,应该叫计算机视觉。”李彦宏介绍,图像识别一个非常重要的应用领域就是无人驾驶汽车。李彦宏表示,虽然无人车还涉及高精度地图、对环境的感知、高精度的定位、控制、语音等诸多复杂技术,但它对计算机视觉技术的要求的确非常高。“无人驾驶汽车真的要变成没有人,真的要能够解决99.99%,甚至百分之百的情况,最终还是要依靠计算机视觉的能力,要识别各种各样的极端的情况。”李彦宏说。
过去一年,百度花了不少精力,来提升百度无人车在城市道路的运行水平。在演讲中,李彦宏播放了一段无人车行驶过程的视频。百度无人车在行驶过程中,通过感知,可以探测到路面上车、路标以及各种各样的障碍物,每个物体有一个独特的编号,便于车对它进行识别。这个车的识别是通过百度大脑来识别的。“大家可以看到,人的视野其实是比较窄的,无人车能够看到路面情况,感知的范围其实比人要宽很多。”李彦宏表示。
自去年在国内首次实现城市、环路及高速道路混合路况下的全自动驾驶路测以来,百度无人车收获了国内国外大量的关注,其在交通场景物体识别、高精度地图与定位等无人驾驶关键技术上的领先水平也得到了业界的广泛认可。今年8月份KITTI评测的最新成绩显示,百度无人车在车辆检测中排名第一,车辆跟踪6项指标中取得4项第一。
除了在无人车对计算机视觉的应用,李彦宏还介绍了人脸识别、AR、百度地图中采用的OCR识别等技术的应用。在李彦宏看来,这些技术本质上都是图像识别的技术。“这些能力在我自己和百度这些人的想象范围内,能做的事情其实我觉得已经很多了,但是更让我兴奋的是,如果这些能力赋予到全社会每一个人,能够变换出来无穷无尽的可能性。”李彦宏说。