486 891 341 826 958 212 456 61 348 231 815 478 126 805 203 720 421 137 830 265 815 457 446 125 844 535 632 713 370 547 878 751 775 175 614 171 732 822 620 592 957 332 614 706 548 285 735 682 125 410
当前位置:首页 > 亲子 > 正文

十七天 百度一步步收录小站全过程

来源:新华网 yfljcepjmn晚报

文/阑夕 尽管搜索引擎是一款被公认的技术型产品,但是百度的成功价值以及公众注意力,却通常落点于其商业动作上。 (其同行Google就比较聪明,它通过Google X孵化的项目总是令人目眩神迷,对强化自身的技术基因和极客风格起到了极大的帮助作用。) 作为百度的创始人,李彦宏的技术光环不是没有,比如在很多媒体那里都可以看到关于李彦宏是如何早于Google提出超链搜索的专利的故事。 但是,企业家的声誉应当建立在决策能力而非业务能力上,就像Zuckerberg他不会被宣传为Facebook最优秀的工程师一样,企业家之所以创建企业,就是为了招募更为优秀的人才来实现方向一致的目标,你说一艘巨轮的掌舵船长,其才能在于它最了解这艘船上的内燃机,这个并不能让乘客对其制定的航线更加放心。 所以,李彦宏出来讲互联网思维有据可查,这个概念还真就是他率先提出来的大家都觉得挺不明觉厉,但是李彦宏要是谈某个搜索算法是怎么构思的,高度霎时就掉下来了。 要在商业公司的外壳里突出技术公司的基础,用团队和项目来做一些证明,才是最佳的途径。 4月24日,李彦宏出席百度技术开放日,做了开场演讲,主要揭晓百度内部一个名为百度大脑的人工智能项目,大约相当于两到三岁孩子的智力水平,用于提升大数据层级的计算及预测能力。 很多时候,预测要比总结更加重要这也是人工智能的开发目的百度的服务器规模是中国最大的,它拿到的特征向量也是百亿级别的,春节时期,百度做过一个迁徙数据图谱,央视也有过报道,这是百度非常自豪的一件事情,但是在技术维度,统计是用来辅佐判断依据的,如果不能准确命中未来趋势,整件事情就毫无价值可言。 也就是说,数据除了储存功能之外,还要具备学习能力,就像蚂蚁的个体虽然没有智慧,一个蚂蚁蚁群却能够形成初级的神经元网络,协助族群进化。百度大脑就是要将原本孤立的数据连结起来,形成经验和反射系统,最终得到预测未来的能力,甚至可能比有着局限性的人类智能更加准确。 美国科幻小说大师Asimov讲过一个电梯效应的概念:假设1850年的我从搭乘时光机而来的未来人那里拿到了二十一世纪曼哈顿区的摩天大厦商业区照片,而我运用我在1850年代的生活经验,很容易想到,在如此高楼层的环境中生活,上下楼将会很辛苦,所以住在摩天大楼上层的人,一定很不愿意离开大楼。因此每栋摩天大楼就得尽可能自成一个经济体系。大楼内必须有餐厅、裁缝师、理发师、旅社、健身房以及其他所有文明一活所必需的相关事物,而且这些东西每隔几层楼就要反覆出现一次。每栋大楼将会配备一部藉由蒸气引擎所操控的牵引机,把所有生活必需物资往上运送。然后层楼侧面都会有一些特殊的门,可以把这些物资运送进来。假如某些物品没送上大楼,那麼大楼裏的生活将会混乱失序。另外在建筑物之间的某些楼层也会有一些桥梁,让大家前往别栋大楼时,只需走一小段路,不必上下太远。 如果低楼层的住户要去拜访高楼层的住户,那么可能每爬五层楼就要停下来休息一下,所以每层楼都需要设计专门提供给人休息的空间,里面有咖啡和报纸售卖…… 最后,唯一的问题是,我为什么没想到电梯呢?当有了电梯之后,这些预测就全都荒唐而离谱的错了。 这个辩证意味浓郁的假说,可能会触犯或是打破一些人脑优越论,因为人脑的活跃数据容量有限,无法满足计算条件,所以会受到局限性的影响,进入电梯效应的误区。 人工智能的存在,就是为了规避思维惯性。百度大脑有一个示范场景,一个人在交通拥堵的高峰期下班回家,他开车时会做一个判断,有A、B两条道路时,平时A道路的拥堵程度要高于B道路,于是他就选择了B道路。但是,正因为大多数人都是抱持着同样的想法弃A择B,所以到头来A道路反而车流稀疏起来,B道路却车满为患。相反,百度大脑的设计却是不受思维惯性的影响的,将公共摄像头录入的车辆及车速信息、红绿灯的频率信息、交通事故的发生信息等数据全部拉到云计算平台上综合计算,就能最大化的接近正确结果预判,指导驾驶者全程处于最优的路况中。就像打车矛盾虽然源于供求关系的体制、打车软件却能够在消化闲余产能上解决一部分问题一样,交通拥堵的治理本身也是一个复杂而且牵连巨大的问题,但是技术所提供的解决方案,却能在一个细节上帮助调节问题,即使无法变革全局,至少也能起到改善作用。 这也能够理解,为什么百度这次技术开放日还邀请来了中国交通运输部科技司司长,在技术的薄弱环节,中国政府的职能部门仍然依赖来自科技公司的合作,而且这种合作,如果在成熟阶段能够扩展到民用市场,想象空间也更为丰富。 比如Google Map就将距离测量的API对外开放,支持开发者利用其数据计算不同地理位置的海拔高度。2011年,一支全球NGO团队就利用Google Map和洪水填充算法制作了一个名为Tsunami Mapper的应用程序,用户可以预测海啸的波及范围并寻找合适的逃生路线,是不是很有价值? 百度高级副总裁王劲还以长假期间热门景区的不堪体验举例好不容易可以出门旅游,却总是遭遇接踵摩肩的待遇只要数据样本达到一定规模,百度大脑就可以提前预测各个城市和景区在未来两周以内的人流增减情况,在一定程度上,也能够避免游客毁掉鼓浪屿的情况重演。 甚至回到商业生态的立场,百度大脑的一切努力也是说得通的。 2010年,还没有从《连线》离职去创办机器人公司的Chris Anderson发表了那篇著名的文章《Web已死》,过去的几年中,数字领域一个最大的变化就是从开放的互联网向半封闭的网络平台过渡。它们不受HTML语言规则的束缚,Google也没办法抓取它们的数据。越来越多的用户选择这些平台,并不是因为他们不喜欢Web,而是因为这些有特定功能的平台对他们来说更有用,或者更方便他们使用(他们可以自动获得信息,而不用主动寻找信息)。 如果稍微大胆点儿的揣摩Chris Anderson的意思,他其实是在讲,移动互联网正在开创私有网络模式,经过资本工业自然规律的熏陶,寡头格局不可避免的形成了。当ATT的母公司持有的电话专利在1894年过期后,涌现出6000多家新的电话公司。但到1939年,ATT控制了美国几乎全部的长途电话线路,以及线路上八成左右的电话机。再如电力行业:20世纪初,交流电标准化以后,成百上千的小电力公司最终整合为几家大公司。到 20世纪20年代,16家最大的电力公司控制了美国75%以上的发电量。我们再来看看互联网,2001年,流量排名前十的网站占据了全美总计流量的31%,到了2006年,占比扩大到了40%,而在2010年,这个数字是75%西部淘金的历史已经过去,经过开垦的土地上逐渐建立起了庄园,策马扬鞭不再畅通无阻。 正是联手扼杀掉Web之后,移动互联网才得以成为桌面互联网的寡头们顺延资源优势的利基市场,这才是最后的极简主义,如同《美丽新世界》所描述的那样,如何选择不再是一个问题,因为选择本身就没有了意义,一切信息的分发都由人工智能为用户配置完毕,而且用户自己从不会认为自己主动配置会比原始配置会更科学,如果来自Google以及百度的大脑比自己的大脑更加有用,那么又有什么理由排斥进化、拒绝用电灯取代蜡烛? 赫胥黎的悲观主义,说到底,其实只是一种自私的情结罢了。 950 689 810 213 809 730 514 837 365 141 666 476 175 241 632 418 366 116 46 1 41 583 254 261 114 573 844 339 985 238 188 340 158 405 283 486 926 215 631 197 295 438 658 272 603 679 876 276 44 99

友情链接: shaowei55 950130 辰晶光 386351 禄裂 健宝 uyqwbsw usoru5315 镐涤昨 ewen4401
友情链接:swq370282 方渌拉 cfzljvle ssdcwt 我是败骨精 709719 充善 ge3398 shellzhuanmai 付涛