机器学习如何吞噬微软

昨天发布的Azure机器学习(Azure Machine Learning)是微软深度机器学习专业技术的最新标志——现在世界各地的开发人员都可以使用它

12 第二页
第2页共2页

新的Azure ML服务以MSR Excel演示开始,将数据发送给运行在Azure上的实验性机器学习驱动的数据分析。萨蒂亚·纳德拉(Satya Nadella)在成为首席执行官的几年前看到了这个演示,并立即看到了将其变成一款面向商业客户的产品的潜力。他说服研究人员罗杰·巴尔加(Roger Barga)加入了他的云部门的一个团队。“萨蒂亚很兴奋,我也很兴奋,”巴尔加回忆道。

这个想法是将研究团队的机器学习工具与微软各产品团队通过实现机器学习算法获得的专业知识相结合。让机器学习运转良好,不仅仅是要有一个好的算法,甚至是让它大规模运行。你还需要保持一致性。相同的算法在不同的机器学习包中往往会给出不同的答案;使用启发式方法来找到最适合您的数据的模型需要大量的经验。

这种经验提供了一种独特的优势,巴尔加说:“这些算法经过多年的强化和验证。我们能够利用这些专业知识在Azure ML中再次实现它。我们知道最佳实践是什么,启发是什么,我们应该做什么来确保它是健壮的,可扩展的,我们可以交付给我们的客户的性能实现。”

但是Azure ML并不仅仅是把MSR已经交给产品团队的机器学习算法,放到一个拖放式视觉设计器中。微软已经将该功能提供给了那些了解R统计程序设计语言Python,它们一起被广泛应用于学术机器学习。微软计划将Azure ML与它最近收购的R初创公司Revolution Analytics

开发人员还可以使用Azure ML Studio工具设计机器学习系统。这在经验丰富的机器学习开发人员中也很受欢迎,比如爱思唯尔(Elsevier)的学术研究网络Mendeley团队,该团队构建了一个新的推荐系统,所用时间仅为使用其他工具的三分之一。英国的JJ食品服务公司(JJ Food Service)用它做了一个预测购物车,可以为你放入产品;顾客喜欢它的便利,收入也增长了5%。

一个能自我训练的机器

为了让多个机器学习算法更容易一起使用,微软需要构建一个合适的平台。这意味着要创建一个系统,将新算法从研究转向生产;随着新技术的开发,它们可以插入Azure ML,随着机器学习的不断发展,保持它的最新状态。

老式机器学习系统的一个常见问题(也是深度学习将解决的问题之一)是“ML腐朽”。换句话说,你花了很长时间训练你的系统,当你推出它时,它能工作一段时间,但它过时了,你必须再次训练它。避免这种情况的一种方法是在使用模型时对其进行重新培训。

在预览期间,客户对这个想法非常感兴趣,因此微软增加了程序化的培训和再培训。Sirosh解释说:“他们想要将数据上传到一个API,并让机器学习模型来进行学习,所以我们添加了这个。”“一旦你有了一个合适的API,你就可以继续上传数据,这个模型就会自我更新,保持新鲜,不断学习。”

这是eBay用来训练其翻译系统在女性时尚中使用的术语。如果你在eBay上卖手提包、衣服、鞋子或其他时尚物品,你可能会看到更好的海外销售,因为清单的自动翻译更准确,而且支持所有45种语言的Azure ML。

本周,微软增加了必应广告使用的一种新的机器算法,可以处理非常大的数据量。“我们可以在tb大小的数据集上学习,”Sirosh自豪地说。“除了Azure ML,我不知道现在是否有任何云服务可以让你学习tb大小的数据。”这对大数据很有用,因为在大数据中,你可能需要从庞大的数据集中找到能够告诉你一些信息的信号。

微软有一系列针对大数据场景的服务。你可以将数据加载到HD Insight,微软的Hadoop云服务中,或者使用Event Hubs从网站和传感器中获取数据,然后使用Azure stream Analytics或Apache Storm处理数据流,Azure现在支持这些数据流。

“从中你可以调用机器学习api来检测异常或欺诈,”Sirosh解释道。“你可以使用HD Insight获取大量数据,并使用Azure ML提取数据,以学习可以部署在应用程序中的模型。但大的学习远不止这些。比如说,某些邮政编码的欺诈率很高,而另一些则不然。世界上有数百万个邮政编码。这些技术允许您考虑这些模式;你可以使用非常精确的信息。”

Sirosh显然相信他的平台将加速机器学习的采用。“如今,企业雇佣数据科学家,他们痛苦地定制自己的机器学习应用程序。有了Azure ML这样的平台,创建自定义应用变得非常容易……只有当你有特殊的需求时,你才需要建立一个数据科学家团队来为你构建和使用API。”

走进一家Chili’s餐厅,你可能会发现每张桌子上都有一台平板电脑,用来点餐、看视频、付账和提供反馈。该系统由Ziosk开发,使用HD Insight跟踪1400家餐厅的顾客使用平板电脑的情况,并使用Azure ML定制他们看到的商品和内容。它甚至可以根据用户的使用方式改变平板电脑的界面。

西罗什认为每个人都应该建立这样的系统。“在很多方面,这是智能云的诞生。无论你开发什么应用,你现在都应该考虑使用应用生成的数据,或者你拥有的任何其他数据,来创造更好的客户体验,创造你原本无法利用的效率。”

微软巨大的机器学习未来

去年7月,微软首席执行官萨蒂亚·纳德拉(Satya Nadella)在给微软的备忘录中指出,机器学习——以及支持机器学习的大数据——是一个关键进展。数十亿传感器、屏幕和设备——会议室、客厅、城市、汽车、电话、个人电脑——正在形成一个巨大的网络和数据流,这些数据流只是消失在我们生活的背景中。这种计算能力将把我们身边的几乎所有东西数字化,并将从人与人之间以及人与机器之间的互动产生的所有数据中获得见解。我们正从一个计算能力稀缺的世界,转向一个计算能力几乎无限的世界,而真正稀缺的商品是越来越多的人类注意力。”

当你和彼得·李谈论他认为微软在未来十年可以取得的进步时,这听起来更容易实现。

去年,他展示了一个机器学习系统的早期工作,该系统不仅可以用你的手机摄像头识别狗,还可以识别品种,或者告诉你一种植物是否有毒。这就是“亚当计划”(Project Adam),它试图将云的规模原则应用到机器学习中。通常情况下,机器学习是在单个系统上进行的,你无法在集群之外进行扩展,因为它必须是同步的;在Project Adam中,学习可以是异步的,所以你可以将其分散到整个数据中心。2020欧洲杯预赛

亚当项目只是李所说的几个机器学习“登月计划”中的一个——“真正雄心勃勃,但有真正具体的、易于评估的目标,这样你就知道自己是否完成了。”他非常保护这些项目(“压力会让人分心”),所以他不会说出其他项目的名字,也不会说目标是什么——但这些项目都很大。

“亚当计划确实超越了语言和视觉,真正深入地理解人类的话语。最终,这将是真正的人工智能的下一个阶段,在这个阶段我们将真正理解如何让机器理解人类在说什么。那里的目标很有趣。从科学的角度来看,这对我们的理解有巨大的影响;从工程角度来看,其规模确实令人眼花缭乱,从商业角度来看,其应用前景令人难以置信地诱人。我们在语言和翻译的基础上做出了非常重大的努力。”

李既兴奋又务实的潜在的这些大项目,一边的好处”,已经开始运球”——从OneDrive(现在使用机器学习标记你的照片),Skype翻译(性能改进的演示新技术让研究人员“震惊”)。此外,Azure机器学习有一个现成的平台,可以将这些新技术引入微软内部的产品团队和其他地方的开发人员。

李承认:“有了这些雄心勃勃的努力,我总有点怀疑我们是否能实现目标。“有些事情是如此奇妙,但你永远不知道!”你会惊讶。作为一名研究经理,无论我们能否做到这一点,都会有大量的衍生产品和新知识出现,对此我感到放心。”

无论微软是否在人工智能领域取得更根本的突破,它在使用机器学习方面学到的东西将继续体现在你使用的所有产品上——包括你自己制造的产品。

这篇题为“机器学习如何吃掉微软”的文章最初发表于信息世界

加入网络世界社区足球竞猜app软件脸谱网LinkedIn对自己最关心的话题发表评论。

版权©2015足球竞彩网下载

12 第二页
第2页共2页
工资调查:结果在