机器学习是如何吞噬微软的

昨天发布的Azure机器学习是微软深度机器学习技术的最新标志,现在任何地方的开发人员都可以使用它

在上面

在地层大数据会议昨天,微软让全世界都知道它的Azure机器学习产品普遍提供给开发者。这可能会作为一个惊喜。微软?是不是机器学习谷歌或Facebook或无数热初创省?

事实上,微软已经悄悄地建立了它的机器学习专业知识了几十年,转化学术成果向沿途的产品功能。没有多少企业能比得上微软的人才板凳深度。

机器学习——让一个系统从大量数据中进行自学,而不是简单地遵循预设的规则——实际上为你每天使用的微软软件提供了动力。机器学习已经渗透到微软的产品中,从必应(Bing)到Office,从Windows 8到Xbox游戏。它最炫的交通工具可能是未来的Skype翻译,它可以处理不同语言的双向语音对话。

现在,有了Azure云上可用的机器学习,开发人员可以在自己的应用程序中构建学习功能:推荐、情绪分析、欺诈检测、故障预测等等。

新Azure的产品的想法是民主化的机器学习,让您不再需要雇人具有博士学位使用机器学习算法。That could “pull big data out of the trough of disillusionment,” suggests Joseph Sirosh, Microsoft’s corporate vice president for information management and machine learning, who heads up the new Azure service, “taking it from looking in the rearview mirror with business intelligence to really being able to predict and generate forecasts you can act on.”

Sirosh梦想大,这表明潜在远远超出预报和预测,到这种地步“每一个移动应用程序现在可以智能,每物联网传感器现在可以将数据发送到云和呼叫上为它提供智能的API。”如果这似乎过于乐观,它的值得看的多么重要的机器学习已经是微软自己的产品。

机器学习无处不在

机器学习使办公室365凌乱不堪确定与电子邮件,你需要阅读,哪些是你很可能会忽略和删除邮件不可思议的准确性。It's how you can open customer data from Salesforce or code from GitHub in the new Microsoft Power BI portal and immediately ask natural-language questions like “customer sales last quarter,” to get not only numbers, but a chart in the style that highlights what’s important in the data.

它是如何Office 365和Azure的现货黑客试图闯入账户,柯塔娜如何识别你在说什么,怎样的Kinect可以检测你的手指的骨骼中,从红外图像的接缝位置或。这也是为什么在Windows Phone的键盘是如此的准确:数据来自成千上万的人在手机上纠正错误推导使软件猜出你下一步打算键入哪个字母,使该密钥(看不见的)更大。

同样的机器学习技术使你更容易用手指触摸Windows平板电脑上的正确菜单,并帮助电脑辨认你的笔迹。在Windows 8中启动一个应用程序,四分之三的时间几乎是瞬间打开的,这要归功于机器学习,它会告诉系统哪些应用程序需要预加载到内存中,因为你需要它们。

机器学习需要大量的数据——无论是服务器日志、来自传感器的信息流,还是大量的图像、视频或音频记录——并将其整合到一个比任何算法都更擅长处理复杂情况的系统中。这个想法已经存在了50年,但是随着越来越多的数据变得可用,机器学习已经变得越来越有用,从学术研究到有力的突破,如可用的语音识别。

“老实说,我想不出微软最近参与的任何产品开发没有不涉及机器学习的,”微软研究部主任Peter Lee说,他离开DARPA去管理微软的研究部门。“我们现在做的每件事都以这样或那样的方式受到机器学习的影响。”

以最近推出的微软手环(Microsoft Band)为例,这是微软新健康平台的旗舰设备。“我们想让血液流动传感器提供准确的读数,即使在像赛艇这样极端的运动压力下,”Lee解释说(批准这个项目的副总裁是一个狂热的赛艇爱好者)。“这是一个非常低成本的传感器;仅仅是解读传感器的读数,我们发现机器学习是实现这一点的唯一实用方法。”

几十年的实验室研究

微软是怎样得到这个善于学习机?感谢常常被低估微软研究院(MSR)部门。“一些[这一成功]最早的根源可以追溯到20年以上,随着人们像埃里克·霍维茨谁真正把学习机的整个视野​​,该公司的到来,”李说。“他们很快想出了将其应用到微软产品的想法。”

霍维茨现在是微软研究院雷德蒙德实验室(Redmond Lab)的常务董事,他曾获得美国艺术与科学学院(American Academy of Arts and Sciences)和美国人工智能促进会(Association for the Advancement of Artificial Intelligence)颁发的奖项,最近还资助了一项为期100年的人工智能研究。随着机器学习在一个又一个研究领域变得重要起来,拥有一位在微软研究院有影响力的人物,帮助吸引了其他先驱。

“15年前,当我们在剑桥建立这个实验室时,它增加了动力,像克里斯·毕晓普(Chris Bishop)这样从事概率建模的人,被MSR所吸引。”

主教字面上写的书神经网络和模式识别;他的课本在机器学习取得的统计方法常见。He’s now the chief research scientist at MSR Cambridge, where he runs the Machine Learning and Perception group behind skeletal tracking in Kinect, the AI in Forza Motorsport, the TrueSkill ranking system on Xbox, as well as some of the search features in Bing and SharePoint.

该小组还致力于Infer.Net,概率编程工具包,世界处理不确定性的使用机器语言的描述,而不是需要每个问题有通常的是/否电脑的答案。这就是杂波用途以分流您的收件箱。研究员约翰·威恩和他的同事们与Exchange团队工作了四年,在不同的想法,直到他们发现了一些可能“真正增加价值并不能以某种方式令人毛骨悚然或吸引消极有时候可以当你启动应用机器学习个人电子邮件。”

“然后,随着计算机视觉开始越来越多地受到机器学习的影响,(我们)吸引了该领域大量非常重要的杰出人士,他们都有一只脚在机器学习,一只脚在视觉,像安德鲁·布莱克这样的人变得非常相关,”李解释说。(布莱克现在是剑桥实验室的负责人,他在爱丁堡大学和牛津大学率先提出了关键的概率计算机视觉算法。)

几年后,当AT&T关闭贝尔实验室,许多研究人员的加盟微软。“人们谁真正考虑的神经网络和更多的统计方法开始到达现场,”李说。“这是大数据的相关性出现超时;这全波已经极大的影响力,不仅是微软内部,但在整个行业。”

然后在2009年,就在李开复加入微软前不久,他开玩笑说,一个他可能会轻易拒绝的项目帮助机器学习走出了实验室,进入了主流计算领域,这是一个“使用分层神经网络进行语音处理的不明智尝试”。

“我会说,这是完全荒谬的,我会被所有的顶级研究人员的支持下,”李坦言。取而代之的是,这项工作成为了多层“深”的神经是整个行业已经改变了语音和图像识别网络奠定了基础。

潜水深

语音识别用来指训练你的电脑来学习你的声音,或坚持一些简单的命令;现在它意味着你可以买一个新手机,并开始谈论它 - 和Windows 10将带来到您的PC。

图像识别已从时,有一个脸的照片,以一切从文本到交通信号应对斑点消失。该ImageNet基准测试识别一千对象的照片,好像认识不仅是150种不同的狗的图片也是他们的品种。“你必须区分威尔士彭布罗克和威尔士矮脚狗外套威尔士威尔士矮脚狗,其中一个具有较长的尾巴,” MSR的约翰·普拉特解释说。

这个月,一队在北京实验室微软研究人员宣布,他们的深度学习系统是第一个在基准(险胜谷歌的成就)击败未经训练的人。

这一切都归功于深度学习。这是在今天AI移动最快的地区之一;在微软 - 深学习工作在谷歌,Facebook的,在百度的先驱。

在2009年,当多伦多大学的杰夫·辛顿提议建立,将通过逐步建立了越来越多的词汇的理解(人脑使用的技术之一的大大简化版本识别图像中的图案识别语音神经网络sounds), most researchers weren’t interested. In a testament to MSR’s willingness to experiment, an intern and a graduate student of Hinton got approval to work with his researchers and try out this deep network with real data.

他们的结果不仅好了一点点;他们的准确率提高了25%。李开复指出,一旦发布,“不仅是微软,整个行业都开始使用它们。”

将机器学习普及到大众

由于微软提供它自己的机器学习工具给开发商,该公司可能享受其开拓性的工作更多的认可。“我们已在机器的问题繁多,这将是令人难以置信的强大,并满足进入更广泛的使用知识和算法和代码的宝库,”李说。

Azure的机器学习是微软如何努力做到这一点。Joseph Sirosh calls it "the fastest way to build predictive models and deploy them. All you need is a Web browser to start machine learning. It allows simple, one-click creation of APIs in the cloud and that makes the deployment easy. It’s easy to hook up a Web page, it’s easy to hook up a mobile app. That’s why I think it’s transforming how development is done.”

12 第1页
页面1的2
工资调查:结果是