作为一个物理学家,我最初接受的描述世界的精确公式的条款。后来,作为实验高能粒子物理学家,我学会了如何对付大量的错误和与评估竞争模型来描述数据的数据。业务数据,大量服用,往往混乱和困难是模型比对,我把我的牙齿的物理数据。简单地说,人的行为是复杂的,不一致的,并没有很好地理解,并且它受到许多变量。
如果你的目的是要预测哪些以前的客户最有可能订阅新的报价,根据历史模式,你会发现有除了那些明显的相关性不明显,还有相当多的随机性。当绘图数据和做探索性统计分析根本不解释发生了什么模型你指出,这可能是时间机器学习。
亚马逊的做法,以机器学习服务的目的是工作分析,了解正在解决的业务问题,无论他们是否不理解数据的科学和机器学习算法。正如我们所看到的,这种意图产生了不同的产品,比你会发现在界面微软Azure机器学习(点击我的审查),但结果是相似的。
使用这两种服务,你与历史数据开始,从可观察识别目标的预测,提取相关特征,喂它们到模型中,并允许系统优化模型的系数。然后你评估模型,如果它是可以接受的,你用它来作出预测。例如,银行可能要建立一个模型来预测新的信用卡收费是否合法或弄虚作假,制造商可能想建立一个模型来预测潜在客户有多少是有可能在其产品消费。
一般情况下,你接近亚马逊机器学习的第一上传和清理数据;然后创建,培训和评估的ML模型;最后通过创建批处理或实时预测。每个步骤是迭代的,因为是全过程。机器学习是不是一个简单的,静态的,神奇的子弹,即使离开了亚马逊的算法选择。