一、提高整个数据科学团队的工作效率
1、在拖放式视觉界面中加速并自动创建预测模型
2、超过1500种 算法和功能的丰富库可确保针对任何用例提供最佳模型
3、针对常见用例的预制模板,包括客户流失,预测性维护,欺诈检测等
4、“群众智慧”在每个步骤均提供主动建议,以帮助初学者
二、连接到任何数据源
1、立即建立指向数据库,企业数据仓库,数据湖,云存储,业务应用程序和社交媒体的点击连接
2、随时轻松重用连接,并轻松与需要访问的任何人共享连接
3、通过RapidMiner市场扩展连接到新资源
三、自动化的数据库内处理
1、查询和检索数据而无需编写复杂的SQL
2、利用高度可扩展的数据库集群的强大功能
3、支持MySQL,PostgreSQL和Google BigQuery
四、数据可视化与探索
1、通过散点图,直方图,折线图,平行坐标,箱形图等了解模式,趋势和分布
2、快速查找并修复常见的数据质量问题,包括缺失值和异常值
3、使用强大的统计概述和30多种交互式可视化视图来探索数据
五、数据准备和混合
1、RapidMiner Turbo Prep 提供了完全交互式的点+单击数据准备体验
2、跨任意数量的源提取,合并,过滤和分组数据
3、创建可计划和共享的可重复数据准备和ETL过程
六、视觉与自动化机器学习
1、RapidMiner自动模型 使用自动机器学习在5次点击中创建模型
2、从数百种有监督和无监督的机器学习算法中进行选择
3、实施基本和高级ML技术,包括回归,聚类,时间序列,文本分析和深度学习
4、建立模型以对诸如成本之类的约束敏感,以针对您所需的业务影响优化预测
5、同时使用自动和手动特征工程来优化模型准确性
七、模型验证
1、通过独特的方法消除过拟合,该方法可防止模型训练的预处理数据泄漏到模型的应用程序中
2、只需单击一下鼠标,即可将经过验证的技术(例如交叉验证)添加到模型中
八、可解释的模型不是黑匣子
1、记录了数据准备,建模和验证过程中的每个步骤,以确保完全透明
2、视觉很容易向组织中的其他人解释,以赢得部署支持
3、支持本地可解释模型不可知论解(LIME)框架
九、从R&Python代码获得更多
1、将基于代码的模型和包含代码的模型部署到可扩展的平台中
2、通过将代码段上传到RapidMiner存储库中,以简化可视化工作流设计器,从而消除重复的工作并确保其他人重复使用您的工作
3、通过建立在专业且先进的库之上,并使用RapidMiner将其提供给您的团队中的其他成员,从而利用充满活力的Python生态系统
4、利用其他人产生的数据准备和ETL管道
十、灵活的评分和模型操作
1、快速将计分的数据部署到电子表格和数据可视化工具,或使用RapidMiner Server将模型转换为生产Web服务
2、RapidMiner模型操作 为不那么高级的用户提供了一种简便的方法,使其可以将模型投入生产并正确管理它们
3、与企业调度工具集成
4、添加 RapidMiner实时评分, 以应对高交易量/低延迟的用例
十一、自动化与过程控制
1、使用流程控制操作员创建重复和循环任务,分支流和访问系统资源的工作流
2、支持用于自定义集成和自动机的多种脚本语言
3、安排流程
十二、开放,可扩展
1、使用R和Python代码和库来扩展RapidMiner
2、通过Github上的RapidMiner Python库将RapidMiner与Python集成
3、通过RapidMiner市场下载RapidMiner,我们的合作伙伴和社区提供的新功能
4、通过其灵活的扩展机制为RapidMiner添加新功能
5、RapidMiner Studio开放式内核已获得 AGPL许可