CRM系统的数据挖掘工具,是CRM系统进行完美的客户关系管理和帮助企业从客户关系管理中持续盈利的关键,了解CRM系统的数据挖掘工具对于企业CRM系统选型有重要意义。
对于CRM系统数据挖掘工具,企业首先建立两种观念:
第一,没有最好的工具,更确切地说,没有适合所有人的最好的CRM系统数据挖掘工具。
第二,最有用的CRM系统数据挖掘工具,是那些能够满足企业所需要的绝大多数数据挖掘任务的工具。
那么,CRM系统数据挖掘工具能够挖成的绝大多数数据挖掘任务是什么?也就是说,企业在选择CRM系统是,需要CRM系统中的数据挖掘工具满足哪些要求呢?
过去,CRM系统的数据挖掘工具的开发主要侧重于提供强大的分析算法上。但是,分析“引擎”只能完成数据挖掘项目中的一小部分任务。
大多数数据挖掘人员都明白,CRM系统数据挖掘项目中70%到90%的工作是做数据准备。在数据挖掘工具的演进过程中,数据准备功能的开发一直被放在次要位置上。最后,你要能够对模型准确评估,才能比较多个模型,并将它们推荐给市场人员。常见的数据准备任务包括:进行数据评估,以判别出缺失值、孤立点、共线性和相关性;给定变量多个编码的出现频率;合并多个数据集;从不同输入格式到通用分析格式的元数据(字段的名称和类型)映射;将类似变量的值变换为通用格式;某些算法对输入变量有特殊要求,需要将数值型变量变换为类别型(通过数据分箱和分类),或者将类别型变换为数值型;将变量值切分为多个字段,或将多个字段合并为一个字段;从现有变量中派生新变量。大多应用CRM系统的数据挖掘人员发现,有些最具有预测能力的变量,正是派生出来的变量。
大多CRM系统数据挖掘工具会把这些数据挖掘功能放在次要的地位,本文则会侧重评估常见数据挖掘工具处理这些任务的能力。
除了能支持以上的数据准备任务,一个好的CRM系统数据挖掘工具还应该包含模型评估的功能,以便比较建模过程中产生的多个模型,并用于支持直效营销。那么,CRM系统模型评估工具应当具有哪些要求呢?
在分析理论中,最好的模型是具有最佳精度的模型,可以准确预测出目标变量的类别,同时在验证数据集上也能表现稳定。这就是说,在预测中我们要考虑响应目标和非响应目标的组合精度。这种方法称为全局精度方法。大多数据挖掘工具使用这种方法来确定“最佳”模型。全局精度评估方法的背后有一个前提假设,就是各种分类错误的代价是相同的。这种方法在课堂上表现不错,但在实际的CRM系统数据挖掘应用上则可能存在问题,特别是在那些用于直邮营销的应用上。实际上,这也是过去很多用CRM系统来支持直邮营销而未能产生明显商业价值的一个主要原因。对模型的评估有一些主要原则,而其中只有一部分是营销部门真正关心的:最大化目标客户的响应率,最小化所需成本。大多数据挖掘工具都把注意力集中在预测的组合精度上,却完全忽略了成本的因素。这就是CRM系统的数据挖掘评估模型的美中不足之处,企业在实际应用中需要注意!