各种形式的数据挖掘逐渐成为商业运作的一个主要组成部分。目前几乎所有的商业过程都涉及某种形式的数据挖掘。
成本效率,客观理性,可维护性,软件集成,人类工程学,商业过程再建等问题都是数据挖掘成功应用的重要考虑因素。
商业环境中的数据挖掘可以定义为:通过自动分析公司的数据来生成可操作的模型。要在商业环境中使用,数据挖掘必须考虑经济效益,必须有助于实现公司的核心目标。关键是找出可操作的信息,或可以用某种具体的方式提高公司效益的信息。
数据挖掘不能代替精通业务的商业分析人员或者科学家,但为他们提供了强大的新工具,并支持跨学科团队改进其工作。
在数据挖掘过程中的所有阶段中,一个核心需求是理解,协调所有团队成员,并使他们能够成功的协同合作。只有把数据挖掘专家与组织领域专家的经验结合起来,才能得到数据挖掘的最佳结果。
把某个数据挖掘应用引入组织,必须满足如下条件:
1. 必须有一个明确的问题定义
2. 数据必须是可用的
3. 数据必须是相关的,适当的,干净的
4.应不能仅通过一般的查询或者OLAP工具来解决问题
5.结果必须是可操作的
数据挖掘项目的成功与否,与满足上面的条件息息相关。
在商业角度看,数据挖掘过程的初始阶段是非常重要的,它要求理解项目目标和商业需求再把它们转换为一个数据挖掘问题的含义,并作出一个达到该目标的初步计划。
数据挖掘人员的第一个目标是从商业的角度全面理解客户希望达到的目标。并适当的平衡客户的许多互相矛盾的目标和限制条件。同时要找出可能影响项目结果的重要因素。
数据挖掘过程的模型应助于列举每个阶段要执行的操作来计划,完成给定的项目并降低项目成本。
数据挖掘要明确商业目标,精确的阐述团队要解决的问题,简明扼要的描述通常会得到的最好结果。