欢迎访问有用文档网!

当前位置: 有用文档网 > 述职报告 >

商务智能实验报告

| 浏览次数:

 《数据挖掘与商务智能实验》 实 验 报 告 实验题目:数据挖掘得基本数据分析

  姓名:王俊

  学号:2

 指导教师: 张大斌

  实验时间:201611、10

  2016 年 11 月 10 日

 实验题纲: 一、 实验目得 1)

 熟悉基本数据分析得处理流程。

 2)

 进一步熟练掌握拍 SPSS Modeler 工具得操作。

 二、 实验内容 内容一: : 数据得质量探索

 步骤 1 建立数据流 1) 在“源”中通过拖入“Statistics”文件节点读入 Telephone、sav数据。

 2) 建立“类型”节点,并说明各个变量角色。这里指定“流失”为目标变量。

 3)

 选择“输出”选项卡中“数据审核”节点并将其连接到数据流得恰当位置,点击鼠标右键,在“质量”选项卡下,选择检测方法为平均值得标准差。

  步骤 2 结果输出 实验结果输出如图所示。

 图中蓝色部分表示输出变量取 YES,即客户流失得样本数,可以瞧出,各个变量上流失客户得取值均不同。

 内容二: : 基本描述分析

  这里分析得目标就是对电信客户数据得基本服务、开通月数、免费部分与无线费用之间得相关系数以反映变量之间得相互关系。

 步骤 1 建立数据流 选择“输出”选项卡中得“统计量”节点。

 步骤 2 设置相关参数

  1)

 双击“统计量”节点,进行相应得设置。在“检查”框中添加开通月数、基本费用、免费部分与无线费用。

 2)

 在“相关”框中添加年龄、收入与家庭人数。如图所示。

 3)在“相关设置”中,勾选“按重要性定义相关强度”。如图所示。

  计算结果如图所示。可以瞧出,以“基本费用”为例,它与“年龄”与“收入”都有相关性,它们之间简单相关系数虽然为 0、401 与 0、195,但从统计量得角度来瞧有 95%以上得把握认为它们之间就是非 0 相关。“基本费用”与“家庭人数”呈负弱相关。

 内容三: : 绘制散点图

 数值之间变量得相关性可以采用上一个实验,也可以通过散点图来直接观察,此次主要观察基本费用与年龄之间得相关性。

 步骤 1 构建数据流 选择“图形”选项卡中得“图”节点。

 步骤 2 设置相关参数 1)

 双击“图”节点,选择编辑菜单,进行参数窗口得设置。

 2)

 在“X 字段”与“Y”字段框中分别选择“基本费用”与“年龄”。在“交叠字段”下,选择“颜色”-“流失”,不同颜色表示流失量不同取值得样本点。如图所示“图”节点得参数设置窗口。

  输出得结果如图所示。

  内容四: : 两分类变量相关性得研究

 两分类变量相关性研究可以从图形分析入手,然后采用数值分析得方法。下面采用网状图分析。

 步骤 1 设置相关参数 选择图形中得网络节点,进入编辑状态,在“字段”下选择“套餐类型”与“流失”。设置线值为“绝对值”。

  步骤 2 结果输出 可以由结果图中得到,其电信客户保持就是最好得,结果输出如图所示。

  内容五: : 变量中重要性分析

 步骤 1 窗口设置 选择“模型”选项卡中得“特征选择”节点,将其连接到数据流得恰当位置,点击鼠标右键,选择弹出菜单中得编辑窗口,将“流失”添加到目标选项中,其她得全部添入输入,具体操作如图所示

  步骤 2 结果输出 由结果输出可以瞧出,开通月数、基本费用、电子支付、年龄、受教育程度、套餐类型、收入以及各种费用等变量对预测用户就是否流失很重要,其她得变量则意义不大,结果输出如图所示

 三、 实验步骤与结果

 实验步骤与结果见实验内容 四、 实验分 析与扩展练习

 实验分析: 本次实验通过对数据质量、基本描述、散点图、相关性、重要性五个方面进行内容分析,比较全面地了解了该数据得相关信息,并得到了相应得结 果。请总结

 析以下问题: (1)针对上述案例,分析保存客户与流失客户得基本费用就是否存在显著得差异。

 (2)如何评价数据质量?相关性与重要性有何区别? 答:(1)根据分析客户流失得样本数得比例(灰色为流失)

 然后分析基本费用与流失之间得关系,通过建立统计量与绘制散点图

  最后比较重要度可以得出结论:保存客户与流失客户得基本费用存在显著性差异

 (2)数据质量就是保证数据应用得基础,它得评估标准主要包括四个方面,完整性、相关性、一致性、及时性。评估数据就是否达到预期设定得质量要求,就可以通过这四个方面来进行判断。

 相关性:高质量得数据应该就是能充分满足用户使用要求得数据,即数据源与要

 处理得业务具有很强得联系; 重要性:数据有很大价值与影响得性质,能为数据处理提供很多方便 2. 扩展练习 (1)针对上述得五个内容,分别更改一些参数,观察就是否对结果造成影响 答:内容一:更改“数据审核”中得部分参数,结果如下

 左边就是没有更改,右边就是更改后得,该系数更改无明显变化 五、结论与讨论(重点)

  通过这次实验,我了解到数据分析就是数据挖掘中很重要得一部分,数据分析得目得就是把隐没在一大批瞧来杂乱无章得数据中得信息集中与提炼出来,以找出所研究对象得内在规律。数据分析就是组织有目得地收集数据、分析数据,使之成为信息得过程。

  分析数据得时候不要盲目,首先要确定您要分析得方向,以更直观得方式表现出来,然后从所得得数据了解这些数据背后所代表得就是什么,我们可以以其她方式更好得体现出来吗?怎么数据说话能更直观表明问题?

 数据分析得步骤: 1、探索性数据分析,当数据刚取得时,可能杂乱无章,瞧不出规律,通过作图、造表、用各种形式得方程拟合,计算某些特征量等手段探索规律性得可能形式,即往什么方向与用何种方式去寻找与揭示隐含在数据中得规律性。

 2、模型选定分析,在探索性分析得基础上提出一类或几类可能得模型,然后通过进一步得分析从中挑选一定得模型。

 3、推断分析,通常使用数理统计方法对所定模型或估计得可靠程度与精确程度作出推断。

推荐访问:实验 智能 报告

热门排行Top Ranking

弦振动实验报告

弦振动得研究 一、实验目得 1、观察固定均匀弦振动共振干涉形成驻波时得波形,加深驻波得认识。 2、了

宣传委员述职报告12020 幼儿园党支部宣传委员述职报告

下面是小编为大家精心整理的宣传委员述职报告12020幼儿园党支部宣传委员述职报告文章,供大家阅读参考。宣传委员述

党建工作现场述职会上讲话 公安局长在党建工作现场会上的讲话

下面是小编为大家精心整理的党建工作现场述职会上讲话公安局长在党建工作现场会上的讲话文章,供大家阅读参考。党建工作现场

支部宣传委员述职述廉报告范例 幼儿园党支部宣传委员述职报告

下面是小编为大家精心整理的支部宣传委员述职述廉报告范例幼儿园党支部宣传委员述职报告文章,供大家阅读参考。支部宣传

政治生态评估报告5篇

可能会捆绑住经办人员的手脚,不利于业务工作的开展。致使个别中层干部主体责任压力传导出现能量损耗;个别

2021年领导述职报告合集2020 县领导述职报告

下面是小编为大家精心整理的2021年领导述职报告合集2020县领导述职报告文章,供大家阅读参考。2

工商局监察室主任述职述廉报告

工商局监察室主任述职述廉报告 第一篇:工商局监察室主任述职述廉报告 我叫haoword,中共党员,现

党支部书记个人述职报告 对村党支部书记述职报告的点评

下面是小编为大家精心整理的党支部书记个人述职报告对村党支部书记述职报告的点评文章,供大家阅读参考。党支部书记个人

结合乡村振兴战略人才工作述职报告 乡村振兴工作员年度述职

下面是小编为大家精心整理的结合乡村振兴战略人才工作述职报告乡村振兴工作员年度述职文章,供大家阅读参考。结合

财务分析课程报告4篇

财务分析课程报告4篇财务分析课程报告篇1一年来,在领导和同事们的的支持帮助和指导下,加上自身的不断努

个人安全生产履职报告[安全生产述职报告] 党委书记安全生产履职报告

下面是小编为大家精心整理的个人安全生产履职报告[安全生产述职报告]党委书记安全生产履职报告文章,供大家阅读参

企业年度工作总结报告范文13篇

企业年度工作总结报告范文13篇企业年度工作总结报告范文篇1时光飞逝,转眼已经毕业一年了,我顺利地完成