• 新用户请点击注册
  • 登录
  • 找回密码
地理标签: 北京 云南 四川 河北 山东 广东 湖北 西藏 浙江 黑龙江 上海 江苏 福建 新疆 海南 河南 台湾 香港 湖南 广西 陕西 青海 安徽 辽宁 江西 山西 重庆 甘肃 吉林 澳门 贵州 内蒙古 天津 宁夏
  • 首页
  • 博客家园
  • 品汇商城
  • 我的主页

  • 推荐给朋友
  • 查看文章/图片/用户

数据挖掘文章专栏

相关专栏:

新文章
选择我的文章
我要投稿
页: 1 2
收缩 时间序列分析
  • 作者: 盒子
  • 专集:我的文章
  • 发表: 2006/10/31 10:12
  • 编辑: 2006/10/31 10:12
  • 标签:
  • 时间序列  
  • 数据挖掘  
  • 地图:
  • 星级:
  • 阅读:7779次
一、时间序列数据
1.数据类型:截面数据与时间序列数据
人们对统计数据往往可以根据其特点从两个方面来切入,以简化分析过程。一个是研究所谓横截面(cross section)数据,也就是对大体上同时,或者和时间无关的不同对象的观测值组成的数据。
另一个称为时间序列(time series),也就是由对象在不同时间的观测值形成的数据。
......
阅读全文
收缩 数据挖掘应用
  • 作者: 盒子
  • 专集:我的文章
  • 发表: 2006/10/27 12:00
  • 编辑: 2006/10/27 12:00
  • 标签:
  • 数据挖掘  
  • 应用  
  • 地图:
  • 星级:
  • 阅读:2989次
  • 回复:2

应用


数据挖掘技术可以为决策、过程控制、信息管理和查询处理等任务提供服务,一个有趣的应用范例是“尿布与啤酒”的故事。为了分析哪些商品顾客最有可能一起购买,一家名叫 WalMart的公司利用自动数据挖掘工具,对数据库中的大量数据进行分析后,意外发现,跟尿布一起购买最多的商品竟是啤酒。为什么两件风马牛不相及的商品会被人一起购买?原来,太太们常叮嘱她们的丈夫,下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了两瓶啤酒。既然尿布与啤酒一起购买的机会最多,商店就将它们摆放在一起,结果,尿布与啤酒的销售量双双增长。这里,数字挖掘技术功不可没。一般来说,数据挖掘的应用有,电信:流失;银行:聚类(细分),交叉销售;百货公司/超市:购物篮分析(关联规则);保险:细分,交叉销售,流失(原因分析);信用卡: 欺诈探测,细分;电子商务:网站日志分析;税务部门:偷漏税行为探测;警察机关:犯罪行为分析;医学:医疗保健。具体如下:
......
阅读全文
收缩 数据挖掘和知识发现的技术、方法及应用
  • 作者: 盒子
  • 专集:我的文章
  • 发表: 2006/10/27 11:56
  • 编辑: 2006/10/27 11:56
  • 标签:
  • 方法  
  • 学习  
  • 应用  
  • 知识  
  • 数据挖掘  
  • 地图:
  • 星级:
  • 阅读:1090次
  • 回复:2
概念


基于Internet的全球信息系统的发展使我们拥有了前所未有的丰富数据。大量信息在给人们带来方便的同时也带来了一大堆问题:第一是信息过量,难以消化;第二是信息真假难以辨识;第三是信息安全难以保证;第四是信息形式不一致,难以统一处理。数据丰富、知识贫乏已经成为一个典型问题。Data Mining(数据挖掘)的目的就是有效地从海量数据中提取出需要的答案,实现“数据-〉信息-〉知识-〉价值”的转变过程。
......
阅读全文
收缩 异常(Outlier)检测算法综述
  • 作者: 盒子
  • 专集:我的文章
  • 发表: 2006/10/25 09:31
  • 编辑: 2006/10/25 09:31
  • 标签:
  • 数据挖掘  
  • 异常检测  
  • 地图:
  • 星级:
  • 阅读:3945次
什么是异常(outlier)?Hawkins(1980)给出了异常的本质性的定义:异常是在数据集中与众不同的数据,使人怀疑这些数据并非随机偏差,而是产生于完全不同的机制。聚类算法对异常的定义:异常是聚类嵌于其中的背景噪声。异常检测算法对异常的定义:异常是既不属于聚类也不属于背景噪声的点。它的行为与正常的行为有显著的不同。在某个季节里,某一天的气温很高或很低,这个温度数据就是一个异常。异常检测和分析是数据挖掘中一个重要方面,也是一个非常有趣的挖掘课题。它用来发现“小的模式”(相对于聚类),即数据集中间显著不同于其它数据的对象。异常检测具有广泛的应用,如电信和信用卡欺骗、贷款审批、药物研究、医疗分析、消费者行为分析、气象预报、金融领域客户分类、网络入侵检测等 。
......
阅读全文
收缩 时间序列的动态指标分析法
  • 作者: 盒子
  • 专集:我的文章
  • 发表: 2006/10/24 14:25
  • 编辑: 2006/10/24 14:25
  • 标签:
  • 分享  
  • 学习  
  • 数据挖掘  
  • 地图:
  • 星级:
  • 阅读:1986次
一、时间序列的基本概念

(一)时间序列的概念及种类

时间序列是将同一现象在不同时间上的数值,按时间先后顺序排列而成的一种序列,如表9.1中每一列数据各自形成时间序列。
......
阅读全文
收缩 粗糙集理论介绍
  • 作者: 盒子
  • 专集:我的文章
  • 发表: 2006/10/23 13:09
  • 编辑: 2006/10/23 13:09
  • 标签:
  • 分享  
  • 学习  
  • 粗糙集  
  • 数据挖掘  
  • 地图:
  • 星级:
  • 阅读:15686次
  • 鲜花:5枝
  • 回复:2

粗糙集理论介绍
面对日益增长的数据库,人们将如何从这些浩瀚的数据中找出有用的知识?我们如何将所学到的知识去粗取精?什么是对事物的粗线条描述什么是细线条描述?


......
阅读全文
收缩 贝叶斯网路的一些介绍
  • 作者: 盒子
  • 专集:我的文章
  • 发表: 2006/10/23 11:09
  • 编辑: 2006/10/23 11:09
  • 标签:
  • 分享  
  • 学习  
  • 贝叶斯网络  
  • 数据挖掘  
  • 地图:
  • 星级:
  • 阅读:14849次
1. 贝叶斯网络是一种概率网络,它是基于概率推理的图形化网络,而贝叶斯公式则是这个概率网络的基础。贝叶斯网络是基于概率推理的数学模型,所谓概率推理就是通过一些变量的信息来获取其他的概率信息的过程,基于概率推理的贝叶斯网络(Bayesian network)是为了解决不定性和不完整性问题而提出的,它对于解决复杂设备不确定性和关联性引起的故障有很的优势,在多个领域中获得广泛应用。
......
阅读全文
收缩 数据挖掘中的基于决策树的分类方法
  • 作者: 盒子
  • 专集:我的文章
  • 发表: 2006/10/20 11:24
  • 编辑: 2006/10/20 11:24
  • 标签:
  • 分享  
  • 学习  
  • 分类  
  • 决策数  
  • 数据挖掘  
  • 地图:
  • 星级:
  • 阅读:8661次
  • 砖头:5块
  • 回复:1
1 分类的概念及分类器的评判

分类是数据挖掘中的一个重要课题。分类的目的是学会一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给定类别中的某一个。分类可用于提取描述重要数据类的模型或预测未来的数据趋势。

分类可描述如下:输入数据,或称训练集(training set)是一条条记录组成的。每一条记录包含若干条属性(attribute),组成一个特征向量。训练集的每条记录还有一个特定的类标签(类标签)与之对应。该类标签是系统的输入,通常是以往的一些经验数据。一个具体样本的形式可为样本向量:(v1,v2,…,…vn:c)。在这里vi表示字段值,c表示类别。
......
阅读全文
收缩 关联规则挖掘算法综述
  • 作者: 盒子
  • 专集:我的文章
  • 发表: 2006/10/19 09:15
  • 编辑: 2006/10/19 09:15
  • 标签:
  • 学习  
  • 关联规则  
  • 数据挖掘  
  • 算法  
  • 地图:
  • 星级:
  • 阅读:771次
转,转,转
摘 要 本文介绍了关联规则的基本概念和分类方法,列举了一些关联规则挖掘算法并简要分析了典型算法,展望了关联规则挖掘的未来研究方向。

1 引言

......
阅读全文
收缩 常见聚类策略
  • 作者: 盒子
  • 专集:我的文章
  • 发表: 2006/10/18 10:06
  • 编辑: 2006/10/18 10:06
  • 标签:
  • 策略  
  • 聚类  
  • 数据挖掘  
  • 算法  
  • 地图:
  • 星级:
  • 阅读:3938次
转转转...
常见聚类策略

同上,呵呵

......
阅读全文
页: 1 2
博博客搜索
选择标签浏览方式?
行业合作伙伴点击此处
30天热门文章
  • 这是去十度。野三坡那边
  • 从红螺寺到虹鳟鱼一条沟-周末自驾
  • 巴塞罗那
  • 好萌的照片啊
  • 石头钱包 这才是纯手工哦
  • ...更多...
  • 关于我们
  • 联系我们
  • 免责条款
  • 市场合作

博博客网 www.bbker.com 粤ICP备08011588号
深圳市东南实业有限公司 版权所有