|
读过这本书吗?
最近在读
读过
想读
还不熟悉
|
图书城书列:
加入到博客或社交网站:
|
|
我来评论这本书:
内容提要:
本书介绍数据挖掘的基本理论与实践方法。主要内容包括:各种模型(决策树,关联规则、线性模型、聚类、贝叶斯网以及神经网络)以及在实践中的运用,所存任缺陷的分析。安全地清理数据集、建立以及评估模型的预测质量的方法,并且提供了一个公开的数据挖掘工作平台Weka。Weka系统拥有进行数据挖掘仟务的图形用户界面,有助于理解模型,是一个实用并且深受欢迎的工具。
本书逻辑严密、内容翔实、极富实践性,适合作为高等学校本科生或研究生的教材,也可供相关技术人员参考。 喜欢读"这本书"的人也喜欢:
作者简介:
Ian H.Witten,新西兰怀卡托大学计算机科学系教授,ACM和新西兰皇(IFIP)颁发的Namur奖项。他的著作包括《Managing Gigabytes:Compressing and Indexing Documents and Images》、《How to Build a Digital Library》以及众多的期刊和学会文章。
编辑推荐:
正如所有受到商业注目的新兴技术一样,数据挖掘的运用也是极其多样化的。言过其实的报导声称可以建立算法,在数据的海洋里发现秘密。但事实上机器学习中没有魔术,没有隐藏的力量,没有炼金术。有的只是一些可以将有用的信息从原始数据中提炼出来的清晰明了的实用技术。本书叙述了这些技术并展示了它们是如何工作的。
本书对1999年的初版做了重大的改动。虽说核心概念没有变化,但本书做了更新,反映出过去五年的变化。本书提供了机器学习理论概念的完整基础,此外还对实际工作中应用的相关工具和技术提了一些建议。 本书介绍数据挖掘的基本理论与实践方法。主要内容包括:各种模型(决策树、关联规则、线性模型、聚类、贝叶斯网以及神经网络)以及在实践中的运用,所存在缺陷的分析。安全地清理数据集、建立以及评估模型的预测质量的方法,并且提供了一个公开的数据挖掘工作平台Weka。Weka系统拥有进行数据挖掘任务的图形用户界面,有助于理解模型,是一个实用并且深受欢迎的工具。 本书逻辑严密、内容翔实、极富实践性,适合作为高等学校本科生或研究生的教材,也可供相关技术人员参考。 目录:
出版者的话
专家指导委员会 译者序 中文版前言 序 前言 第一部分 机器学习工具与技术 第1章 绪论 1.l 数据挖掘和机器学习 l.2 简单的例子:天气问题和其他 l.3 应用领域- 1.4 机器学习和统计学 1.5 用于搜索的概括 l.6 数据挖掘和道德 1.7 补允读物 第2章 输入概念、实例和属性 2.1 概念 2.2 样本 2.3 属性 2.4 输入准备 2.5 补充读物 第3章 输出:知识表达 3.1 决策表 3.2 决策树 3.3 分类规则 3.4 关联规则 3.5 包含例外的规则 3.6 包含关系的规则 3.7 数值预测树 3.8 基于实例的表达 3.9 聚类 3.10 补充读物 第4章 算法基本方法 4.1 推断基本规则 4.2 统计建模 4.3 分治法:创建决策树 4.4 覆盖算法:建立规则 4.5 挖掘关联规州 4.6 线性模型 4.7 基于实例的学习 4.8 聚类 4.9 补充读物 第5章 可信度:评估机器学习结果 5.1 训练和测试 5.2 预测性能 5.3 交叉验证 5.4 其他估计法 5.5 可信度:评估机器学习结果 5.6 预测概率 5.7 计算成本 5.8 评估数值预测 5.9 最短描述长度原理 5.10 聚类方法中应用MDL原理 5.1l 补充读物 第6章 实现:真正的机器学习方案 …… 第7章 转换:处理输入和输出 第8章 继续扩展和应用 第9章 Weka简介 第10章 Explorer界面 第1l章 Knowledge Flow界面 第12章 Experimenter界面 第13章 命令行界面 第14章 嵌入式机器学习 第15章 编写新学习方案 参考文献 索引 译者序:
无论是数字化管理的需要还是后工业化进程的要求,都使我们日益面对以前无法想像的海量数据。大型消费品公司和商场的市场部门、信用卡公司日复一日地面对如山的销售数据,绞尽脑汁地挖掘其中潜在的市场信号,工业企业的质管部门则需要正确读懂源源不断的质量情况波动报表。毫无疑问,理解乃至最终能够利用这些数据,是值得认真对待的问题。.
本书由新西兰怀卡托大学计算机科学系的Ian H.Witten和Eibe Frank两位专家集多年的研究和教学成果精心撰写而成。本书(1999年初版)以及配套的Weka软件一直受到全世界读者和用户的好评。2004年,Witten教授荣获了国际信息处理研究协会(IFIP)颁发的Namur奖项,这是..
前言:
计算和通讯的结合建立了一个以信息为源的新领域。但绝大多数信息尚处于它的原始状态:数据。假如数据被定性为记录下的事实,那么信息就是构成数据基础的一系列模式或期望。在数据库中有大量信息被锁定,即那些具有潜在重要性,但尚未被发现和表达出来的信息。我们的任务就是要将它们揭示出来。.
数据挖掘是将隐含的、尚不为人所知的,同时又是潜在有用的信息从数据中提取出来,建立计算机程序,自动在数据库中细察,以发现规律或者模式。假如有明显的模式被发现,将可能被归纳以对未来的数据做出准确的预测。当然,问题还是会有的,许多模式可能是陈腐或是没有意义的。另有一些是虚假的,是由于某些具体数据..
序言:
技术的发展让我们能够捕获和存储大量的数据。在这些数据集中寻找模式、趋势和异常之处,并且以简单的数量模型归纳之,是当今信息时代的巨大挑战之一——将数据转化为信息,将信息转化为知识。.
数据挖掘和机器学习已获得了令人瞠目结舌的进步。统计学、机器学习、信息理论以及计算技术的有机结合,创建了一门具备坚实数学基础和强大工具的完备科学。Witten和Frank在本书中展示了这个进展的许多方面,辅之以关键算法的实现。因此,这是数据挖掘、数据分析、信息理论以及机器学习多方结合的一个里程碑。如果你在过去的十年里未能追随这个领域(的进步),本书是赶上这个激动人心的进展的绝好机会。如果你一直与该..
|