《社会科学定量分析丛书》是美国萨基出版社专为社会科学界从事定量分析的研究人员编撰的一套专著,其中每一部的作者都是相关领域的专家。这部丛书对世界社会科学界影响颇大,已被翻译成多国文字。本书从中选择了9部,定名为《社会统计方法与技术》,由上下篇组成,已飨读者。
社会调查数据以定序和定量者居多。因此,本书着重介绍了定序和定量数据的处理和统计方法。学习并掌握本书的全部内容,不仅使读者能正确熟练地应用很多统计方法,提高我国的社会定量分析水平,而且为进一步学习其他的社会统计技术铺平了道路。
社会统计方法与技术——社会统计学译丛
内容提要 :
《社会科学定量分析丛书》是美国萨基出版社专为社会科学界从事定量分析的研究人员编撰的一套专著,其中每一部的作者都是相关领域的专家。这部丛书对世界社会科学界影响颇大,已被翻译成多国文字。本书从中选择了9部,定名为《社会统计方法与技术》,由上下篇组成,已飨读者。
社会调查数据以定序和定量者居多。因此,本书着重介绍了定序和定量数据的处理和统计方法。学习并掌握本书的全部内容,不仅使读者能正确熟练地应用很多统计方法,提高我国的社会定量分析水平,而且为进一步学习其他的社会统计技术铺平了道路。 编辑推荐 :
《社会科学定量分析丛书》是美国萨基出版社专为社会科学界从事定量分析的研究人员编撰的一套专著,其中每一部的作者都是相关领域的专家。这部丛书对世界社会科学界影响颇大,已被翻译成多国文字。本书从中选择了9部,定名为《社会统计方法与技术》,由上下篇组成,已飨读者。
社会调查数据以定序和定量者居多。因此,本书着重介绍了定序和定量数据的处理和统计方法。学习并掌握本书的全部内容,不仅使读者能正确熟练地应用很多统计方法,提高我国的社会定量分析水平,而且为进一步学习其他的社会统计技术铺平了道路。 目录 :
上篇
一 定类数据分析 1 介绍 1.1 预备知识 1.2 定类变量的分析 2 卡方检验 2.1 卡方检验的解释 3 相关的量度 3.1 介绍 3.2 2×2表格的相关量度 3.3 I×J表格的相关量度法 3.4 相关量度的比较 4 多元数据分析的介绍 4.1 定类变量的因果分析 5 结论 注 释 参考文献 二 定序数据分析 简 介 1 定序量度 1.1 定序变量分析的三个问题 2 单个观测值的二元预测 2.1 总体和样本 2.2 已知自变量状态的预测 2.3 自变量状态未知的预测 2.4 V8量度 2.5 象限量度:专门应用于定序变量 2.6 科恩Kappa(Cohen's Kappa):另一种量度 2.7 定序变量预测的灵敏度分析:可靠性(信度)评估 3 成对观测值的二元预测 3.1 计算合并的定序数据 3.2 对合并定序表格的预测 3.3 合并表格的概率形式 3.4 合并定序形式的灵敏度分析 3.5 排除所有同分的预测域 3.6 排除一个变量的同分的预测域 3.7 从预测域去掉一个单元格而非一行或一列 3.8 不同预测域的比较 3.9 一致和不一致:回顾 3.10 再次标准化:肯德尔τc(Kendall's τc) 3.1l 肯德尔τ2b(Kendall's τ2b):合并表格的混合预测方法以及与 定量变量预测的类似之处 4 定量,定类和定序变量的联合预测 4.1 定量变量 4.2 定类变量和扩展形式 5 多元分析 5.1 建立三元合并表 5.2 模仿二元预测的三元预测 5.3 多元 5.4 部分 6 计算方法和统计推论 6.1 计算机软件 6.2 统计推论 6.3 小结 注 释 参考文献 三 方差分析 1 导论 2 一维方差分析:所有类别 2.1 两组比较 2.2 两组以上 3 二维方差分析,所有类别 3.1 不相关的解释变量 3.2 相关的解释变量 3.3 特殊主题 4 方差分析,定类样本 4.1 一维分析 4.2 两个解释变量 5 其他模型 5.1 混合模型(Mixed Models) 5.2 三个解释变量 5.3 拉丁方设计 5.4 嵌套设计(Nested Designs) 5.5 方差分析与回归分析 6 结论 6.1 回顾 6.2 其他论题 参考文献 四 关联的量度 1 导论 2 离散数据的抽样分布 2.1 二项分布和多项分布 2.2 列联表 3 定类数据关联的量度 3.1 以卡方统计值为基础的量度 3.1.1 皮尔逊(PEARSON)均方列联系数 3.1.2 皮尔逊(PEARSON)列联系数与斯科达(SAKODA)的修正 3.1.3 楚普洛夫(TSCHUPROW)列联系数 3.1.4 克莱姆(CRAMER)列联系数 3.2 消减预测误差比例的量度系数 3.2.1 古德曼一克鲁斯凯(GOODMAN—KRUSKAL)λ系数 3.2.2 古德曼一克鲁斯凯(GOODMAN—KRUSKAL)τ系数 3.3 一致性的量度 3.3.1 科恩(COHEN)κ系数与加权κ系数 3.3.2 科尔曼一莱特(COLEMAN-LIGHT)条件一致性量度系数 3.4 针对2 × 2列联表的特定量度系数 3.4.1 以交叉乘积比为基础的量度系数 3.4.2 以相关系数为基础的量度系数 4 量度连续(定距)数据的相关 4.1 皮尔逊(PEARSON)积矩相关系数 4.2 肯德尔(KENDALL)T系数 4.3 斯皮尔曼(SPEARMAN)秩相关系数29 5 量度定序数据的关联 5.1 初步 5.2 肯德尔(KENDALL)τb系数 5.3 与肯德尔(KENDALL)τb系数有关的量度系数 5.3.1 肯德尔一斯图尔特(KENDALL-STUART)τC系数 5.3.2 古德曼一克鲁斯凯(GOODMAN—KRUSKAL)γ系数 5.3.3 萨默斯(SOMERS)d系数 5.3.4 威尔逊(WILSON)e系数 5.3.5 总结 5.4 其他量度系数 6 选择适当的量度系数 7 相关与因果联系 注释 参考文献 五 多重回归的应用 序 导言 1 多元回归模型:复习 2 设定错误 2.1 设定错误导致的后果 2.2 设定错误举例:生活满意度 2.3 发现和处理设定错误 3 量度误差 3.1 量度误差的后果 3.2 量度误差举例:生活满意度 3.3 发现量度误差 3.4 处理量度误差 4 多元共线性 4.1 多元共线性的后果 4.2 发现高度多元共线性 4.3 多元共线性举例:生活满意度 4.4 处理多元共线性 5 非线性和不可加性 5.1 发现非线性和不可加性 5.2 处理非线性 5.3 处理不可加性 5.4 非线性和不可加性模型的注意事项 6 异方差和自相关 6.1 出现异方差和自相关的原因 6.2 异方差和自相关导致的后果 6.3 发现异方差 6.4 异方差举例:收入和租房 6.5 处理异方差和自相关 7 结束语 注 释 参考文献 下篇 一 线性概率模型、对数概率模型和正态概率模型 丛书编辑引言 1 线性概率模型 …… 2 非线性概率模型的设定 3 二项应变量正态概率模型和对数概率模型的估计 4 最小卡方估计和多项模型 5 总结和扩展 注 释 参考文献 二 回归的解释与应用 丛书编辑导言 l 导论 2 基础回归理论与社会科学实践 3 回归估计的统计性质 4 回归系数的抽样分布 5 选择一种设定 6 变量的重要性 7 结论 附录对回归一致性结果的证明 注 释 参考文献 三 时间序列分析:回归技术 1 导论 2 时间序列回归分析:非滞后的情况 3 其他备择的时变过程 4 时间序列回归分析:滞后的情况 5 预测 6 总结 附录防卫支出数据(单位:10亿美元) 注 释 参考文献 四 事件史分析法——用于纵向数据的回归分析法 丛书编辑序 l 导论 2 离散时间事件史数据分析法 3 连续时间数据的参数分析法 4 比例风险模型和部分似然估计 5 多类事件史的数据估计分析法 6 重复事件分析法 7 状态变化情况下的事件史分析法 8 结论 附录A 最大似然和部分似然 附录B GLIM、SAS和BMDP程序实例清单 附录C 计算机程序 注 释 参考文献 前言:
前言 自1979年中国社会学恢复以来,20多年过去了。在此期间,有关的科研人员进行了广泛深入的社会调查,收集了大量的数据,为定量分析提供了丰富的资料。 经调查,全国社会学系统以及其他从事社会调查的研究人员普遍认为社会统计教材匮乏,影响了中国统计水平的发展。为此,在中国社会科学院社会学研究所项目委员会的支持下,我们从美国萨基(sage)出版社出版的《社会科学定量分析丛书》中挑选了9部,翻译成中文,汇集成册,取名《社会统计方法与技术》。 《社会科学定量分析丛书》至今出版了130多部,每一部的作者都是相关领域的知名学者。该丛书在全世界影响颇大,已被翻译成多国文字,为社会统计学的普及和..
书摘:
定类变量
由一组类别组成的,表示一个潜在特性的不同表现的定类尺度。理想状态下,就某个属性而言,分配到某个类别的个体都具有某种同一性。把民主党派和共和党派相混合在“独立党派人士”分类中,将向我们传达关于他们政治行为的错误信息。另外,分类也必须是互斥的(每个个案只能属于一个类别)和完整的。 定类变量的分类可以由调查者根据其需要按任何顺序排列。正如我们看到的,对表1各列的重新排序不会丢失任何信息。相反,定序变量的分类具有某种隐含的次序:他们量度的不仅有性质上的而且有分量上的差异。比如社会地位变量的类别为(低,中,高),那么它就不能再按别的顺序来组织,如(中,低,高),否则就有可能丢失某些信息。定类变量和定序变量都属于类别变量,它们之间的差异在于定序变量的尺度包含了组间的次序关系,而定类变量则不具有这种性质。 定类变量量表可以量度真实的离散现象,比如种族或性别,但是在大多数情况它们大概表现了某种量度误差,因为其代表的潜特质或多或少表示某种定量的特质。例如,态度通常不是简单地进行正面地或反面的回答,人们总是保持他们不同程度的赞同倾向。因此,态度可以被认为是一个连续的集合,从坚定的同意到不确定,再到坚定的反对。在态度这个问题上,不能因为量度的难度而把这个潜含的丰富信息模糊化。 特别要注意,类别的数量和性质对于做出正确推理是至关重要的。在社会学和政治学的研究中,一个最大的错误就是将回答混合成很少几个类别。或许是为了方便起见,或许是因为人人如此,对数据进行二分(即把人们归类为成非此即彼)的做法从来都是错误的,不管使用了何种统计技术,粗劣的量度数据肯定会产生错误严重的结论。 因变量与自变量 大多数社会科学家认为一个人的党派认同,通常在其青年期逐渐形成,部分地决定他或她的政治偏好。在这种意义上讲,1980年的选举将由选民的政党派别决定。一个变量,依赖于另一个变量,或者由另一个变量所引起,或者暂时跟随另一个变量的变化而变化,我们称其为“因变量”。顺其自然的,这个原因变量被称为“自变量”。自变量在某一水平上的变化将引起因变量相应的变化,但是反过来,因变量的改变不会对自变量产生影响。 本书描述的一些方法只有当研究者对因变量有清楚的定义时,才可以适用。虽然其他的方法没有对因果依赖关系做出假定,但也应该仔细思考变量间存在的因果关系。把一个变量人为指定为因变量或是自变量,在某些场合 …… |