数据科学:入门/像统计学家一样思考
首先,请在维基教科书上注册自己(并在下面列出自己),以便我们知道我们的共同贡献者是谁。此外,请遵守维基教科书的编辑指南、风格手册和政策和指南。谢谢。
其次,我们每个章节只需要基本、清晰、直接的信息。我们不是试图面面俱到或完整——这本书的价值在于对不同学科的简单综合。在其他地方可以更详尽地阐述某个特定主题的深度和复杂性。在做出贡献时,请将自己置于“初学者的心态”。请同时控制每个章节的范围,以便在一个小时的课堂时间内讲授。如果该章节需要超过一小时来讲授,可能过于详细。
- 在尽可能的情况下,请按照维基百科和维基词典中的定义使用术语和概念。这样,学生就可以参考相应的维基百科/维基词典页面,以更深入地理解概念。
第三,这是一本跨学科的书。我们希望帮助人们将数据科学应用于所有领域。因此,我们需要各种各样的简单示例和简单练习。
第四,请遵循每个章节的简单结构:主要要点总结、讨论、更多阅读、练习和参考文献。我们希望“更多阅读”部分链接到在线资源。参考文献部分可以包含离线资源。要开始新页面,您应该使用来自**此原型页面**的维基标记。
第五,与任何维基教科书一样,请随时进行更正、扩展解释并根据需要添加内容,即使这不是“您的”章节。使用讨论页面解释可能引起争议的更改。
第六,一些语法规则
- 请**加粗**学生应该学习的关键术语和短语。
- 使用“代码”标签将函数和代码片段的名称括起来:
<code>lm()</code>
- 使用内联链接
[[ ]]
指向维基百科、维基词典、维基共享资源、维基教科书和其他维基媒体基金会属性。 - 使用引用(<ref> </ref>)指向“外部”资源——包括在线和离线资源。
- 如果您想添加图像或图表,应该将其加载到维基共享资源中,而不是上传到维基教科书中。
- 如果适用,在上传图表时添加标签
{{Created with R}}
)。
- 如果适用,在上传图表时添加标签
- 如果使用与**R**标准包不同的包,请在每个函数后用括号加粗包的名称:<code>MCMCprobit()</code> ('''MCMCpack''')
- 您可以使用第三章数据的定义作为如何编写章节的示例。
最后,非常感谢您自愿加入我们的团队!
章节摘要
[edit | edit source]当数据科学家像统计学家一样思考时,他们会从变量的角度思考。任务是了解与问题及其解决方案相关的变量的集中趋势、分布、相关性和聚类。
讨论
[edit | edit source]作业/练习
[edit | edit source]这是跨越四个章节的项目#2。组建 3 人或 4 人的小组。三人小组的成员可能与项目#1 的小组成员不同。四人小组中最多只能有两名学生重复参加项目#1 的小组。该小组将共同完成整个项目。
- 复制伽利略的“斜面”实验。首先设计研究并写下您的计划。列出所需材料,指定要使用的方法,确定要测量的变量,创建数据记录表等。
- 根据设计进行实验。拍照。记录您的数据结果。
- 将数据输入 R。使用 R 生成数据表和绘制数据图。看看是否可以在您的数据图上绘制伽利略试图发现的理论曲线。
- 准备一个幻灯片演示文稿,其中包括对方法的描述、设备的图片、原始数据的表格、分析结果的表格、结果的图表、该小组在该项目的过程中自己学习到的有关数据科学的几件事的列表。
注意:您的小组可以专门负责某些任务,但每个人都需要参与作业的所有阶段。此外,到目前为止涵盖的章节不会教您完成此作业所需的一切。请尽力利用您所知道的知识。此作业不仅仅是为了向讲师展示您已经学习了多少个以前的章节,而且该作业本身也是一个学习体验。该作业旨在让学生发现章节中未包含的知识。
更多阅读
[edit | edit source]- Huff, Darrell (1991) [1954]. 如何用统计数据撒谎 (新版 ed.). 纽约: 企鹅。 ISBN 0-14-013629-0.
{{cite book}}
:|edition=
has extra text (help) - Best, Joel (2001). 该死的谎言和统计数据:从媒体、政客和活动家那里解开数字的谜团. 加州伯克利: 加州大学出版社。 ISBN 0520219783.
参考文献
[edit | edit source]版权声明
[edit | edit source]您是自由的
- 要**分享**——复制、分发、展示和表演作品(来自此维基的页面)
- 要**重新混合**——改编或创作衍生作品
在以下条件下
- **署名**——您必须将此作品归功于维基教科书。您不能暗示维基教科书以任何方式认可您或您对该作品的使用。
- **相同方式共享**——如果您更改、转换或构建此作品,您只能在与本许可证相同或相似的许可证下分发由此产生的作品。
- **放弃**——如果您获得版权持有者的许可,可以放弃上述任何条件。
- **公有领域**——如果作品或其任何部分根据适用法律属于公有领域,则该状态不受许可证的影响。
- **其他权利**——许可证不会以任何方式影响以下任何权利
- 您的公平交易或合理使用权,或其他适用的版权例外和限制;
- 作者的道德权利;
- 其他人可能拥有的与作品本身或作品的使用方式相关的权利,例如宣传权或隐私权。
- **通知**——对于任何再利用或分发,您必须向其他人明确说明此作品的许可条款。最好的方法是链接到以下网页。