跳转至内容

数据科学:导论/像程序员一样思考

来自Wikibooks,开放世界中的开放书籍


第 08 章:像程序员一样思考



贡献者须知(章节完成后删除此部分)

[编辑 | 编辑源代码]

首先,请您在维基教科书注册(并在下面列出您的信息),以便我们了解我们的共同贡献者。此外,请遵守维基教科书的编辑指南风格手册政策和指南。谢谢。

其次,我们每个章节只需要基本、清晰、直接的信息。我们不是试图做到详尽或全面——本书的价值在于跨学科的简单综合。还有其他途径可以详细阐述特定主题的深度和复杂性。在做出贡献时,请保持“初学者心态”。同时,请限定每个章节的范围,使其可以在一小时的课堂时间内讲授。如果一个章节需要超过一小时才能讲授,那它可能过于详细。

  • 在可能的情况下,请按照维基百科和维基词典中定义的方式使用术语和概念。这样,学生就可以参考相应的维基百科/维基词典页面,更深入地理解该概念。

第三,这是一本跨学科的书。我们希望帮助人们将数据科学应用于所有领域。因此,我们需要各种各样的简单示例和简单练习。

第四,请遵循每个章节的简单结构:要点总结、讨论、更多阅读、练习和参考文献。我们希望“更多阅读”部分链接到在线资源。“参考文献”部分可能包含离线资源。要开始一个新页面,您应该使用来自此原型页面的维基标记。

第五,与任何维基教科书一样,请随时进行更正、扩展解释并在必要时进行添加,即使它不是“您”的章节。使用讨论页面来解释可能存在争议的更改。

第六,一些语法规则

  • 请将学生应该学习的关键术语和短语加粗
  • 使用“代码”标签放置函数和代码片段的名称:<code>lm()</code>
  • 使用内联链接 [[ ]]链接到维基百科、维基词典、维基共享资源、维基教科书和其他维基媒体基金会属性。
  • 使用参考文献(<ref> </ref>)链接到“外部”来源——包括在线和离线资源。
  • 如果要添加图像或图表,您应该将其加载到维基共享资源中,而不是上传到维基教科书。
    • 如果合适,在上传图表时添加标签{{Created with R}}
  • 如果使用R标准包以外的其他包,请在每个函数后用括号将包名称加粗:<code>MCMCprobit()</code> ('''MCMCpack''')
  • 您可以使用第三章数据定义作为如何编写章节的示例。

最后,非常感谢您自愿加入我们的团队!

章节总结

[编辑 | 编辑源代码]

作业/练习

[编辑 | 编辑源代码]

这是跨越两个章节的项目#1。组建3-4人的小组。这个小组将一起完成整个项目。

  1. 作为一个小组,查看人口普查网站上的几个数据集。共同选择一个表格并下载它。选择表格的一个子集进行分析。
  2. 将数据输入R。使用R生成数据的表格和绘制图表。识别任何有趣的结果。
  3. 准备一个幻灯片演示文稿,其中包括方法描述、结果表、结果图表或绘图、重要发现以及小组在此项目过程中独立学习的关于数据科学的几件事的列表。

注意:您的小组可以专门负责某些任务,但每个人都需要参与作业的所有阶段。此外,到目前为止涵盖的章节并没有教你完成此作业所需的所有知识。请尽你所能利用你所知道的知识。此作业的目的不仅仅是向讲师展示你学习了前面章节的多少内容,它本身也是一个学习体验。此作业旨在让学生发现章节中未包含的知识。

更多阅读

[编辑 | 编辑源代码]

参考文献

[编辑 | 编辑源代码]
[编辑 | 编辑源代码]

您可以自由

  • 共享——复制、分发、展示和表演作品(此维基中的页面)
  • 混搭——改编或创作衍生作品

在以下条件下

  • 署名——您必须将此作品归因于维基教科书。您不得暗示维基教科书以任何方式认可您或您对本作品的使用。
  • 相同方式共享——如果您更改、转换或构建此作品,您只能在与本许可证相同或类似的许可证下分发由此产生的作品。
  • 放弃——如果您获得版权持有人的许可,则可以放弃上述任何条件。
  • 公共领域——如果作品或其任何部分根据适用法律属于公共领域,则许可证不会以任何方式影响其状态。
  • 其他权利——许可证不会以任何方式影响以下任何权利
  • 您的合理使用权或其他适用的版权例外和限制;
  • 作者的署名权;
  • 其他人可能对作品本身或作品的使用方式拥有的权利,例如宣传权或隐私权。
  • 通知——对于任何再使用或分发,您必须向其他人明确说明此作品的许可条款。执行此操作的最佳方法是链接到以下网页。
http://creativecommons.org/licenses/by-nc-sa/3.0/
华夏公益教科书