从 Unix 命令行进行临时数据分析
外观
临时数据分析
从 Unix 命令行
曾经,我和一位同事一起工作,他需要进行一些快速的数据分析来掌握问题的范围。他正在考虑将数据导入数据库或编写程序来解析和汇总这些数据。这两种选择都需要至少几个小时,甚至几天。我在他的白板上写了这些:
- 你的朋友:cat、find、grep、wc、cut、sort、uniq
这些简单的命令可以组合起来,快速回答大多数人会求助于数据库的问题,如果数据已经存在于数据库中。你可以快速(通常在几秒钟内)形成和检验关于几乎任何记录导向数据源的假设。
您已登录到某个版本的 Unix 盒子,并运行了一些基本命令,例如ls和cd和cat. 如果你不知道ls命令的作用,你需要一个比我在这里给出的更基本的 Unix 简介。