A-level 地理/AS OCR 地理/调查论文
这是一个用来寻找两个变量之间相关性统计显著性的概念。首先,需要提出一个零假设。
曼-惠特尼U检验是用来检验两个数据集之间差异的检验方法。使用临界值表,可以确定对关系的置信水平,并接受或拒绝零假设。这种统计检验方法在分析统计数据时,既有优点也有缺点。一个优点是它可以比较两个不同大小的数据集。这使得该检验更加灵活,可以应用于各种不同的数据集。其次,该检验不是基于观察值。这意味着对数据的分布没有任何假设。这对地理学来说尤其有用,因为我们收集的大部分数据将是正偏或负偏。最后,曼-惠特尼U检验使用非参数(非分组)数据。这是一个优点,因为数据的趋势无法推广,从而产生更具统计意义的结果。
然而,它也有一些缺点,一个缺点是它不能一次应用于两个以上的数据集。这是因为它是非参数数据。如果使用参数(分组)数据进行检验,就可以同时比较多个数据集。一个例子是学生的“t”检验。这是因为参数数据根据数据比例提供结果,因此可以与许多数据集进行对比。此外,随着数据集的增大,曼-惠特尼的有效性越来越低。这降低了它的有效性,因为计算变得过于冗长,需要很长时间才能完成。它还会降低结果的精确度,因为样本量越大,误差范围就越大。
总之,尽管该检验有明显的缺陷,但它仍然是观察两组数据集之间差异的一种非常有效的方法。
抽样方法
实用=本质上是安全性和可达性。例如,如果学生正在进行河流调查,他们可能会使用实用抽样方法,这意味着只研究容易到达且没有风险的区域。它可靠且实用。
随机=不像人们想象的那样随机选择一个地点或投掷一个方格,为了使用随机样本方法,需要使用计算器、网格或计算机来生成不受人为决策影响的随机统计数据。
系统=如果要研究随距离或时间变化的进展,就会使用这种方法。测量一条样带,并在样带上以规律的间隔记录数据,这样就可以观察随时间或距离的变化。例如,如果一个学生想研究沙丘演替,他可能会测量一条从海边到顶极环境(森林)的样带,并在每隔 25 米左右的地方进行测量。
分层=由 Magneto 和河流陆地完成。
最多=众数
最常见的样本数量。这是出现次数最多的样本数据。
例如:7、8、9、5、6、7、5、5、5、5、3、5、5 = 众数
来自法语单词 "la mode",意思是时尚。
当所有样本按算术顺序排列时,这是中间样本。例如 1、2、3、4、5、6、7、8、9 5 = 中位数
样本延伸的区域。
To describe the data regarding an infiltration rate statistically I would use the mean and the standard deviation as a measure of central tendency and dispersion. These two are always used together.
平均值仅仅是所有 x 值(渗透率)的总和除以 n(样本总数)
标准差比较复杂,需要使用公式;其中 x 是单个渗透率,并且
X bar is the mean of x’s (as above)
这只需在表格中列出 x 的值,并从每个值中减去 x 平均值。在下一列中,对结果进行平方。
然后将所有 (x-x 平均值) ² 的值加起来 (Σ (x-x 平均值) ²)。将此值除以 n(在本例中为 100),然后对结果进行平方根。
这些方法是最强大和最灵敏的,因为它们包含所有数据的全部值。它们不排除任何数据。然而,数据必须(几乎)呈正态分布才能使用它们。
众数和范围仅仅说明 x 的最多数值以及最小值和最大值之间的差值,这并没有太大用处,因为它忽略了大部分数据。四分位差和中位数依赖于数据行的等级顺序,而不涉及 x 值的大小,并忽略了数据集的极端值。