跳转到内容

情报强化/证明

来自维基教科书,开放的书籍,为一个开放的世界

情报强化
介绍 | 信息筛选 | 信息把握
信息评估 | 信息发明 | 信息利用

不同级别的证明

[编辑 | 编辑源代码]

存在着许多不同级别的证明。有些人倾向于将一切都视为证明,而另一些人则什么都不认为是证明。拥有良好的判断能力,以决定什么构成一个好的证明,是高智商的明显标志。一个对科学证明一无所知的人,无法识破伪科学的证明,因此可能会四处走动,相信不真实的事情。智商的一个衡量标准是,一个人对现实的模型与现实本身之间的对应关系。

科学证明

[编辑 | 编辑源代码]

科学方法的要素

[编辑 | 编辑源代码]

以上是假设演绎法,它包括在第一步和第四步中的观察。每个步骤都可能存在错误,因此要进行同行评审

科学方法依赖于对调查对象的仔细表征。(主题也可以被称为问题未知。)例如,本杰明·富兰克林正确地将圣埃尔摩之火描述为电气性质,但要确定这一点需要一系列的实验和理论。在寻找主题的相关属性时,这种仔细的思考可能也需要一些定义和观察;观察通常需要仔细的测量和/或计数。

对相关数量进行系统、仔细的测量或计数收集,通常是像炼金术这样的伪科学与像化学这样的科学之间的关键区别。进行的科学测量通常会被制成表格、图表或地图,并对它们进行统计处理,例如相关性和回归。测量可以在受控的环境(例如实验室)中进行,或者在或多或少难以触及或无法操作的对象(例如恒星或人口)上进行。测量通常需要专门的科学仪器,例如温度计、分光镜或电压计,科学领域的进步通常与其发明和发展密切相关。

测量需要对相关数量使用操作定义。也就是说,科学数量的描述或定义方式是通过如何测量它来进行的,而不是通过一些更模糊、不精确或“理想化”的定义。例如,用安培测量的电流,可以在操作上定义为在一定时间内沉积在电化学设备电极上的银的质量,该设备在某些细节上有所描述。事物的操作定义通常依赖于与标准的比较: “质量”的操作定义最终依赖于使用文物,例如保存在法国实验室中的特定铂金千克。

科学术语的定义有时与它们的自然语言用法有很大不同。例如,质量重量在日常对话中经常互换使用,但在物理学中却有着不同的含义。科学数量通常以其度量单位来表征,这些单位可以随后用传统的物理单位来描述,以便在传达工作时进行交流。

科学工作中的测量通常还伴随着对其不确定性的估计。通常通过对所需数量进行重复测量来估计不确定性。不确定性也可以通过考虑用于计算的各个基础数量的不确定性来计算。对事物的计数(例如,在特定时间某个国家的人口数量)也可能由于所用方法的限制而存在不确定性。计数可能只代表所需数量的样本,其不确定性取决于所使用的采样方法和所采集的样本数量。

假设发展

[编辑 | 编辑源代码]

假设包括对主题的建议解释。它通常会提供因果解释或提出一些相关性。

观察通常具有存在语句的形式,说明所研究现象的某个特定实例具有某些特征。因果解释通常具有普遍语句的形式,说明现象的每个实例都具有特定的特征。从任何一系列特定观察中推断普遍语句在逻辑上无效。这就是归纳问题。许多解决方案被提出来解决这个问题,包括可证伪性贝叶斯推理

科学家利用一切可利用的资源——自己的创造力、其他领域的理念、归纳法系统性猜测等——来构想对正在研究的现象的可能解释。对于提出新的假设,并没有明确的指导方针。科学史充满了科学家声称获得“灵感闪现”或“直觉”,然后促使他们寻找证据来支持或反驳他们想法的故事。 迈克尔·波兰尼将这种创造力置于他对方法论讨论的核心。

从假设中进行预测

[编辑 | 编辑源代码]

一个有用的假设将能够通过预测,使用演绎推理,来进行实验评估。如果结果与预测相矛盾,那么正在检验的假设是不正确或不完整的,需要修改或放弃。如果结果证实了预测,那么假设可能是正确的,但仍需进一步验证。

爱因斯坦的预测(1907):光在引力场中弯曲

爱因斯坦的广义相对论对可观察到的时空结构做出了几个具体的预测,比如预测引力场中会弯曲,并且弯曲的程度与该引力场的强度密切相关。 亚瑟·爱丁顿1919日食期间的观测结果支持广义相对论,而不是牛顿的万有引力

预测指的是实验设计,其结果目前未知;经典的例子是埃德蒙·哈雷对哈雷彗星回归年份的预测,该彗星在他去世后回归。对(未知事物)的预测不同于结果已经可以知道的结果)。

一旦做出预测,就会设计一个实验来检验它。实验可以寻求对假设的确认证伪。然而,实验并非绝对必要。在以观察为基础的科学领域,实际实验的设计必须不同于经典的实验室科学;例如,迦勒底人的观测结果被用于巴塔尼的工作中,当他确定了地球岁差的值时,这项工作跨越了数千年。

科学家假设进行实验的人具有开放和问责的态度。详细的记录至关重要,有助于记录和报告实验结果,并提供程序有效性和完整性的证据。他们还将协助复制实验结果。这种传统可以在喜帕恰斯(公元前190年-公元前120年)的工作中看到,他在2100多年前(比巴塔尼早1000年)确定了地球岁差的值。

实验的完整性应该通过引入控制来确定。进行两个几乎相同的实验,只有一个实验改变了正在测试的因素。这有助于进一步隔离任何因果现象。例如,在测试药物时,重要的是要仔细测试,确保药物的假定效果仅由药物产生。 医生可以通过双盲研究来做到这一点:比较两个几乎相同的病人组,其中一组接受药物,另一组接受安慰剂。病人和医生都不知道谁接受了真正的药物,从而隔离了药物的影响。

实验完成后,研究人员会确定收集到的结果(或数据)是否符合预测。如果实验结论与预测/假设不符,那么就回到失败的假设并重新进行。如果实验看起来“成功”——即符合假设——那么其细节就会被发表,以便其他人(理论上)可以复制相同的实验结果。

评估和迭代

[编辑 | 编辑源代码]

测试和改进

[编辑 | 编辑源代码]

科学过程是迭代的。在任何阶段,一些因素都可能导致科学家重复过程的早期部分。未能提出一个有趣的假设可能导致科学家重新定义他们正在考虑的主题。假设未能产生有趣且可检验的预测可能导致重新考虑假设或对主题的定义。实验未能产生有趣的结果可能导致科学家重新考虑实验方法、假设或对主题的定义。

科学是一个社会性的事业,只有当科学工作能够被科学界验证时,它才会被接受。至关重要的是,实验和理论结果必须由科学界中的其他人进行复制。研究人员为了这个愿景献出了生命;格奥尔格·威廉·里希曼在试图复制1752本杰明·富兰克林风筝实验时,被球状闪电击中额头而丧生(1753年)。

重新评估

[编辑 | 编辑源代码]

所有科学知识都处于不断变化之中,因为在任何时候都可能出现新的证据,与长期持有的假设相矛盾。一个特别突出的例子是的理论。长期以来,人们一直认为光是由粒子组成的。 艾萨克·牛顿,以及在他之前的许多古希腊人,都相信它是这样,但他的“光是由粒子组成的”观点被支持波动说的证据推翻了,波动说最显著地是在19世纪初由英国医生托马斯·杨提出。光作为波很好地解释了观察到的光的衍射和干涉,而光作为粒子的理论则不能解释。在19世纪的大部分时间里,光的波动解释被广泛认为是不可辩驳的正确观点。然而,在世纪之交,人们进行了一些观察,这些观察无法用光的波动理论来解释。这组新的观察结果可以通过马克斯·普朗克的量子理论(包括光电效应布朗运动——这两者都来自阿尔伯特·爱因斯坦)来解释,但不能用光的波动理论来解释。当然,粒子的理论也解释不了。 更多…

同行评审评估

[编辑 | 编辑源代码]

科学期刊采用同行评审的过程,在这个过程中,科学家的手稿由科学期刊的编辑提交给(通常是一到三位)熟悉该领域的同行(通常是匿名的)科学家进行评估。评审人可能会或可能不会推荐发表、建议修改后发表,或者有时会推荐发表在其他期刊上。这有助于保持科学文献不受非科学或奇谈怪论的影响,有助于减少明显的错误,并且通常可以提高科学文献的质量。在经过此过程之前就向大众媒体宣布的工作通常不受欢迎。有时同行评审会抑制非传统工作的传播,而有时又过于宽容。同行评审过程并非总是成功,但已被科学界广泛采用。

可重复性

[编辑 | 编辑源代码]

科学观察结果的可重复性或复制性,虽然通常被描述为在科学方法中非常重要,但实际上很少被实际报道,而且实际上也常常没有做到。评审人和编辑有权利,并且通常会拒绝仅仅声称复制了一些观察结果的论文,因为这些论文缺乏原创性,没有包含任何新内容。偶尔也会发表关于无法复制结果的报告——主要是在存在争议或怀疑存在欺诈行为的情况下。然而,他人无法复制结果的威胁,对大多数科学家来说是一个非常有效的威慑力量,他们通常会在尝试发表之前多次复制自己的数据。

证据和假设

[edit | edit source]

证据以不同的形式和质量出现,这主要是由于潜在的假设。一个潜在的假设,“比空气重的物体掉落时会落到地面”不太可能引起太多争议。然而,像“外星人绑架人类”这样的潜在假设是一个非凡的断言,需要确凿的证据。许多非凡的断言也无法经受住奥卡姆剃刀的考验。

假设的优雅

[edit | edit source]

在评估一个假设时,科学家倾向于寻找“优雅”或“美丽”的理论。与这些词语在英语中的通常用法相反,科学家在脑海中有着更具体的含义。“优雅”(或“美丽”)指的是一个理论能够尽可能简洁地解释尽可能多的已知事实,或者至少以与奥卡姆剃刀一致的方式,同时在审美上令人愉悦。


每个人都有理由学习什么是科学证明。即使你从未做过科学工作,它也能帮助你评估他人的工作,并保护自己免受骗术的侵害。也许更重要的是,它将使你能够在一般情况下更清晰地思考。

统计学

[edit | edit source]

每当你听到广告说一种新的肥皂或乳液在某种意义上被科学证明具有积极的效果时,统计学就被使用过(或者他们对证明的科学性撒谎)。统计证明背后的哲学思想是这些

  1. 制定一个可以通过实验(测量)来证伪的假设
  2. 决定你想要什么样的确定性水平。95% 和 99% 是常见的选择。
  3. 进行可能证伪假设的实验。

例如,假设你想看看怀孕期间饮酒与孩子的智力之间是否存在联系。那么你可能会从以下方面开始

假设:母亲在怀孕期间饮酒降低孩子的智力。

这就会产生以下反假设或零假设

零假设:母亲在怀孕期间饮酒不会降低孩子的智力。

现在我们希望对结果有 99% 的把握。这意味着错误的风险是 1%。在进行大量测量并将测量结果通过统计学工具处理后,我们将能够得出以下结论

  1. 我们无法在 1% 的错误风险内拒绝零假设,或者
  2. 在 1% 的错误风险内,零假设被拒绝,有利于假设。

如果结果是 2,我们就“统计地证明”了怀孕期间饮酒会降低孩子的智力。当然,这个例子是经过简化的。我们所说的饮酒是什么意思?什么数量,以及多久一次?我们如何衡量智力?这些也必须被明确说明。

公理方法

[edit | edit source]

公理方法是每个数学理论的基础。一个完整的理论由公理和蕴涵构成。*“公理”的其他名称是“前提”、“假设”和“假设”。为了论证的目的,公理总是被认为是真实的,无需讨论。每次我们说“假设”,我们都在描述一个公理。当一个陈述无疑(逻辑地)从另一个陈述中得出时,我们就有一个蕴涵。

假设所有的人类都有蓝色的眼睛。让我们把它作为一个公理。现在假设梅林达是一个人类。(这是另一个公理。)那么梅林达有蓝色的眼睛。关于梅林达眼睛颜色的任何其他结论都是错误的,因为公理被定义为真实的(除非有人能证明这两个公理相互矛盾,在这种情况下,其中一个必须被丢弃,但那是另一个故事)。

人们有不同的公理。看看这个信念:“如果我们每天早上不往龙的洞里扔煎饼,太阳就不会升起”。你可能会说这很不合逻辑。但确实,在合适的公理下它是合理的。

公理

  1. 洞里有一条龙。
  2. 如果龙不吃煎饼,它就会死。
  3. 只有龙才能让太阳升起。

现在,如果没有人给龙煎饼,那么龙就会死(假设龙不能自己做煎饼)。但如果龙死了,那么就没有人让太阳升起!这个结论是从公理中逻辑推导出来的。重点是,即使是铁杆神秘主义者也可能在他们的思考中使用逻辑;只是他们的假设很奇怪。

大多数人不会有意识地思考他们在争论时什么是公理,什么是蕴涵。此外,大多数人宁愿死也不愿改变他们的任何生活公理。人们有最奇怪的公理,比如“恒星的不同排列对人类有不同的容易检测到的影响”。也许他们有充分的理由拥有这些公理。然而,拥有这些公理,他们认为自己正在理性思考,而且他们确实在理性思考!只要蕴涵从他们的公理中逻辑地推导出来,他们就在理性思考!至少,根据“理性”的一个定义。另一个定义可能是“一个理论是理性的,如果它与物理现实有很好的相关性”。但随后,许多数学理论就不是理性的;例如,大多数非欧几里得几何(以及根据闵可夫斯基-爱因斯坦理论,欧几里得几何也是!)。而我们希望数学理论是“理性的”,所以后者不是一个好的定义。

一个智慧的生物应该意识到,不同的人和不同的文化有不同的公理。练习相信奇怪的事情可能是一个好主意。注意你的公理!不要相信它们,只是把它们当作公理看待!每次你换内衣时就换公理,如果你经常换内衣的话。

如果你从未听说过奥卡姆剃刀,现在正是学习它的最佳时机。这是一个原则,它大致说:如果你必须在两个同样好的解释现象的理论之间做出选择,请选择公理数量最少的那个。

简短的重复

  1. 尽量不要相信你日常生活中使用的公理,只是把它们当作公理看待,它们很可能被改变。这将帮助你理解其他人。
  2. 迷信的人很可能很理性,而且他们经常很理性。他们只是有一些奇怪的公理。
  3. 尽量少做假设(也就是说,使用奥卡姆剃刀)。小心不要得出过于大胆的结论。如果你祈祷上帝,你的祈祷立刻得到了回应,这是否意味着《古兰经》或《圣经》是真实的?这是否意味着你当地教堂所传讲的东西是真实的?还是这是否意味着印度教徒是对的?

*在数学理论中,引入了称为形式系统的东西,它更加严格(例如,逻辑规则不是被认为是理所当然的)。然而,在日常生活中,公理方法已经足够好了。

归纳推理

[edit | edit source]

归纳归纳推理,有时被称为归纳逻辑,是一个推理过程,在这个过程中,给定前提,一个论点的结论很可能为真,但并非确定。它是根据对特定标记的有限观察,将属性或关系归因于类型;或者根据对反复出现的现象模式的有限观察,制定规律。例如,归纳用于使用以下特定的命题

  • 冰是冷的。
  • 当用球杆击打时,台球会移动。

推断出以下一般的命题

  • 所有的冰都是冷的。
  • 对于每一个作用,都有一个大小相等、方向相反的反作用。

有效性

[edit | edit source]

大多数人学习的形式逻辑是演绎的,而不是归纳的。一些哲学家声称他们创造了归纳逻辑体系,但归纳逻辑是否存在仍存在争议。与演绎推理不同,归纳推理得出的结论并不一定与最初的假设具有相同程度的确定性。例如,所有天鹅都是白色的结论显然是错误的,但在欧洲人定居澳大利亚之前,人们可能认为它是正确的。归纳论证从不具有约束力,但它们可能是有力的。归纳推理在演绎上是无效的。(在形式逻辑中,一个论证是有效的,当且仅当论证的前提不可能为真而结论为假。)

归纳问题(即寻找对归纳推理的理由)的经典哲学处理是由苏格兰人大卫·休谟提出的。休谟强调,我们日常的推理依赖于重复经验的模式,而不是演绎有效的论证。例如,我们相信面包会滋养我们,因为它在过去是如此,但至少可以想象面包将来会毒害我们。

休谟说,一个坚持对所有事物进行合理的演绎证明的人会饿死。他主张一种基于常识的实用怀疑主义,而不是对一切事物的彻底怀疑主义,在这种怀疑主义中,人们接受了归纳的必然性。

20 世纪的发展以截然不同的方式构建了归纳问题。它可以被看作是对要将哪些概念拟合到观察(参见绿蓝的条目)或将哪些图形拟合到一组观察到的数据点的选择,而不是对要对未来做出什么预测的选择。

归纳有时被描述为从过去推断未来的推理,但在其最广义的意义上,它涉及根据观察到的东西对未观察到的东西得出结论。从当前证据中推断过去(例如考古学)被认为是归纳。归纳也可以是跨越空间而不是时间,例如,根据我们在银河系中观察到的东西对整个宇宙的结论,或者根据过去的经济表现得出国家经济政策。

华夏公益教科书