R语言数据挖掘算法/聚类/期望最大化(即将推出)
外观
在统计学中,优化问题用于在一个特定空间中最大化或最小化一个函数及其变量。由于这些优化问题可能具有各种不同的类型,并且每种类型都有其自身的特征,因此存在许多技术来解决其中的一些问题。
最大似然法是这些技术之一,其主要目标是使用特定数据集调整统计模型,估计其未知参数,以便该函数可以描述数据集中所有参数。换句话说,该方法将根据数据集或已知分布调整统计模型的一些变量,以便模型可以“描述”每个数据样本并估计其他样本。这种技术在数据挖掘和知识发现领域非常重要,因为它可以作为大多数复杂且强大的方法的基础。
期望最大化方法是从最大似然法发展而来的一种方法,试图在某些变量未观察到的情况下估计似然。该方法于1977年由[2]首次记录,尽管正如作者所建议的那样,该技术在文献中被非正式地提出过。因此,这项工作是其在文献中的第一次正式化。
该函数可以通过迭代过程近似计算参数,该过程称为期望步骤(E步骤)和最大化步骤(M步骤),分别执行以找到未观察到的变量并重新估计最大似然的参数。下一节将更详细地描述该方法,并提供一个包含函数计算所有步骤的算法。
(正在建设中:翻译)
(正在建设中:翻译)
(正在建设中:翻译)
(正在建设中:翻译)
(正在建设中:翻译)