跳转到内容

Cg 编程/顶点变换

来自维基教科书,开放的书籍,开放的世界

顶点着色器和可编程图形管道中后续阶段最重要的任务之一是将图元(例如三角形)的顶点从原始坐标(例如在 3D 建模工具中指定的坐标)变换到屏幕坐标。虽然可编程顶点着色器允许以多种方式变换顶点,但一些变换通常在顶点着色器之后的固定功能阶段执行。因此,在编程顶点着色器时,了解哪些变换必须在顶点着色器中执行尤为重要。这些变换通常作为统一参数指定,并通过矩阵向量乘法应用于输入顶点位置(和法线向量)。在具有输入参数 vertex : POSITION 的顶点着色器中,标准变换可以通过此矩阵向量积计算

   mul(UNITY_MATRIX_MVP, vertex)

Unity 的内置统一参数 UNITY_MATRIX_MVP 将标准顶点变换指定为 4x4 矩阵。(但是,在 Unity 中,建议使用函数 UnityObjectToClipPos(vertex) 执行此变换,该函数也适用于立体投影和投影到 360 图像等。)

虽然这对于点和方向来说很简单,但正如“应用矩阵变换”一节中所述,对于法线向量来说就不那么简单了。

这里,我们将首先概述坐标系以及它们之间的变换,然后讨论各个变换。

相机类比:1. 定位模型,2. 定位相机,3. 调整缩放,4. 裁剪图像

概述:相机类比

[编辑 | 编辑源代码]

用相机类比来思考变换顶点的整个过程非常有用,如右图所示。步骤和相应的顶点变换是

  1. 定位模型 - 模型变换
  2. 定位相机 - 观察变换
  3. 调整缩放 - 投影变换
  4. 裁剪图像 - 视口变换

前三个变换在顶点着色器中应用。然后,透视除法(可以认为是投影变换的一部分)在顶点着色器之后的固定功能阶段自动应用。视口变换也在此固定功能阶段自动应用。虽然固定功能阶段中的变换无法修改,但其他变换可以被这里描述的其他类型的变换所取代。但是,了解传统的变换很有用,因为它们允许充分利用裁剪和对变化变量的透视正确插值。

以下概述显示了各种坐标系之间顶点变换的顺序,并包括表示变换的矩阵

对象/模型坐标 具有语义的顶点输入参数(特别是语义 POSITION
模型变换: 模型矩阵 (在 Unity 中:unity_ObjectToWorld
世界坐标
观察变换: 观察矩阵 (在 Unity 中:UNITY_MATRIX_V
观察/眼睛坐标
投影变换: 投影矩阵 (在 Unity 中:UNITY_MATRIX_P
裁剪坐标 具有语义 SV_POSITION 的顶点输出参数
透视除法 (除以 w 坐标)
归一化设备坐标
视口变换
屏幕/窗口坐标

请注意,模型、观察和投影变换在顶点着色器中应用。透视除法和视口变换在顶点着色器之后的固定功能阶段应用。接下来的部分将详细讨论所有这些变换。

模型变换

[编辑 | 编辑源代码]

模型变换指定从对象坐标(也称为模型坐标或局部坐标)到公共世界坐标系的变换。对象坐标通常特定于每个对象或模型,并且通常在 3D 建模工具中指定。另一方面,世界坐标是场景中所有对象的公共坐标系,包括光源、3D 音频源等。由于不同的对象具有不同的对象坐标系,因此模型变换也不同;即,必须对每个对象应用不同的模型变换。

模型矩阵的结构

[编辑 | 编辑源代码]

模型变换可以用 4×4 矩阵表示,我们将其表示为模型矩阵 (在 Unity 中:unity_ObjectToWorld)。它的结构是

     

是一个 3×3 矩阵,表示 3D 空间中的线性变换。这包括任何旋转、缩放和其他不太常见的线性变换的组合。t 是一个 3D 向量,表示 3D 空间中的平移(即位移)。t 结合在一个方便的 4×4 矩阵中。从数学上来说,模型矩阵表示仿射变换:线性变换加上平移。为了使这种方法起作用,所有三维点都由具有第四坐标为 1 的四维向量表示

当我们将矩阵乘以这样的点时,三维线性变换和平移的组合将在结果中显示出来

  

除了第四个坐标(它应该是点位的 1),结果等于

在顶点着色器中访问模型矩阵

[edit | edit source]

模型矩阵 可以定义为一个统一参数,使其在顶点着色器中可用。但是,它通常与视图变换矩阵组合形成模型视图矩阵,然后将其设置为统一参数。在一些 API 中,矩阵可作为内置的统一参数使用,例如 Unity 中的 unity_ObjectToWorld。(另请参见 “应用矩阵变换”部分。)

计算模型矩阵

[edit | edit source]

严格来说,Cg 程序员不必担心模型矩阵的计算,因为它以统一参数的形式提供给顶点着色器。实际上,渲染引擎、场景图和游戏引擎通常会提供模型矩阵;因此,顶点着色器的程序员不必担心计算模型矩阵。然而,在某些情况下,在开发图形应用程序时必须计算模型矩阵。

模型矩阵通常通过组合对象的初等变换的 4×4 矩阵来计算,特别是平移、旋转和缩放。具体来说,在层次场景图的情况下,将对象的全部父组(父级、祖父母等)的变换组合起来形成模型矩阵。让我们看一下最重要的初等变换及其矩阵。

表示向量 t 的平移的 4×4 矩阵是

表示沿轴缩放因子为、沿轴缩放因子为、沿轴缩放因子为 的 4×4 矩阵为

表示绕归一化轴 旋转角度为 的 4×4 矩阵为

绕特定轴的旋转可以很容易地推导出特殊情况。例如,这些情况对于实现欧拉角旋转是必要的。但是,欧拉角有多种约定,这里不会讨论。

一个标准化的四元数 对应于绕着角度为 的轴进行旋转。旋转轴的方向可以通过对 3D 向量 进行归一化来确定。

还有其他基本的变换,但对模型矩阵的计算而言并不那么重要。这些或其他变换的 4x4 矩阵通过矩阵乘积进行组合。假设矩阵 以此特定顺序应用于一个物体。( 可能代表从物体坐标系到父组坐标系的变换; 代表从父组到祖父母组的变换; 代表从祖父母组到世界坐标系的变换。)那么组合的矩阵乘积是

请注意,矩阵因子的顺序很重要。还要注意,这个矩阵乘积应该从右(向量被乘的地方)读到左,即 首先应用,而 最后应用。

视图坐标系的示意图。

视图变换

[edit | edit source]

观察变换对应于放置和定向相机(或观察者的眼睛)。 但是,看待观察变换的最佳方式是,它将世界坐标转换为位于坐标系原点的相机的视图坐标系(也称为眼睛坐标系),(按惯例)指向轴(在OpenGL中),以及轴(在Direct3D中),并放在平面,即向上方向由正轴给出。

在顶点着色器中访问视图矩阵

[edit | edit source]

与模型变换类似,观察变换由一个4×4矩阵表示,称为视图矩阵。 它可以定义为顶点着色器的统一参数(在 Unity 中:UNITY_MATRIX_V); 但是,它通常与模型矩阵组合形成模型视图矩阵(在 Unity 中:UNITY_MATRIX_MV)。 由于模型矩阵先应用,正确的组合是

(另请参见部分“应用矩阵变换”。)

计算视图矩阵

[edit | edit source]

与模型矩阵类似,Cg 程序员不必担心视图矩阵的计算,因为它是以统一参数的形式提供给顶点着色器的。 但是,在开发图形应用程序时,有时有必要计算视图矩阵。

这里,我们简要总结了如何从相机的t位置、视图方向d和世界向上向量k(全部以世界坐标表示)计算视图矩阵。 这里,我们将限制在OpenGL的右手坐标系中,其中相机指向轴。(Direct3D 有些符号变化。)这些步骤很简单

1. 计算(在世界坐标中)视图坐标系的轴的方向z,作为负归一化的d向量

2. 计算(同样在世界坐标中)视图坐标系的轴的方向x,通过

3. 在世界坐标系中计算视图坐标系 轴的方向 y

使用 xyzt,可以轻松确定逆视图矩阵 ,因为该矩阵将原点 (0,0,0) 映射到 t,并将单位向量 (1,0,0)、(0,1,0) 和 (0,0,1) 映射到 xy,z。因此,后面的向量必须位于矩阵 的列中。

然而,我们需要矩阵 ;因此,我们必须计算矩阵 的逆。请注意,矩阵 的形式为

其中 是一个 3×3 矩阵,t 是一个 3D 向量。这种矩阵的逆矩阵是

在本例中,矩阵 是正交的(因为它的列向量是归一化的并且相互正交),因此 的逆矩阵就是它的转置,即第四步是计算

  

虽然推导出这个结果需要一些线性代数知识,但最终的计算只需要基本的向量和矩阵运算,并且可以轻松地在任何常见的编程语言中实现。

文艺复兴时期的透视绘画:“男人画鲁特琴”由阿尔布雷希特·丢勒创作,1525 年

投影变换和透视除法

[edit | edit source]

首先,投影变换决定投影的类型,例如透视或正交。透视投影对应于具有缩短效果的线性透视,而正交投影是不具有缩短效果的正交投影。缩短效果实际上是通过透视除法实现的;但是,控制透视投影的所有参数都在投影变换中设置。

从技术角度来说,投影变换将视图坐标转换为裁剪坐标。(场景可见部分之外的所有图元部分都在裁剪坐标中被裁剪掉。)它应该是顶点着色器中应用于顶点的最后一个变换,在顶点以语义 SV_POSITION 输出参数返回之前。然后,这些裁剪坐标通过 **透视除法** 转换为归一化设备坐标,这只是将所有坐标除以第四个坐标。(归一化设备坐标之所以被称为这个名字,是因为它们的值在场景可见部分的所有点的 -1 到 +1 之间。)

在顶点着色器中访问投影矩阵

[edit | edit source]

与模型变换和视图变换类似,投影变换也由一个 4×4 矩阵表示,称为投影矩阵 。它通常被定义为顶点着色器的统一参数(在 Unity 中:UNITY_MATRIX_P)。

计算投影矩阵

[edit | edit source]

与模型视图矩阵类似,Cg 程序员不必担心投影矩阵的计算。但是,在开发应用程序时,有时需要计算投影矩阵。

这里,我们展示了三种情况下的投影矩阵(所有情况都是针对 OpenGL 约定,即相机指向视图坐标中的负 轴)

  • 标准透视投影(对应于 OpenGL 2.x 函数 gluPerspective
  • 斜透视投影(对应于 OpenGL 2.x 函数 glFrustum
  • 正交投影(对应于 OpenGL 2.x 函数 glOrtho
角度 的说明,它指定了 *y* 方向上的视场。
以下是近裁剪平面和远裁剪平面在 的示意图。

标准透视投影的特点是

  • 一个角度 ,它指定了 方向上的视野,如右图所示,
  • 到近裁剪平面的距离 和到远裁剪平面的距离 ,如下一图所示,
  • 近裁剪平面上中心矩形的宽高比

与视点和裁剪平面一起,这个中心矩形定义了视锥体,即对于特定投影变换可见的 3D 空间区域。视锥体外的所有基本图形和所有基本图形的部分都被裁剪掉。近裁剪平面和远裁剪平面是必要的,因为深度值以有限精度存储;因此,不可能覆盖无限大的视锥体。

使用参数 ,透视投影的投影矩阵

  

斜透视投影的参数。

斜透视投影的特点是

  • 与标准透视投影情况相同,到裁剪平面的距离
  • 坐标 (右)、(左)、(上)和 (下),如相应图形所示。这些坐标决定了视锥体前矩形的位置;因此,可以使用纵横比 和视野角度 以外,指定更多视锥体(例如,偏心)。

给定参数 ,斜视投影的投影矩阵

正投影的参数。

右图说明了正投影,它没有透视缩短。参数与斜视投影的情况相同;但是,视锥体(更准确地说,是视体积)现在是一个盒子,而不是一个截断的金字塔。

使用参数 ,和 ,正交投影的投影矩阵 是:

视口变换的示意图。

视口变换

[edit | edit source]

投影变换将视图坐标映射到裁剪坐标,然后通过裁剪坐标的第四个分量进行透视除法,映射到归一化设备坐标。在归一化设备坐标(ndc)中,视图体积始终是一个以原点为中心的方框,方框内的坐标介于 -1 和 +1 之间。然后,该方框通过视口变换映射到屏幕坐标(也称为窗口坐标),如相应图形所示。此映射的参数是视口(屏幕上渲染的矩形)的左下角坐标 ,以及它的宽度 和高度 ,以及远近裁剪平面的深度 。(这些深度介于 0 和 1 之间)。在 OpenGL 和 OpenGL ES 中,使用两个函数设置这些参数

glViewport(GLint , GLint , GLsizei , GLsizei );

glDepthRangef(GLclampf , GLclampf );

视口变换矩阵并不重要,因为它在固定功能阶段自动应用。但是,为了完整起见,这里列出它。

进一步阅读

[编辑 | 编辑源代码]

传统的顶点变换在Nvidia 的 Cg 教程第 4 章中也进行了简要说明。

传统的 OpenGL 变换在“OpenGL 4.1 Compatibility Profile Specification”第 2.12 节中进行了详细描述,该规范可以在Khronos OpenGL 网站上获得。Dave Shreiner 编著的“OpenGL Programming Guide”一书的第 3 章(关于查看)对顶点变换进行了更易懂的描述。该书由 Addison-Wesley 出版。(旧版可在网上获得)。

< Cg 编程

除非另有说明,本页上的所有示例源代码均归属公共领域。
华夏公益教科书