现在的位置: 首页 > 综合 > 正文

Cg In Two Pages

2013年08月29日 ⁄ 综合 ⁄ 共 4822字 ⁄ 字号小中大 ⁄ 评论关闭

文章目录

1.1 顶点程序的讲解
1.2 片元程序的讲解
2.1 从C来的特性
2.2 C没有的附加特性
2.3 不支持的特性

Cg in Two Pages

Mark J.Kilgard
NVIDIA Corporation
Austin, Texas
January 16, 2003

游戏引擎开发网龚敏敏翻译

1. Cg用例

Cg是用于GPU编程的语言。Cg程序看起来非常像C程序。这儿有一个Cg顶点程序：

void simpleTransform(float4 objectPosition  : POSITION,
   float4 color  : COLOR,
   float4 decalCoord  : TEXCOORD0,
   float4 lightMapCoord : TEXCOORD1,
   out float4 clipPosition : POSITION,
   out float4 oColor : COLOR,
   out float4 oDecalCoord : TEXCOORD0,
   out float4 oLightMapCoord : TEXCOORD1,
   uniform float brightness,
   uniform float4x4 modelViewProjection)
{
 clipPosition = mul(modelViewProjection, objectPosition);
 oColor = brightness * color;
 oDecalCoord = decalCoord;
 oLightMapCoord = lightMapCoord;
}

1.1 顶点程序的讲解

这个程序把一个顶点的对象空间位置通过一个包含世界、观察和投射串联转换的4x4矩阵进行转换。得出的结果向量是顶点在夹持空间的位置。每个顶点的颜色在输出前都通过一个浮点参数进行放缩。同样，两个纹理坐标集自然也传过去了。

Cg支持标量数据类型，比如float，但也很好地支持向量数据类型。float4表示包含四个浮点数的向量。float4x4表示一个矩阵。mul是一个标准库函数，完成矩阵和向量乘法。Cg提供像C++的函数重载；mul是一个重载函数，所以它可以用于向量和矩阵相乘的所有组合情况。

Cg提供和C一样的操作符。但是不像C，Cg的操作符可以接受和返回标量和向量。比如，标量brightness对向量color进行了放缩，就像你期望的。

在Cg中，用uniform修饰符声明一个参数表明它的值是由外部的数据源初始化的，而且在给定这批向量的处理中保持不变。从这点看来，Cg中的uniform修饰符和RenderMan中的uniform修饰符不同，但使用的场合一样。实际上，外部数据源是你的应用程序载入的一些OpenGL或Direct3D状态。比如，你的程序必须提供modelViewProjection矩阵和brightness标量。Cg运行库提供一个API把你程序的状态转化成编译的程序需要的适当的API状态。

跟在objectPosition、color、decalCoord和lightMapCoord参数后面的POSITION、COLOR、TEXCOORD0和TEXCOORD1标示符叫做输入语义。它们表明参数是怎么由每个顶点不同的数据初始化的。在OpenGL中，glVertex命令需要POSITION输入语义；glColor命令需要COLOR语义；glMultiTexCoord命令需要TEXCOORDn语义。

out修饰符表明clipPosition、oColor、oDecalCoord和oLightMapCoord参数是由这段程序输出的。跟在参数后面的语义就是输出语义。这些语义分别表明程序输出一个转换后的夹持空间位置和颜色量。同样，两个纹理坐标集也传递过去了。得出的结果顶点提供给图元汇编程序来生成一个光栅化的图元。

编译这个程序需要程序源代码、要编译的入口函数名和profile名（vs_1_1）。

然后Cg编译器可以把上面的Cg程序编译为下面的DirectX 8 vertex shader：

vs.1.1
mov oT0, v7
mov oT1, v8
dp4 oPos.x, c1, v0
dp4 oPos.y, c2, v0
dp4 oPos.z, c3, v0
dp4 oPos.w, c4, v0
mul oD0, c0.x, v5

Profile用来表明程序要被编译为用于哪个API运行环境的。同一个程序可以编译为用于DirectX 9 vertex shader profile（vs_2_0），多厂商OpenGL顶点程序扩展（arbvp1）或NVIDIA私有的OpenGL扩展（vp20和vp30）。

编译Cg程序的过程可以在你使用Cg的程序初始化的时候进行。Cg运行库包含Cg编译器，也以API的方式包含一个非常简单的过程，可以让你配置编译过的程序是用于OpenGL还是Direct3D的。

1.2 片元程序的讲解

除了写处理顶点的程序之外，你还可以写处理片元的程序。这儿有一个Cg片元程序：

float4 brightLightMapDecal(float4 color   : COLOR,
    float4 decalCoord  : TEXCOORD0,
    float4 lightMapCoord : TEXCOORD1,
    uniform sampler2D decal,
    uniform sampler2D lightMap) : COLOR
{
 float4 d = tex2Dproj(decal, decalCoord);
 float4 lm = tex2Dproj(lightMap, lightMapCoord);
 return 2.0 * color * d * lm;
}

输入的参数是颜色插值和两个纹理坐标集，由它们的输入语义定义。

sampler2D类型对应于一个2D纹理单元。Cg标准库程例tex2Dproj可以进行2D纹理映射查找。两次tex2Dproj调用对decal和light map纹理进行取样，然后把结果分别赋值给局部变量d和lm。

这段程序把两个纹理结果，颜色插值和常数2.0相乘，得出RGBA颜色的结果。这段程序返回一个float4和返回值是COLOR的语义，也就是片元最后的颜色。

当要编译为arbfp1多厂商OpenGL片元profile时，Cg编译器把brightLightMapDecal转化成以下代码:

!!ARBfp1.0
PARAM c0 = {2, 2, 2, 2}; TEMP R0; TEMP R1; TEMP R2;
TXP R0, fragment.texcoord[0], texture[0], 2D;
TXP R1, fragment.texcoord[1], texture[1], 2D;
MUL R2, c0.x, fragment.color.primary;
MUL R0, R2, R0;
MUL result.color, R0, R1;
END

同一个程序可以编译为用于DirectX 8或9的profile（ps_1_3和ps_2_x）或NVIDIA私有的OpenGL扩展（fp20和fp30）。

2. 其他Cg的功能

2.1 从C来的特性

Cg提供结构体和数组，包含多维数组。Cg提供所有C的数学操作符（+、*、/等）。Cg提供一个布尔类型和那些与布尔类型相关的操作符（||、&&、!等）。Cg提供递增/递减（++/--）操作符，条件表达式操作符（?:），赋值表达式（+=等），甚至还有C逗号操作符。

Cg提供用户定义函数（除了已定义的标准库函数之外），但是不允许递归函数。Cg提供C的控制流结构的子集（do、while、for、if、break、continue）；其他结构比如goto和switch在当前的Cg实现版本并不支持，但保留了必要的关键字。

就像C，Cg对数据类型的精度和范围并不严加限制。实际上，用于编译的profile的选择决定了每种数据类型具体的表现。float、half和double用来表示连续的值，理想的浮点数，但这依赖于profile。half指的是16位半精度浮点数据类型（NVIDIA的CineFX架构提供这样的数据类型）。int是整数，通常用于循环和索引。fixed是一个额外的数据类型，用来表示不是浮点数的定点的连续数据。

Cg提供#include、#define、#ifdef等，和C的预处理一样。Cg支持C和C++的注释风格。

2.2 C没有的附加特性

Cg对向量数据类型提供内建的构造函数（类似于C++，但不是由用户自定义的）：

float4 vec1 = float4(4.0, -2.0, 5.0, 3.0);

Swizzling是一种用来重组向量的组成或者构造更短或更长向量的方法。例子如下：

float2 vec2 = vec1.yx;  // vec2 = (-2.0, 4.0)
float scalar = vec1.w;  // scalar = 3.0
float3 vec3 = scalar.xxx;  // vec3 = (3.0, 3.0, 3.0)

矩阵可以用更复杂的swizzling语法。向量和矩阵元素也可以用标准数组索引语法来访问。

写入掩码可以限制只给向量指定的部分赋值。例子如下：

vec1.xw = vec3; // vec1 = (3.0, -2.0, 5.0, 3.0)

使用.xyzw或.rgba后缀来组成swizzling和写入掩码。

Cg标准库包含大量的内建数学函数（abs、dot、log2、reflect、rsqrt等）和纹理访问函数（texCUBE、tex3Dproj等）。标准库广泛应用了函数重载（类似于C++）来支持不同长度的向量和不同的数据类型。你不必像在C里一样使用#include来包含标准库程例的原型，Cg标准库程例都是自动生成原型的。

除了用于call-by-result传参的out修饰符之外，inout修饰符使参数既是call-by-value输入参数也是call-by-result输出参数。

关键字discard类似于return，但是不返回转换好的片元就终止处理了。

2.3 不支持的特性

Cg目前还不支持指针和位运算（但是，必要的C操作符和关键字为这些目的保留了）。Cg（目前）不支持联合体和函数变元。

Cg没有C++“大型的编程”特性，比如类、模板、操作符重载、异常处理和名字空间。

Cg标准库没有功能性的程例，比如字符串处理、文件输入/输出和内存配置，这些超出了Cg的专有领域。

但是，Cg保留了所有的C和C++关键字，这为从这些语言来的特性可以合入未来的Cg实现作保证。

3. Profile依赖

当你编译一个C或C++程序时，它不会因为程序过大（在一定前提之内）或因为这个程序的用途而无法通过编译。对于Cg，一个语法和语义都正确的程序可能仍然不能编译，因为这还受限于你编译这个程序的profile。

比如，目前当用顶点profile编译时，如果访问纹理就会产生一个错误。未来的顶点profile可能会允许纹理访问，但现在的顶点profile不行。其他错误更为固有。比如，一个片元profile不能以TEXCOORD0语义输出一个参数。其他错误可能是因为超出了当前的GPU能力范围，比如超过最大的指令数或可利用的纹理单元数目。

要知道，这些profile依赖错误并不反映出Cg语言的限制，而是目前Cg实现的限制或者你的目标GPU的潜在硬件限制。

4. 兼容性和移植性

NVIDIA的Cg实现和Microsoft的高级着色语言(HLSL)非常相似，因为它们是合作开发的。HLSL是和DirectX 9以及Windows操作系统整合在一起的。Cg则提供了多API（OpenGL、DirectX 8和DirectX 9）和多操作系统（Windows、Linux和Mac OS X）的支持。因为Cg对多厂商API有接口，Cg可以在多个厂商的GPU上运行。

5. 更多信息

可以看《The Cg Tutorial:The Definitive Guide to Programmable Real-Time Graphics》(ISBN 0321194969)，由Addison-Wesley在2003年3月出版。详见http://www.awprofessional.com/titles/0321194969。

【上篇】图文并茂——使用xfire编写webservice
【下篇】[javascript]中文排序比较函数localeCompare()

作者: cramp

该日志由 cramp 于11年前发表在综合分类下，最后更新于 2013年08月29日.
转载请注明: Cg In Two Pages | 学步园 +复制链接

抱歉!评论已关闭.

学步园