现在的位置: 首页 > 综合 > 正文

Win32Asm 教程(转载至http://blog.csdn.net/taowen2002/)

2013年10月02日 ⁄ 综合 ⁄ 共 5485字 ⁄ 字号 评论关闭
Win32Asm 教程

这是我的Win32Asm教程。它总是创建中,但我会不停地添加内容。通过上面的nextprev链接,你可以转到后面和前面一页。

介绍

先来对这个教程做个小介绍。Win32Asm不是一个非常流行的编程语言,而且只有为数不多(但很好)的教程。大多数教程都集中在编程的win32部分(例如,winAPI,使用标准Windows编程技术等),而不是汇编语言本身,例如伪代码(opcodes),寄存器(registers)的使用等。虽然你能在其他教程中找到这些,但那些教程通常是解释Dos编程的。它当然可以帮你学汇编语言,但在Windows中编程,你不再需要了解Dos中断(interrupt)和断口(portIn/our函数。在Window中,WindowsAPI提供了你可在你的程序中使用的标准功能(function),后面还会对此有更多内容。这份教程的目标是在解释用汇编编Win32程序的同时学习汇编语言本身。

10汇编语言

汇编是创造出来代替原始的由处理器理解的二进制代码的。很久以前,但是尚没有任何高级语言,程序是用汇编写的。汇编代码直接描述处理器可以执行的代码,例如:

add eax,edx

这条指令-add-把两个值加到一起。Eaxedx被称为寄存器,它们可以保存值在处理器内部。这条代码被转换为66 03 c216进制)。处理器读这行代码,并执行它所代表的指令,像C等高级语言把它们自己的语言翻译为汇编语言,而汇编程序又把它转换为二进制代码:

C 代码

>> C编译器 > >

汇编语言

>>汇编器>>

原始输出(十六进制)

a = a +
b;

add eax,
edx

66 03
C2

(注意该处的汇编语言的代码被简化了,实际输出决定于C代码的上下文)

1.  1-为什么?(Why?)

既然用Asm写程序更困难,为什么你用Asm而不是C或者别的什么??-汇编产生的程序更小而且更快。在有人工智能的高级编程语言中,编译器要产生输出代码变得(比汇编)更困难。编译器必须指出最快(或最小)的方式产生汇编代码,而且虽然编译器变得越来越好,你自己来写(汇编)代码(包括可选的代码优化)能生成更小更快的代码。但是,当然,这比高级语言难多了。还有另一个与某些使用运行时dll的高级语言不同的地方,它们在大多数时运行良好,但有时由于dll版本(dll hell)产生问题而用户总是要安装这些Dll。对于Visual C++,这不是一个问题,它们是与Windows一同安装的。而Visual Basic甚至部把自己的语言转换为汇编语言(虽然5版本及以上作了一些,但不完全)。它高度依赖msvbvm50.dllVisual Baisc虚拟机。由VB产生的exe文件仅仅存在简单的代码和许多对这些dll的调用。这就是vb慢的原因。汇编是所有中最快的。它仅仅用系统的dllKernel32.dll, User32.dll等。

另一个误解是许多人认为汇编不可能用来编程。当然,它难,但不是不可能。用汇编创建大的工程的确很难,我只是用它来写小程序,用于需要速度的代码被写在能被其他语言导入的dll中。而且,DosWindows还有一个很大的区别。Dos程序把中断当“函数”用。像中断10用于显示,中断13用于文件存储等。在Windows中,API函数只有名字(比如MessageBox, CreateWindowsEx)。你能导入库(DLL)并使用其中的函数。这使得用asm写程序简单多了。你将在下一章中学习更多关于这方面的知识。

20开始

介绍已经够多了,现在让我们开始吧。要用汇编写程序,你需要一些工具。下面,你能看到我将在本教程中用哪些工具。我建议你安装同样的工具,因而你能跟着教程试验那些例子。我也给处一些其他选择,虽然你能选择其中的大部分,但是要警告的是在汇编器(masmtasmnasm)中有很大的区别。在这个教程中,将使用masm,因为它有很有用的功能(像invoke),它使得编程更容易。当然,你可以自己选择你更喜欢的汇编器,但这将使你更难跟着教程走而且你不得不把教程中的例子进行处理使它可以在你用的汇编器中运行。

汇编器

我的选择:Masm(在win32asm包中)

网址:win32asm.cjb.net

描述:一个把伪代码(opcodes)翻译为给处理器读的原始输出(object文件)的汇编器

关于:Masm,宏(macro)汇编器,是一个有很多有用的特色的汇编器。像“invoke”,它可以简化对API函数的调用并对数据类型进行检查。你将在本教程的后面学习这些。如果你读了上面的文字你就知道本教程推荐使用masm

供选择:Tasm[dl],nasm[dl]

链接器

我的选择:微软附加链接器(link.exe

网址:win32asm.cjb.net(在win32asm包中)

描述:链接器把对象(object)文件和库文件(用与DLL导入)“链接”到一起输出最终的可执行文件。

关于:我会用IczelionWin32asm包中的link.exe。但大多数的链接器都可以用。

供选择:Tasm linker[dl]

资源编辑器

我的选择:Borland资源编辑器

网址:www.crackstore.com

描述:用于创建资源(图形,对话框,位图,菜单等)的资源编辑器。

关于:大多数的编辑器都可以。我个人爱好是resource workshop但你可以用你喜欢的。注意由于resource workshop创建的资源文件有时给资源编译带来麻烦,如果你想使用这个编辑器,你应当把tasm一起下下来,他里面包含了用于编译borland风格资源的brc32.exe

供选择:Symantec资源编辑器,资源创建者(builder)等等

文本编辑器

我的选择:ultraedit

网址:www.ultraedit.com

描述:一个文本编辑器需要说明吗?

关于:文本编辑器的选这是十分个人的。我非常喜欢ultraedit。你可以下载我为ultraedit写的语法文件,因而可以使汇编代码语法高亮。但至少,选一个支持语法高亮的文本编辑器(关键字会自动标色)。这非常有用而且它使你的代码更容易读且更容易写。Ultraedit还有一个可以使你在代码中快速跳转到某一个函数的函数列表。

供选择:数百万的文本编辑器中的一个

参考手册

我的选择:win32程序员参考手册

网址:www.crackstore.com(或搜索互联网)

描述:你需要许多关于API函数的参考。最重要的是“win32程序员参考手册”(win32.hlp)。这是个大文件,大约24mb(一些版本是12mb,但不全)。在这个文件中,对所有系统dll的函数(kernelusergdishell等)都做了说明。你至少需要这个文件,其他的参考(sock2.hlp, mmedia.hlp, ole.hlp等)是有帮助的但不必须。

供选择:N/A

(译者注:该教程写成较早,现在有极好的MSDN供选择)

2.  1安装工具

现在你已经得到这些工具了,把它们安装到某个地方。这有几个值得注意的地方:

masm包安装到你打算写汇编源程序的那个区。这保证了包含文件路径的正确性。把masm(和tasm)的bin目录加到autoexec.batpath中,重起。

如果你用ultraedit,使用你可以在前面下载的语法文件并启用functionlistview(函数列表视图)。

在某个地方创建一个win32文件夹(或其他你喜欢的名字),并为你创建的每一个工程创建一个子文件夹。

 

30 asm基础知识

这章将教你汇编语言的基础知识

1.  1伪代码(opcodes

汇编程序是用伪代码创建的。一个伪代码是一条处理器可以理解的指令。例如:

ADD

Add指令把两个数加到一起。大部分伪代码有参数

ADD eax, edx

ADD有两个参数。在加法的情况下,一个源一个目标。它把源值加到目标值中,并把结果保存在目标中。参数有很多不同的类型:寄存器,内存地址,直接数值(immediate values)如下:

3.  2寄存器

有几种大小的寄存器:8位,16位,32位(在MMX处理器中有更多)。在16位程序中,你仅能使用16位和8位的寄存器。在32位的程序中,你可以使用32位的寄存器。

一些寄存器是别的寄存器的一部分:例如,如果EAX保存了值EA7823BBh这里是其他寄存器的值。

EAX

EA

78

23

BB

AX

EA

78

23

BB

AH

EA

78

23

BB

AL

EA

78

23

BB

Ax,ah,al是eax的一部分。Eax是一个32位的寄存器(仅在386以上存在),ax包含了eax的低16位(2字节),ah包含了ax的高字节,而al包含了ax的低字节。因而ax是16位的,al和ax是8位的。在上面的例子中,这些是那些寄存器的值:

eax =
EA7823BB (32-bit)
ax = 23BB (16-bit)
ah = 23 (8-bit)
al = BB
(8-bit)

 

使用寄存器的例子(不要管那些伪代码,只看寄存器的说明)

mov eax,
12345678h

Mov把一个值载入寄存器(注意:12345678h是一个十六进制值,因为h这个后缀。

mov cl, ah

ax的高字节移入cl

sub cl, 10

cl的值中减去10(十进制)

mov al, cl

并把cl存入eax的最低字节

让我们来分析上面的代码:

mov指令可以把一个值从寄存器,内存和直接数值移入另一个寄存器。在上面的例子中,eax包含了12345678h,然后ah的值(eax左数第三个字节)被复制入了cl中(ecx寄存器的最低字节)。然后,cl10并移回al中(eax的最低字节)

寄存器的不同类型:

全功能(General Purpose

这些32位(它们的组成部分为16/8位)寄存器可以用来做任何事情:

eax (ax/ah/al)

加法器

ebx (bx/bh/bl)

基(base

ecx (cx/ch/cl)

计数器

edx (dx/dh/dl)

数据

虽然它们有名字,但是你可以用它们做任何事。

段(Segment)寄存器

段寄存器定义了哪一段内存被使用。你可能在win32asm中用不着它们,因为windows有一个平坦(flat)的内存系统。在Dos中,内存被分为64kb的段,因而如果你想要定一个内存地址。你指定一个段,并用一个offset(偏移址)(像0172:0500segmentoffset))。在windows中,段有4GB的大小,所以你在Windows中不需要段。段总是16位寄存器。

CS

代码段

DS

数据段

SS

栈段

ES

扩展段

FS (only 286+)

全功能段

GS (only 386+)

全功能段

指针寄存器

实际上,你可以把指针寄存器当作全功能寄存器来使用(除了eip),只要你保存并恢复它们的原始值。指针寄存器之所以这么叫是因为它们经常被用来存储内存地址。一些伪代码(movbscasb等)也要用它们。

esi (si)

源索引

edi (di)

目标索引

eip (ip)

指令指针

EIP(在16位编程中为ip)包含了指向处理器将要执行的下一条指令的指针。因而你不能把eip当作全功能寄存器来用。

栈寄存器

2个栈寄存器:espebpEsp装有内存中当前栈的位置(在下章中,对此有更多的内容)。Ebp在函数中被用成指向局部变量的指针。

esp (sp)

栈指针

ebp (bp)

基(base)指针

 

40内存

这部分将解释在Windows中内存是如何管理的。

3.  1Doswin3.xx

在像用于DosWin3.xx16位程序中,内存被分成许多个段。这些段的大小为64kb。为了存储内存,需要一个段指针和一个偏移址指针。段指针标明要使用哪个段,offset指针标明在段本身的位置。看下图:

内存

1

 (64kb)

2

(64kb)

3

 (64kb)

4

(64kb)

更多

注意下面关于16位程序的解释,后面有更多关于32位的(但不要跳过这部分,要理解32位的内存管理,这部分很重要)上表是全部的那内存,被划分成了64kb的多个段。最多有65536个段。现在取出一段:

1(64kb)

Offset 1

Offset 2

Offset 3

Offset 4

Offset 5

更多

为了指向段中的位置,需要使用offset。一个offset是段中内部的一个位置。每个段最多有65536offset。内存中地址的记法是:

SEGMENT:OFFSET

例如:

0030:4012(均为16进制)

它的意思是:段30offset4012。为了查看那个地址中有什么。你先要到段30,然后到该段的offset4012。在前一章中,你已经学过了段和指针寄存器。例如,段寄存器有:

CS

代码段

DS

数据段

SS

栈段

ES

扩展段

FS (only 286+)

全功能段

GS (only 386+)

全功能段

顾名思义:代码段(CS)包括了当前的代码执行到了哪部分。数据段是用来标明哪段中取出数据。栈指栈段(后面有更多)。ESFS, GS是全功能的寄存器,并且可以用于任何段(虽然在Windows中不行)。

指针寄存器大多数时装有offset,但全功能寄存器(ax, bx, cx, dx等)也可以这么用。Ip标明当前指令执行到了哪个offsetSp保存了当前栈的offset1,在ss(栈段中)。

42 32Windows

你可能已经注意到了关于段的一切是乏味的。在16位编程中,段是必不可少的。幸运的是,这个问题已经在32Windows95及以上)中得

抱歉!评论已关闭.