Tenloy's Blog

ARM64指令简易手册

Word count: 16.6kReading time: 61 min
2021/04/17 Share

ARM处理器的指令集可以分为跳转指令、数据处理指令、程序状态寄存器(PSR)处理指令、加载/存储指令、协处理器指令和异常产生指令6大指令。

本文只列举一些常见的基本指令,可以正常阅读汇编代码即可。有几个注意点:

  • 寄存器:为标号,不加前缀(ARM汇编中,标号就是一个符号,代表着汇编程序中指令或数据的内存地址)
  • 操作数顺序:目标操作数在左,源操作数在右
  • 立即数:前加#作为前缀
  • 寻址格式:常见的有三种
1
2
3
4
5
;寻址格式:
[x10, #0x10] ; signed offset。 意思是从 x10 + 0x10的地址取值
[sp, #-16]! ; pre-index。 意思是从 sp-16地址取值,取值完后在把 sp-16 writeback 回 sp
; ! 表示寄存器写回,如果没有!,那么只会从 sp-16 地址读写值,而不会修改 sp 的值
[sp], #16 ; post-index。 意思是从 sp 地址取值,取值完后在把 sp+16 writeback 回 sp
1
2
3
4
5
6
; 举例:
ldr x0, [x1] ; 从`x1`指向的地址里面取出一个 64 位大小的数存入 `x0`
ldp x1, x2, [x10, #0x10] ; 从 x10 + 0x10 指向的地址里面取出 2个 64位的数,分别存入x1, x2
str x5, [sp, #24] ; 把x5的值(64位数值)存到 sp+24 指向的内存地址上
stp x29, x30, [sp, #-16]! ; 把 x29, x30的值存到 sp-16的地址上,并且把 sp-=16.
ldp x29, x30, [sp], #16 ; 从sp地址取出 16 byte数据,分别存入x29, x30. 然后 sp+=16;

本文中检索不到,全面的可以查看ARM官网文档。如果想看中文版的资料可以看《汇编器指南》— 第二章、第四章

一、跳转指令

跳转指令用于实现程序流程的跳转,在ARM程序中有以下两种方法可以实现程序流程的跳转:

  • 使用专门的跳转指令;
  • 直接向程序计数器PC写入跳转地址值,通过向程序计数器PC写入跳转地址值,可以实现在4GB的地址空间中的任意跳转,在跳转之前结合使用MOV LR,PC等类似指令,可以保存将来的返回地址值,从而实现在4GB连续的线性地址空间的子程序调用。

ARM指令集中的跳转指令可以完成从当前指令向前或向后的32MB的地址空间的跳转,包括以下4条指令:

1. B指令

B指令是最简单的跳转指令。一旦遇到一个B指令,ARM处理器将立即跳转到给定的目标地址,从那里继续执行。

注意存储在跳转指令中的实际值是相对当前PC 值的一个偏移量,而不是一个绝对地址,它的值由汇编器来计算(参考寻址方式中的相对寻址)。它是24位有符号数,左移两位后有符号扩展为32 位,表示的有效偏移为26 位(前后32MB的地址空间)。

格式:

1
B{条件} 目标地址

示例:

1
2
3
B    Label      ; 程序无条件跳转到标号Label处执行
CMP R1, #0 ; 当CPSR寄存器中的Z条件码置位时,程序跳转到标号Label处执行
BEQ Label

补充:BNE与BEQ

1
2
3
4
5
6
TST  R0, #0X8
BNE SuspendUp ; BNE指令是“不相等(或不为0)跳转指令”:
LDR R1, #0x00000000

; 先进行and运算,如果R0的第四位不为1,则结果为零,则设置zero=1(继续下面的LDR指令);
; 否则,如果R0的第四位为1,zero=0(跳到SuspendUp处执行)。

tst 和 bne 连用:先是用tst进行位与运算,然后将位与的结果与0比较,如果不为0,则跳到bne紧跟着的标记(如bne sleep,则跳到sleep处)。
tst 和 beq 连用:先是用tst进行位与运算,然后将位与的结果与0比较,如果为0,则跳到beq紧跟着的标记(如bne AAAA,则跳到AAAA处)。

2. BL指令

BL是另一个跳转指令,但跳转之前,会在寄存器R14中保存PC的当前内容,因此,可以通过将R14的内容重新加载到PC中,来返回到跳转指令之后的那个 指令处执行。该指令是实现子程序调用的一个基本但常用的手段。

格式:

1
BL{条件} 目标地址

示例:

1
BL   Label      ; 当程序无条件跳转到标号Label处执行时,同时将当前的 PC值保存到R14(LR)中

3. BLX指令

BLX指令从ARM指令集跳转到指令中所指定的目标地址,并将处理器的工作状态有ARM状态切换到Thumb状态,该指令同时将PC的当前内容保存到寄存器R14中。因此,当子程序使用Thumb指令集,而调用者使用ARM指令集时,可以通过BLX指令实现子程序的调用和处理器工作状态的切换。同时,子程序的返回可以通过将寄存器R14值复制到PC中来完成。

格式:

1
BLX 目标地址

4. BX指令

BX指令跳转到指令中所指定的目标地址,目标地址处的指令既可以是ARM指令,也可以是Thumb指令。

格式:

1
BX{条件} 目标地址

二、数据处理指令

此类指令用于对通用寄存器执行运算。

  • 它们可对两个寄存器的内容执行加法、减法或按位逻辑等运算,并将结果存放到第三个寄存器中。
  • 还可以对单个寄存器中的值执行运算,或者对寄存器中的值与指令中提供的常数(立即值)执行运算。

数据处理指令可分为数据传送指令、比较指令和算术、逻辑运算指令等。

  • 数据传送指令用于在寄存器和存储器之间进行数据的双向传输;
  • 算术逻辑运算指令完成常用的算术与逻辑的运算,该类指令不但将运算结果保存在目的寄存器中,同时更新CPSR中的相应条件标志位;
  • 比较指令不保存运算结果,只更新CPSR中相应的条件标志位。

数据处理指令如下:

2.1 数据传送指令

1. MOV指令(传送)

MOV指令可完成从另一个寄存器、被移位的寄存器或将一个立即数加载到目的寄存器。

格式:

1
MOV{条件}{S} 目的寄存器,源操作数
  • S选项决定指令的操作是否影响CPSR中条件标志位的值,当没有S 时指令不更新CPSR中条件标志位的值。

示例:

1
2
3
MOV R1R0          ; 将寄存器R0的值传送到寄存器R1
MOV PCR14 ; 将寄存器R14的值传送到 PC,常用于子程序返回
MOV R1R0,LSL#3 ; 将寄存器R0的值左移3位后传送到R1

2. MVN指令(取反移动)

MVN指令可完成从另一个寄存器、被移位的寄存器、或将一个立即数加载到目的寄存器。与MOV指令不同之处是在传送之前按位被取反了,即把一个被取反的值 传送到目的寄存器中。

格式:

1
MVN{条件}{S} 目的寄存器,源操作数
  • S决定指令的操作是否影响CPSR中条件标志位的值,当没有S时指令不更新CPSR中条件标志位的值。

示例:

1
MVN R0#0   ; 将 立即数0取反传送到寄存器R0中,完成后R0=-1

2.2 比较指令

1. CMP指令(比较)

CMP指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行比较,同时更新CPSR中条件标志位的值。

格式:

1
CMP{条件} 操作数1,操作数2

该指令进行一次减法运算,但不存储结果,只更改条件标志位。 标志位表示的是操作数1与操作数2的关系(大、小、相等),例如,当操作数1大于操作操作数2,则此后的有GT后缀的指令将可以执行。

示例:

1
2
CMP   R1R0     ; 将寄存器R1的值与寄存器R0的值相减,并根据 结果设置CPSR的标志位
CMP R1#100 ; 将寄存器R1的值与立即数100相减,并根 据结果设置CPSR的标志位

2. CMN指令(负数比较)

CMN指令用于把一个寄存器的内容和另一个寄存器的内容或立即数取反后进行比较,同时更新CPSR中条件标志位的值。该指令实际完成操作数1和操作数2相 加,并根据结果更改条件标志位。

格式:

1
CMN{条件} 操作数1,操作数2

示例:

1
2
CMN   R1R0    ; 将寄存器R1的值与寄存器R0的值相加,并根据 结果设置CPSR 的标志位
CMN R1#100 ; 将寄存器R1的值与立即数100相加,并根据 结果设置CPSR的标志位

3. TST指令(位测试)

TST指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的与运算,并根据运算结果更新CPSR中条件标志位的值。

格式:

1
TST{条件} 操作数1,操作数2
  • 操作数1是要测试的数据,而操作数2是一个位掩码,该指令一般用来检测是否设置了特定的位。

示例:

1
2
TST   R1,#%1       ; 用于测试在寄存器R1中是否设置了最低位(%表 示二进制数)
TST R1#0xffe ; 将寄存器R1的值与立即数0xffe按位与,并根据 结果设置CPSR的标志位

4. TEQ指令(相等测试)

TEQ指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的异或运算,并根据运算结果更新CPSR中条件标志位的值。该指令通常用于比较操作数1和操作数2是否相等。

格式:

1
TEQ{条件} 操作数1,操作数2

示例:

1
TEQ  R1R2   ; 将寄存器R1的值与寄存器R2的值按位异或,并根据结果 设置CPSR的标志位

2.3 算术运算指令

1. ADD指令(相加)

ADD指令用于把两个操作数相加,并将结果存放到目的寄存器中。

格式:

1
ADD{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数1应是一个寄存器,操作数2可以是一个寄存器,被移位的寄存器,或一个立即数。

示例:

1
2
3
ADD     R0R1R2              ; R0 = R1 + R2
ADD R0R1#256 ; R0 = R1 + 256
ADD R0R2R3,LSL#1 ; R0 = R2 + (R3 << 1)

2. ADC指令(带进位相加)

ADC指令用于把两个操作数相加,再加上CPSR中的C条件标志位的值,并将结果存放到目的寄存器中。

格式:

1
ADC{条件}{S} 目的寄存器,操作数1,操作数2
  • 它使用一个进位标志位,这样就可以做比32位大的数的加法,注意不要忘记设置S后缀来更改进位标志。
  • 操作数1应是一个寄存器
  • 操作数2可以是一 个寄存器,被移位的寄存器,或一个立即数

示例:

以下指令序列完成两个128位数的加法,第一个数由高到低存放在寄存器R7~R4,第二个数由高到低存放在寄存器R11~R8,运算结果由高到低存放在寄 存器R3~R0:

1
2
3
4
ADDS    R0R4R8         ;  加低端的字
ADCS R1R5R9 ; 加第二个字,带进位
ADCS R2R6R10 ; 加第三个字,带进位
ADC R3R7R11 ; 加第四个字,带进位

3. SUB指令(相减)

SUB指令用于把操作数1减去操作数2,并将结果存放到目的寄存器中。

格式:

1
SUB{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数1应是一个寄存器
  • 操作数2可以是一个寄存器,被移位的寄存器,或一个立即数。

该指令可用于有符号数或无符号数的减法运算。

示例:

1
2
3
SUB     R0R1R2             ;  R0 = R1 - R2
SUB R0R1#256 ; R0 = R1 - 256
SUB R0R2R3,LSL#1 ; R0 = R2 - (R3 << 1)

4. SBC指令(带进位减法)

SBC指令用于把操作数1减去操作数2,再减去CPSR中的C条件标志位的反码,并将结果存放到目的寄存器中。

格式:

1
SBC{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数1应是一个寄存器
  • 操作数2可以是一个寄存器,被移位的寄存器,或一个立即数。

该指令使用进位标志来表示借位,这样就可以做大于32位的减法,注意不要忘记设置S后缀来更改进位标志。该指令可用于有符号数或无符号数的减法运算。

示例:

1
SUBS    R0R1R2    ; R0 = R1 - R2 - !C,并根据结果设置CPSR的进位标志位

5. RSB指令(逆向/反向减法)

RSB指令称为逆向减法指令,用于把操作数2减去操作数1,并将结果存放到目的寄存器中。

格式:

1
RSB{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数1应是一个寄存器
  • 操作数2可以是一个寄存器,被移位的寄存器,或一个立即数。

该指令可用于有符号数或无符号数的减法运算。

示例:

1
2
3
RSB     R0R1R2                  ;  R0 = R2 – R1
RSB R0R1#256 ; R0 = 256 – R1
RSB R0R2R3,LSL#1 ; R0 = (R3 << 1) - R2

6. RSC指令(反向带进位减)

RSC指令用于把 操作数2减去操作数1,再减去CPSR中的C条件标志位的反码,并将结果存放到目的寄存器中。

格式:

1
RSC{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数1应是一个寄存器操作
  • 数2可以是一个寄存器,被移位 的寄存器,或一个立即数。

该指令使用进位标志来表示借位,这样就可以做大于32位的减法,注意不要忘记设置S后缀来更改进位标志。该指令可用于有符号数或 无符号数的减法运算。

示例:

1
RSC     R0R1R2           ; R0 = R2 – R1 - !C

—乘法指令与乘加指令—

  • ARM 微处理器支持的乘法指令与乘加指令共有6条,可分为运算结果为32位和运算结果为64位两类。
  • 与前面的数据处理指令不同,指令中的所有操作数、目的寄存器 必须为通用寄存器,不能对操作数使用立即数或被移位的寄存器,同时,目的寄存器和操作数1必须是不同的寄存器。

1. MUL指令(相乘)

MUL指令完成将操作数1与操作数2的乘法运算,并把结果放置到目的寄存器中,同时可以根据运算结果设置CPSR中相应的条件标志位。

格式:

1
MUL{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数1和操 作数2均为32位的有符号数或无符号数。

示例:

1
2
MUL  R0R1R2            ; R0 = R1 × R2
MULS R0R1R2 ; R0 = R1 × R2,同时设置CPSR中的相关条件标志位

2. MLA指令(带累加的相乘)

MLA指令完成将操作数1与操作数2的乘法运算,再将乘积加上操作数3,并把结果放置到目的寄存器中,同时可以根据运算结果设置CPSR中相应的条件标志位。

格式:

1
MLA{条件}{S} 目的寄存器,操作数1,操作数2,操作数3
  • 操作数1和操作数2均为32位的有符号数或无符号数。

示例:

1
2
MLA   R0R1R2R3            ; R0 = R1 × R2 + R3
MLAS R0R1R2R3 ; R0 = R1 × R2 + R3,同时设置CPSR中的相关条件标志位

3. SMULL指令

SMULL指令完成将操作数1与操作数2的乘法运算,并把结果的低32位放置到目的寄存器Low中,结果的高32位放置到目的寄存器High中,同时可以 根据运算结果设置CPSR中相应的条件标志位。

格式:

1
SMULL{条件}{S}   目的寄存器Low,目的寄存器High,操作数1,操作数2
  • 操作数1和操作数2均为32位的有符号数。

示例:

1
2
SMULL   R0R1R2R3     ; R0 = (R2 × R3)的低32位
; R1 = (R2 × R3)的高32位

4. SMLAL指令

格式:

1
SMLAL{条件}{S}   目的寄存器Low,目的寄存器High,操作数1,操作数2

SMLAL指令完成将操作数1与操作数2的乘法运算,并把结果的低32位同目的寄存器Low中的值相加后又放置到目的寄存器Low中,结果的高32位同目的寄存器High中的值相加后又放置到目的寄存器High中,同时可以根据运算结果设置CPSR中相应的条件标志位。

  • 操作数1和操作数2均为32位的有符号数。
  • 对于目的寄存器Low,在指令执行前存放64位加数的低32位,指令执行后存放结果的低32位;
  • 对于目的寄存器High,在指令执行前存放64位加数的高32位,指令执行后存放结果的高32位。

示例:

1
2
SMLAL   R0R1R2R3       ; R0 = (R2 × R3)的低32位 + R0
; R1 = (R2 × R3)的高32位 + R1

5. UMULL指令

UMULL指令完成将操作数1与操作数2的乘法运算,并把结果的低32位放置到目的寄存器Low中,结果的高32位放置到目的寄存器High中,同时可以 根据运算结果设置CPSR中相应的条件标志位。

格式:

1
UMULL{条件}{S}   目的寄存器Low,目的寄存器High,操作数1,操作数2
  • 操作数1和操作数2均为32位的无符号数。

示例:

1
2
UMULL   R0R1R2R3       ; R0 = (R2 × R3)的低32位
; R1 = (R2 × R3)的高32位

6. UMLAL指令

格式:

1
UMLAL{条件}{S}   目的寄存器Low,目的寄存器High,操作数1,操作数2

UMLAL指令完成将操作数1与操作数2的乘法运算,并把结果的低32位同目的寄存器Low中的值相加后又放置到目的寄存器Low中,结果的高32位同目的寄存器High中的值相加后又放置到目的寄存器High 中,同时可以根据运算结果设置CPSR中相应的条件标志位。

  • 操作数1和操作数2均为32位的无符号数;
  • 对于目的寄存器Low,在指令执行前存放64位加数的低32位,指令执行后存放结果的低32位;
  • 对于目的寄存器High,在指令执行前存放64位加数的高32位,指令执行后存放结果的高32位。

示例:

1
2
UMLAL   R0R1R2R3            ; R0 = (R2 × R3)的低32位 + R0
; R1 = (R2 × R3)的高32位 + R1

2.4 逻辑运算指令

1. AND指令(逻辑位 与)

AND指令用于在两个操作数上进行逻辑与运算,并把结果放置到目的寄存器中。

格式:

1
AND{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数1应是一个寄存器
  • 操作数2可以是一个寄存器,被移位的寄存器,或一个立即数。

该指令常用于屏蔽操作数1的某些位。

示例:

1
AND     R0, R0, #3          ; 该指令保持R0的0、1位,其余位清零。

2. ORR指令(逻辑位 或)

ORR指令用于在两个操作数上进行逻辑或运算,并把结果放置到目的寄存器中。

格式:

1
ORR{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数1应是一个寄存器
  • 操作数2可以是一个寄存器,被移位的寄存器,或一个立即数。

该指令常用于设置操作数1的某些位。

示例:

1
ORR R0R0#3        ; 该指令设置R0的0、1位,其余位保持不变。

3. EOR指令(逻辑位 异或)

EOR指令用于在两个操作数上进行逻辑异或运算,并把结果放置到目的寄存器中。

格式:

1
EOR{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数1应是一个寄存器
  • 操作数2可以是一个寄存器,被移位的寄存器,或一个立即数

该指令常用于反转操作数1的某些位。

示例:

1
EOR R0R0#3        ; 该指令反转R0的0、1位,其余位保持不变。

4. BIC指令(位清零)

BIC指令用于清除操作数1的某些位,并把结果放置到目的寄存器中。

格式:

1
BIC{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数1应是一个寄存器
  • 操作数2可以是一个寄存器,被移位的寄存器,或一个立即数。 操作数2为32位的掩码,如果在掩码中设置了某一位,则清除这一位。未设置的掩码位保持不变。

示例:

1
BIC R0, R0, #%1011    ; 该指令清除R0中的位 0、1、和 3,其余的位保持不变。

5. LSL ASL(LSL逻辑左移、ASL算术左移)

LSL(或ASL)可完成对通用寄存器中的内容进行逻辑(或算术)的左移操作,按操作数所指定的数量向左移位,低位用零来填充。

格式:

1
通用寄存器,LSL(或ASL) 操作数
  • 操作数可以是通用寄存器,也可以是立即数(0~31)。

示例:

1
MOV   R0, R1, LSL #2          ; 将R1中的内容左移两位后传送到R0 中。

6. LSR(逻辑右移)

LSR可完成对通用寄存器中的内容进行右移的操作,按操作数所指定的数量向右移位,左端用零来填充。

格式:

1
通用寄存器,LSR 操作数
  • 操作数可以是通用寄存器,也可以是立即数(0~31)。

示例:

1
MOV   R0, R1, LSR #2         ; 将R1中的内容右移两位后传送到R0 中,左端用零来填充。

7. ASR(算术右移)

ASR可完成对通用寄存器中的内容进行右移的操作,按操作数所指定的数量向右移位,左端用第31位的值来填充。

格式:

1
通用寄存器,ASR 操作数
  • 操作数可以是通用寄存器,也可以是立即数(0~31)。

示例:

1
MOV    R0, R1, ASR #2        ; 将R1中的内容右移两位后传送到R0 中,左端用第31位的值来填充。

8. ROR(向右循环移)

ROR可完成对通用寄存器中的内容进行循环右移的操作,按操作数所指定的数量向右循环移位,左端用右端移出的位来填充。

格式:

1
通用寄存器,ROR 操作数
  • 其中,操作数可以是通用寄存器,也可以是立即数(0~31)。显然,当进行32位的循环右移操作时,通用寄存器中的值不改变。

示例:

1
MOV    R0, R1, ROR #2       ; 将R1中的内容循环右移两位后传送到R0 中。

9. RRX(带扩展向右循环移)

RRX可完成对通用寄存器中的内容进行带扩展的循环右移的操作,按操作数所指定的数量向右循环移位,左端用进位标志位C来填充。

格式:

1
通用寄存器,RRX 操作数
  • 操作数可以是通用寄存器,也可以是立即数(0~31)。

示例:

1
MOV   R0, R1, RRX #2         ; 将R1中的内容进行带扩展的循环右移两位 后传送到R0中。

三、程序状态寄存器访问指令

此类指令向通用寄存器或者从通用寄存器往外移动状态寄存器的内容。

1. MRS指令(从PSR移动到寄存器)

MRS指令用于将程序状态寄存器的内容传送到通用寄存器中。该指令一般用在以下两种情况:

  • 当需要改变程序状态寄存器的内容时,可用MRS将程序状态寄存器的内容读入通用寄存器,修改后再写回程序状态寄存器。
  • 当在异常处理或进程切换时,需要保存程序状态寄存器的值,可先用该指令读出程序状态寄存器的值,然后保存。

格式:

1
MRS{条件}  通用寄存器 程序状态寄存器(CPSR或SPSR)

示例:

1
2
MRS R0CPSR      ; 传送CPSR的内容到R0
MRS R0,SPSR ; 传送 SPSR的内容到R0

2. MSR指令(从寄存器移动到PSR)

MSR指令用于将操作数的内容传送到程序状态寄存器的特定域中。其中,操作数可以为通用寄存器或立即数。

格式:

1
MSR{条件}    程序状态寄存器(CPSR或SPSR)_<域>,操作数

<域>用于设置程序状态寄存器中需要 操作的位,32位的程序状态寄存器可分为4个域:

  • 位[31:24]为条件位域,用f表示;
  • 位[23:16]为状态位域,用s表示;
  • 位[15:8] 为扩展位域,用x表示;
  • 位[7:0] 为控制位域,用c表示;

该指令通常用于恢复或改变程序状态寄存器的内容,在使用时,一般要在MSR指令中指明将要操作的域。

示例:

1
2
3
MSR CPSR,R0        ; 传送R0的内容到CPSR
MSR SPSR,R0 ; 传送R0的内容到SPSR
MSR CPSR_cR0 ; 传送R0的内容到SPSR,但仅仅修改CPSR中的控制位域

四、加载/存储指令

ARM微处理器支持加载/存储指令用于在寄存器和存储器之间传送数据:

  • 加载指令用于将存储器中的数据传送到寄存器;
  • 存储指令则完成相反的操作。

数据在存储器中,都是二进制码,计算机单凭数据本身是无法区分数据格式(有符号、无符号、多少位是一个数据),甚至无法区分数据和代码的区别。这个取决于我们使用的汇编指令(计算机进行某些功能处理时候存在两套指令,分别为有符号和无符号数准备,汇编器会根据我们的源代码语义进行选择使用)。

此类指令用于从内存加载(load)单个寄存器的值,或者在内存中存储(store)单个寄存器的值。 它们可加载或存储 32 位字、16 位半字或 8 位有符号或无符号字节。 可以用符号或零扩展字节和半字加载以填充 32 位寄存器。

1
2
3
4
5
6
7
8
9
10
11
ldr = Load Word
ldrh = Load unsigned Half Word
ldrsh = Load signed Half Word
ldrb = Load unsigned Byte
ldrsb = Load signed Bytes

str = Store Word
strh = Store unsigned Half Word
strsh = Store signed Half Word
strb = Store unsigned Byte
strsb = Store signed Byte

上面的指令功能实现,需要依赖状态寄存器(CPSR, current program status register)。CPSR和其他寄存器不一样,其他寄存器是用来存放数据的,都是整个寄存器具有一个含义。而CPSR寄存器是按位起作用的,也就是说,它的每一位都有专门的含义,记录特定的信息。
也叫标记寄存器

  • CPSR寄存器是32位的
  • CPSR的低8位(包括I、F、T和M[4:0])称为控制位,程序无法修改,除非CPU运行于特权模式下,程序才能修改控制位。
  • N、Z、C、V均为条件标志位,分别代表运算过程中产生的状态。它们的内容可被算术或逻辑运算的结果所改变,并且可以决定某条指令是否被执行。

此外,还有多个寄存器加载和存储指令,此类指令可从内存加载通用寄存器的任何子集,或者在内存中存储这样的子集。

常用的加载存储指令如下:

1. LDR指令

LDR指令用于从存储器中将一个32位的字数据传送到目的寄存器中。该指令通常用于从存储器中读取32位的字数据到通用寄存器,然后对数据进行处理。

格式:

1
LDR{条件} 目的寄存器,<存储器地址>
  • 当程序计数器PC作为目的寄存器时,指令从存储器中读取的字数据被当作目的地址,从而可以实现程序流程的跳转。

该指令在程序设计中比较常用,且寻址方式灵活多样,请读者认真掌握。

示例:

1
2
3
4
5
6
7
8
LDR R0,[R1]             ; 将存储器地址为R1的字数据读入寄存器R0。
LDR R0,[R1R2] ; 将存储器地址为R1+R2的字数据读入寄存器R0。
LDR R0,[R1#8] ; 将存储器地址为R1+8的字数据读入寄存器R0。
LDR R0,[R1R2] ! ; 将存储器地址为R1+R2的字数据读入寄存器R0,并将新地址R1+R2写入R1。
LDR R0,[R1#8] ! ; 将存储器地址为R1+8的字数据读入寄存器R0,并将新地址 R1+8写入R1。
LDR R0,[R1],R2 ; 将存储器地址为R1的字数据读入寄存器R0,并将新地址 R1+R2写入R1。
LDR R0,[R1R2,LSL#2]! ; 将存储器地址为R1+R2×4的字数据读入寄存器R0,并将新地址R1+R2×4写入R1。
LDR R0,[R1],R2,LSL#2 ; 将存储器地址为R1的字数据读入 寄存器R0,并将新地址R1+R2×4写入R1。

2. LDRB指令

LDRB指令用于从存储器中将一个8位的字节数据传送到目的寄存器中,同时将寄存器的高24位清零。 该指令通常用于从存储器中读取8位的字节数据到通用寄存器,然后对数据进行处理。

格式:

1
LDR{条件}B 目的寄存器,<存储器地址>
  • 当程序计数器PC作为目的寄存器时,指令从存储器中读取的字数据被当作目的地址,从而可以实现程序流程的跳转。

示例:

1
2
LDRB R0,[R1]           ; 将存储器地址为R1的字节数据读入寄存器R0,并将R0的高24位清零。
LDRB R0,[R1#8] ; 将存储器地址为R1+8的字节数据读入寄存器R0,并将R0的高24位清零。

3. LDRH指令

LDRH指令用于从存储器中将一个16位的半字数据传送到目的寄存器中,同时将寄存器的高16位清零。 该指令通常用于从存储器中读取16位的半字数据到通用寄存器,然后对数据进行处理。

格式:

1
LDR{条件}H 目的寄存器,<存储器地址>
  • 当程序计数器PC作为目的寄存器时,指令从存储器中读取的字数据被当作目的地址,从而可以实现程序流程的跳转。

示例:

1
2
3
LDRH   R0,[R1]         ; 将存储器地址为R1的半字数据读入寄存器 R0,并将R0的高16位清零。
LDRH R0,[R1#8] ; 将存储器地址为R1+8的半字数据读入寄存器R0,并将R0 的高16位清零。
LDRH R0,[R1R2] ; 将存储器地址为R1+R2的半字数据读入寄存器R0,并将 R0的高16位清零。

4. LDP指令

LDP指令用于从内存中加载两个通用寄存器的值。

格式:

1
LDP <Xt1>, <Xt2>, [<Xn|SP>{, #<imm>}]

5. STR指令

STR指令用于从源寄存器中将一个32位的字数据传送到存储器中。 该指令在程序设计中比较常用,且寻址方式灵活多样,使用方式可参考指令LDR。

格式:

1
STR{条件} 源寄存器,<存储器地址>

示例:

1
2
STR R0,[R1],#8           ; 将R0中的字数据写入以R1为地址的存储器中,并将新地址R1+8写入R1。
STR R0,[R1#8] ; 将R0中的字数据写入以R1+8为地址的存储器中。

6. STRB指令

STRB指令用于从源寄存器中将一个8位的字节数据传送到存储器中。该字节数据为源寄存器中的低8位。

格式:

1
STR{条件}B 源寄存器,<存储器地址>

示例:

1
2
STRB    R0,[R1]             ; 将寄存器R0中的字节数据写入以R1为地 址的存储器中。
STRB R0,[R1#8] ; 将寄存器R0中的字节数据写入以R1+8为地址的存 储器中。

7. STRH指令

STRH指令用于从源寄存器中将一个16位的半字数据传送到存储器中。该半字数据为源寄存器中的低16位。

格式:

1
STR{条件}H 源寄存器,<存储器地址>

示例:

1
2
STRH   R0,[R1]            ; 将寄存器R0中的半字数据写入以R1为地址的 存储器中。
STRH R0,[R1#8] ; 将寄存器R0中的半字数据写入以R1+8 为地址的存储器中。

8. STP指令

STP指令用于将两个(一对pair)通用寄存器的值存储到内存中。

格式:

1
STP <Xt1>, <Xt2>, [<Xn|SP>{, #<imm>}]

9. ADR指令

将一个立即值与 pc 值相加,并将结果写入目标寄存器

格式:

1
ADR{cond}{.W}  Rd,label

10. ADRP指令

以页为单位的大范围的地址读取指令,这里的P就是page的意思。取得page的基地址存入寄存器

格式:

1
ADRP{cond}  Rd  label

示例:

1
2
3
4
5
adrp    x2, .LANCHOR0   ; .LANCHOR0是个<lable>——一个大小为4KB的页的基址,指令的作用就是将该页的基址存到寄存器x2中

; 示例2:
adrp x0, l_.str@PAGE ; 将符号l.str所在的page基址读入x0
add x0, x0, l_.str@PAGEOFF ; x0 = x0 + l.str所在page中的偏移量

—批量数据加载/存储指令—

ARM微处理器所支持批量数据加载/存储指令可以一次在一片连续的存储器单元和多个寄存器之间传送数据,批量加载指令 用于将一片连续的存储器中的数据传送到多个寄存器,批量数据存储指令则完成相反的操作。

常用的加载存储指令如下:

1. LDM(STM)指令(加载、存储多个寄存器)

LDM(或STM)指令用于从由基址寄存器所指示的一片连续存储器到寄存器列表所指示的多个寄存器之间传送数据,该指令的常见用途是将多个寄存器的内容入栈或出栈。

格式:

1
LDM(或STM){条件}{类型} 基址寄存器{!},寄存器列表{∧}

其中:

  • {类型} 为 以下几种情况:
    • IA 每次传送后地址加1;
    • IB 每次传送前地址加1;
    • DA 每次传送后地址减1;
    • DB 每次传送前地址减1;
    • FD 满递减堆栈;
    • ED 空递减堆栈;
    • FA 满递增堆栈;
    • EA 空递增堆栈;
  • {!} 为可选后缀,若选用该后缀,则当数据 传送完毕之后,将最后的地址写入基址寄存器,否则基址寄存器的内容不改变。
    • 基址寄存器不允许为R15,寄存器列表可以为R0~R15的任意组合。
  • {∧} 为可选后缀,当指令为LDM且寄存器列表中包含R15,选用该后缀时表示:除了正常的数据传送之外,还将SPSR复制到CPSR。同时,该后缀还表 示传入或传出的是用户模式下的寄存器,而不是当前模式下的寄存器。

示例:

1
2
STMFD R13!,{R0R4-R12LR}        ; 将寄存器列表中的寄存器(R0,R4到R12,LR)存入堆栈。
LDMFD R13!, {R0R4-R12PC} ; 将堆栈内容恢复到寄存器(R0,R4到R12,PC)。

—数据交换指令—

在寄存器和内存之间交换数据

1. SWP指令

格式:

1
SWP{条件} 目的寄存器,源寄存器1,[源寄存器2]

SWP指令用于将源寄存器2所指向的存储器中的字数据传送到目的寄存器中,同时将源寄存器1中的字数据传送到源寄存器2所指向的存储器中。显然,当源寄存器1和目的寄存器为同一个寄存器时,指令交换该寄存器和存储器的内容。

示例:

1
2
SWP   R0R1,[R2]     ; 将R2所指向的存储器中的字数据传送到R0,同时将R1 中的字数据传送到R2所指向的存储单元。
SWP R0R0,[R1] ; 该指令完成将R1所指向的存储器中的字数 据与R0中的数据交换。

SWP{B}:B是一个可选的后缀。如果存在 B,则交换一个字节。否则,交换一个32位字。

2. SWPB指令

格式:

1
SWP{条件}B 目的寄存器,源寄存器1,[源寄存器2]

SWPB指令用于将源寄存器2所指向的存储器中的字节数据传送到目的寄存器中,目的寄存器的高24清零,同时将源寄存器1中的字节数据传送到源寄存器2所指向的存储器中。

显然,当源寄存器1和目的寄存器为同一个寄存器时,指令交换该寄存器和存储器的内容。

示例:

1
2
SWPB   R0R1,[R2]       ; 将R2所指向的存储器中的字节数据传送到 R0,R0的高24位清零,同时将R1中的低8位数据传送到R2所指向的存储单元。
SWPB R0R0,[R1] ; 该指令完成将R1所指向的存储器中的 字节数据与R0中的低8位数据交换。

五、协处理器指令

此类指令支持一种用于扩展 ARM 体系结构的通用方式。

ARM 微处理器可支持多达 16 个协处理器,用于各种协处理操作,在程序执行的过程中,每个协处理器只执行针对自身的协处理指令,忽略 ARM 处理器和其他协处理器的指令。

ARM 的协处理器指令主要用于 ARM 处理器初始化 ARM 协处理器的数据处理操作,以及在ARM 处理器的寄存器和协处理器的寄存器之间传送数据,和在 ARM 协处理器的寄存器和存储器之间传送数据。

1. CDP指令

CDP指令用于ARM处理器通知ARM协处理器执行特定的操作,若协处理器不能成功完成特定的操作,则产生未定义指令异常。

格式:

1
CDP{条件} 协处理器编码,协处理器操作码1,目的寄存器,源寄存器1,源寄存器2,协处理器操作码2

其中协处理器操作码1和协处理 器操作码2为协处理器将要执行的操作,目的寄存器和源寄存器均为协处理器的寄存器,指令不涉及ARM处理器的寄存器和存储器。

示例:

1
CDP   P32C12C10C34  ; 该指令完成协处理器P3的初始化 

2. LDC指令

LDC指令用于将源寄存器所指向的存储器中的字数据传送到目的寄存器中,若协处理器不能成功完成传送操作,则产生未定义指令异常。

格式:

1
LDC{条件}{L} 协处理器编码,目的寄存器,[源寄存器]

其中,{L}选项表示指 令为长读取操作,如用于双精度数据的传输。

示例:

1
LDC   P3C4,[R0]        ; 将ARM处理器的寄存器R0所指向的存储器中的字数 据传送到协处理器P3的寄存器C4中。 

3. STC指令

STC指令用于将源寄存器中的字数据传送到目的寄存器所指向的存储器中,若协处理器不能成功完成传送操作,则产生未定义指令异常。

格式:

1
STC{条件}{L} 协处理器编码,源寄存器,[目的寄存器]

其中,{L}选项表示指 令为长读取操作,如用于双精度数据的传输。

示例:

1
STC   P3C4,[R0]     ; 将协处理器P3的寄存器C4中的字数据传送到ARM处理 器的寄存器R0所指向的存储器中。 

4. MCR指令

MCR指令用于将ARM处理器寄存器中的数据传送到协处理器寄存器中,若协处理器不能成功完成操作,则产生未定义指令异常。

格式:

1
MCR{条件} 协处理器编码,协处理器操作码1,源寄存器,目的寄存器1,目的寄存器2,协处理器操作码2

其中协处理器操作码1和协处理 器操作码2为协处理器将要执行的操作,源寄存器为ARM处理器的寄存器,目的寄存器1和目的寄存器2均为协处理器的寄 存器。

示例:

1
MCR   P33R0C4C56     ; 将ARM处理器寄存器R0中的数据传送到协处 理器P3的寄存器C4和C5中。 

5. MRC指令

MRC指令用于将协处理器寄存器中的数据传送到ARM处理器寄存器中,若协处理器不能成功完成操作,则产生未定义指令异常。

格式:

1
MRC{条件} 协处理器编码,协处理器操作码1,目的寄存器,源寄存器1,源寄存器2,协处理器操作码2

其中协处理器操作码1和协处理器操作码2为协处理器将要执行的操作,目的寄存器为ARM处理器的寄存器,源寄存器1和源寄存器2均为协处理器的寄存器。

示例:

1
MRC   P33R0C4C56     ; 该指令将协处理器P3的寄存器中的数据传送到 ARM处理器寄存器中。

六、异常产生指令

ARM指令集中提供了两条产生异常的指令,通过这两条指令可以用软件的方法实现异常。

1. SWI指令

SWI指令用于产生软件中断,以便用户程序能调用操作系统的系统例程。操作系统在SWI的异常处理程序中提供相应的系统服务。

格式:

1
SWI{条件} 24位的立即数

指令中24位的立即数指定用户程序调用系统例程的类型,相关参数通过通用寄存器传递,当指令中24位的立即数被忽略时,用户程序调用系统例程的类型由通用寄存器R0的内容决定,同时,参数通过其他通用寄存器传递。

示例:

1
SWI   0x02     ; 该指令调用操作系统编号位02的系统例程。

2. BKPT指令

BKPT指令产生软件断点中断,可用于程序的调试。

格式:

1
BKPT   16位的立即数

ARM汇编伪指令

在ARM汇编语言程序里,有一些特殊指令助记符,这些助记符与指令系统的助记符不同,没有相对应的操作码,通常称这些特殊指令助记符为伪指令,他们所完成的操作称为伪操作。

伪指令在源程序中的作用是为完成汇编程序作各种准备工作的,这些伪指令仅在汇编过程中起作用,一旦汇编结束,伪指令的使命就完成。

在ARM 的汇编程序中,有如下几种伪指令:符号定义伪指令、数据定义伪指令、汇编控制伪指令(包括宏指令)、以及其他伪指令。

一、符号定义(Symbol Definition)伪指令

符号定义伪指令用于定义ARM 汇编程序中的变量、对变量赋值以及定义寄存器的别名等操作。
常见的符号定义伪指令有如下几种:

  • 用于定义全局变量的GBLA 、GBLL 和GBLS 。
  • 用于定义局部变量的LCLA 、LCLL 和LCLS 。
  • 用于对变量赋值的SETA 、SETL 、SETS 。
  • 为通用寄存器列表定义名称的RLIST 。

1. GBLA、GBLL 和GBLS

GBLA 、GBLL 和GBLS 伪指令用于定义一个ARM 程序中的全局变量,并将其初始化。其中:

  • GBLA 伪指令用于定义一个全局的数字变量,并初始化为0 ;
  • GBLL 伪指令用于定义一个全局的逻辑变量,并初始化为F(假);
  • GBLS 伪指令用于定义一个全局的字符串变量,并初始化为空;

由于以上三条伪指令用于定义全局变量,因此在整个程序范围内变量名必须唯一。

格式:

1
GBLA(GBLLGBLS)全局变量名

示例:

1
2
3
4
5
6
7
8
GBLA Test1            ; 定义一个全局的数字变量,变量名为 Test1。    
Test1 SETA 0xaa ; 将该变量赋值为0xaa。

GBLL Test2 ; 定义一个全局的逻辑变量,变量名为 Test2。
Test2 SETL {TRUE} ; 将该变量赋值为真。

GBLS Test3 ; 定义一个全局的字符串变量,变量名为 Test3。
Test3 SETS “Testing” ; 将该变量赋值为"Testing”。

2. LCLA、LCLL 和LCLS

LCLA 、LCLL 和LCLS 伪指令用于定义一个ARM 程序中的局部变量,并将其初始化。其中:

  • LCLA伪指令用于定义一个局部的数字变量,并初始化为0 ;
  • LCLL伪指令用于定义一个局部的逻辑变量,并初始化为F(假);
  • LCLS伪指令用于定义一个局部的字符串变量,并初始化为空;

以上三条伪指令用于声明局部变量,在其作用范围内变量名必须唯一。

格式:

1
LCLA(LCLLLCLS) 局部变量名

示例:

1
2
3
4
5
6
7
8
LCLA Test4             ; 声明一个局部的数字变 量,变量名为Test4。  
Test3 SETA 0xaa ; 将该变量赋值为0xaa。

LCLL Test5 ; 声明一个局部的逻辑变 量,变量名为Test5。
Test4 SETL {TRUE} ; 将该变量赋值为真。

LCLS Test6 ; 定义一个局部的字 符串变量,变量名为Test6。
Test6 SETS “Testing” ; 将该变量赋值为 "Testing”。

3. SETA、SETL 和SETS

伪指令 SETA 、SETL 、SETS 用于给一个已经定义的全局变量或局部变量赋值。

  • SETA伪指令用于给一个数学变量赋值;
  • SETL伪指令用于给一个逻辑变量赋值;
  • SETS伪指令用于给一个字符串变量赋值;

其中,变量名为已经定义过的全局变量或局部变量,表达式为将要赋给变量的值。

格式:

1
变量名 SETA(SETLSETS) 表达式

示例:

1
2
3
4
LCLA Test3              ; 声明一个局部的数字变量,变量名为 Test3。
Test3 SETA 0xaa ; 将该变量赋值为0xaa。
LCLL Test4 ; 声明一个局部的逻辑变量,变量名为 Test4。
Test4 SETL {TRUE} ; 将该变量赋值为真。

4. RLIST

RLIST伪指令可用于对一个通用寄存器列表定义名称,使用该伪指令定义的名称可在ARM 指令 LDM/STM中使用。

在LDM/STM指令中,列表中的寄存器访问次序为根据寄存器的编号由低到高,而与列表中的寄存器排列次序无关。

格式:

1
名称 RLIST { 寄存器列表 }

示例:

1
RegList RLIST {R0-R5R8R10}  ; 将寄存器列表名称定义为 RegList ,可在ARM指令LDM/STM中通过该名称访问寄存器列表。

二、数据定义(Data Definition)伪指令

数据定义伪指令一般用于为特定的数据分配存储单元,同时可完成已分配存储单元的初始化。
常见的数据定义伪指令有如下几种:

  • DCB:用于分配一片连续的字节存储单元并用指定的数据初始化。
  • DCW(DCWU):用于分配一片连续的半字存储单元并用指定的数据初始化。
  • DCD(DCDU):用于分配一片连续的字存储单元并用指定的数据初始化。
  • DCFD(DCFDU):用于为双精度的浮点数分配一片连续的字存储单元并用指定的数据初始化。
  • DCFS(DCFSU):用于为单精度的浮点数分配一片连续的字存储单元并用指定的数据初始化。
  • DCQ(DCQU):用于分配一片以8字节为单位的连续的存储单元并用指定的数据初始化。
  • SPACE:用于分配一片连续的存储单元。
  • MAP:用于定义一个结构化的内存表首地址。
  • FIELD:用于定义一个结构化的内存表的数据域。

1. DCB

DCB伪指令用于分配一片连续的字节存储单元并用伪指令中指定的表达式初始化。

格式:

1
标号 DCB 表达式
  • 表达式可以为0~255的数字或字符串。
  • DCB 也可用 “=” 代替。

示例:

1
Str DCB “This is a test” ; 分配一片连续的字节存储单元并初始化。 

2. DCW(或DCWU)

DCW(或DCWU)伪指令用于分配一片连续的半字存储单元并用伪指令中指定的表达式初始化。

格式:

1
标号 DCW (或DCWU) 表达式
  • 表达式可以为程序标号或数字表达式。

用DCW分配的字存储单元是半字对齐的,而用DCWU分配的字存储单元并不严格半字对齐。

示例:

1
DataTest DCW 123 ; 分配一片连续的半字存储单元并初始化。

3. DCD(或DCDU)

DCD(或DCDU)伪指令用于分配一片连续的字存储单元并用伪指令中指定的表达式初始化。

格式:

1
标号 DCD(或DCDU) 表达式
  • 表达式可以为程序标号或数字表达式。
  • DCD也可 用”&” 代替。

用DCD分配的字存储单元是字对齐的,而用DCDU分配的字存储单元并不严格字对齐。

示例:

1
DataTest DCD 4 , 5 , 6 ; 分配一片连续的字存储单元并初始化。 

4. DCFD(或DCFDU)

DCFD(或DCFDU)伪指令用于为双精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。

每个双精度的浮点数占据两个字单元。

用 DCFD分配的字存储单元是字对齐的,而用DCFDU分配的字存储单元并不严格字对齐。

格式:

1
标号 DCFD(或DCFDU) 表达式

示例:

1
FDataTest DCFD 2E115 , -5E7 ; 分配一片连续的字存储单元并初始化 为指定的双精度数。

5. DCFS(或DCFSU)

DCFS(或DCFSU)伪指令用于为单精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。

每个单精度的浮点数占据一个字单元。

用 DCFS分配的字存储单元是字对齐的,而用DCFSU分配的字存储单元并不严格字对齐。

格式:

1
标号 DCFS(或DCFSU) 表达式

示例:

1
FDataTest DCFS 2E5 ,-5E -7 ; 分配一片连续的字存储单元并初始化为 指定的单精度数。

6. DCQ(或DCQU)

DCQ(或DCQU)伪指令用于分配一片以8个字节(双字)为单位的连续存储区域并用伪指令中指定的表达式初始化。

用DCQ分配的存储单元是字对齐的,而用DCQU 分配的存储单元并不严格字对齐。

格式:

1
标号 DCQ(或DCQU) 表达式

示例:

1
DataTest DCQ 100   ; 分配一片连续的存储单元并初始化为指定的值。 

7. SPACE

SPACE伪指令用于分配一片连续的存储区域并初始化为0。

格式:

1
标号 SPACE 表达式
  • 表达式为要分配的字节数
  • SPACE也可用 “%” 代替

示例:

1
DataSpace SPACE 100 ; 分配连续100字节的存储单元并初始化为0 。

8. MAP

MAP伪指令用于定义一个结构化的内存表的首地址。

格式:

1
MAP 表达式 { ,基址寄存器 }
  • MAP也可用 “^” 代替。
  • 表达式可以为程序中的标号或数学表达式
  • 基址寄存器为可选项,当基址寄存器选项不存在时,表达式的值即为内存表的首地址,当该选项存在时,内存表的首地址为表达式的值与基址寄存器的和。

MAP伪指令通常与FIELD伪指令配合使用来定义结构化的内存表。

示例:

1
MAP 0x100 , R0  ; 定义结构化内存表首地址的值为0x100+R0 。 

9. FILED

FIELD伪指令用于定义一个结构化内存表中的数据域。

格式:

1
标号 FIELD 表达式
  • FILED 也可用 “#” 代替。
  • 表达式的值为当前数据域在内存表中所占的字节数。

FIELD伪指令常与MAP伪指令配合使用来定义结构化的内存表。MAP伪指令定义内存表的首地址,FIELD伪指令定义内存表中的各个数据域,并可以为 每个数据域指定一个标号供其他的指令引用。

注意MAP和FIELD伪指令仅用于定义数据结构,并不实际分配存储单元。

示例:

1
2
3
4
MAP 0x100    ; 定义结构化内存表首地址的值为0x100。
A FIELD 16 ; 定义A的长度为16字节,位置为0x100。
B FIELD 32 ; 定义B的长度为32字节,位置为0x110。
S FIELD 256 ; 定义S的长度为256字节,位置为0x130。

三、汇编控制(Assembly Control)伪指令

汇编控制伪指令用于控制汇编程序的执行流程,常用的汇编控制伪指令包括以下几条:

1. IF、ELSE、ENDIF

IF 、ELSE 、ENDIF伪指令能根据条件的成立与否决定是否执行某个指令序列。

格式:

1
2
3
4
5
IF 逻辑表达式
指令序列 1
ELSE
指令序列 2
ENDIF
  • 当IF后面的逻辑表达式为真,则执行指令序列1 ,否则执行指令序列2 。
  • ELSE及指令序列2可以没有,此时,当IF后面的逻辑表达式为真,则执行指令序列1 ,否则继续执行后面的指令。

IF 、ELSE 、ENDIF伪指令可以嵌套使用。

示例:

1
2
3
4
5
6
GBLL Test ; 声明一个全局的逻辑变量,变量名为Test   
IF Test = TRUE
指令序列 1
ELSE
指令序列 2
ENDIF

2. WHILE、WEND

WHILE 、WEND伪指令能根据条件的成立与否决定是否循环执行某个指令序列。

格式:

1
2
3
WHILE 逻辑表达式
指令序列
WEND

当WHILE后面的逻辑表达式为真,则执行指令序列,该指令序列执行完毕后,再判断逻辑表达式的值,若为真则继续执行,一直到逻辑表达式的值为假。

WHILE 、WEND伪指令可以嵌套使用。

示例:

1
2
3
4
5
6
GBLA Counter   ; 声明一个全局的数学变量,变量名为Counter
Counter SETA 3 ; 由变量Counter 控制循环次数
……
WHILE Counter < 10
指令序列
WEND

3. MACRO、MEND

MACRO 、MEND伪指令可以将一段代码定义为一个整体,称为宏指令,然后就可以在程序中通过宏指令多次调用该段代码。

格式:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
MACRO  ; 标识宏定义的开始.  
; 包含在MACRO和MEND之间的指令序列称为宏定义体
; 在一个符号前使用$表示程序被汇编时将使用相应的值来替代$后的符号
[$标号(label)] 宏名 {$参数1, $参数2, ...} ; 在宏定义体的第一行应声明宏的原型(包含宏名、所需的参数)
; [$标号] 在宏指令被展开时,被替换为用户定义的符号。
; $label是一个可选参数。
; 当宏定义体中用到多个标号时,可以使用类似$label.$internallabel的标号命名规则使程序易读。
; $参数为宏指令的参数。当宏指令被展开时将被替换成相应的值,类似于函数中的形式参数,可以在宏定义时为参数指定相应的默认值。
; ...
指令序列
; ...
MEND ; 标识宏定义的开始

; 定义后,就可以在汇编程序中通过宏名来 调用该指令序列。宏指令可以使用一个或多个参数,当宏指令被展开时,这些参数被相应的值替换。
; 在源程序被编译时,汇编器将宏调用展开。用宏定义中的指令序列代替程序中的宏调用

[$label] 到底有什么作用?

当宏定义体内部跳转时,这个参数会起到至关重要的作用。要想在宏内部跳转,就必须在宏定义体内部有程序标号如(LOOP),如果不使用参数($label),当在一个程序段内调用两次宏的时候,编译器就会出现错误,因为当汇编时产生了两个相同名字的程序标号。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
; 宏的定义体:
MACRO
$PM DELAY $CanShu
$PM
LDR R7,=$CanShu ;
;LDR R7,[R7] ;此时参数是一个立即数 如果是变量的话 是会用到这一句
$PM.LOOP
SUBS R7,R7,#0X01
BNE $PM.LOOP
MEND


; 在程序段中的使用:(使用两次)
...
AA DELAY 0X000005F0 ; 0x00000FF0是一个参数 在此处是一个立即数,用户可自行使用为变量等
...
BB DELAY 0X00000FF0
...

; 此时调用多次,编译器就不会出现问题,例子中的AA和BB仅仅是一个标号,用户可以自行书写,因为在宏指令被展开时,这个符号在汇编时将使用相应的值替代

宏指令的使用方式和功能与子程序有些相似,子程序可以提供模块化的程序设计、节省存储空间并提高运行速度。但在使用子程序结构时需要保护现场,从而增加了 系统的开销,因此,在代码较短且需要传递的参数较多时,可以使用宏指令代替子程序。

MACRO、MEND伪指令可以嵌套使用。

4. MEXIT

MEXIT用于从宏定义中跳转出去。

格式:

1
MEXIT

四、其他常用的伪指令

还有一些其他的伪指令,在汇编程序中经常会被使用,包括以下几条:

1. AREA

AREA伪指令用于定义一个代码段或数据段。

格式:

1
AREA 段名 属性1 ,属性2 ,……
  • 段名若以数字开头,则该段名需用“|”括起来,如:|1_test| 。
  • 属性字段表示该代码段(或数据段)的相关属性,多个属性用逗号分隔。常用的属性如下:
    • CODE 属性:用于定义代码段,默认为READONLY 。
    • DATA 属性:用于定义数据段,默认为READWRITE 。
    • READONLY 属性:指定本段为只读,代码段默认为READONLY 。
    • READWRITE 属性:指定本段为可读可写,数据段的默认属性为READWRITE 。
    • ALIGN 属性:使用方式为ALIGN表达式。在默认时,ELF(可执行连接文件)的代码段和数据段是按字对齐的,表达式的取值范围为0~31,相应的对齐方式为2 表达式次方。
    • COMMON 属性:该属性定义一个通用的段,不包含任何的用户代码和数据。各源文件中同名的COMMON段共享同一段存储单元。

一个汇编语言程序至少要包含一个段,当程序太长时,也可以将程序分为多个代码段和数据段。

示例:

1
AREA Init ,CODEREADONLY   ; 该伪指令定义了一个代码段,段 名为Init ,属性为只读。

2. ALIGN

ALIGN伪指令可通过添加填充字节的方式,使当前位置满足一定的对齐方式。

格式:

1
ALIGN { 表达式 { ,偏移量 }}
  • 表达式的值用于指定对齐方式,可能的取值为2的幂,如1 、2 、4 、8 、16 等。若未指定表达式,则将当前位置对齐到下一个字的位置。
  • 偏移量也为一个数字表达式,若使用该字段,则当前位置的对齐方式为:2的表达式次幂+偏移量。

示例:

1
2
3
AREA Init ,CODEREADONLY ,ALIEN=3  ; 指定后面的指令为8字节对齐。
指令序列
END

3. CODE16、CODE32

若在汇编源程序中同时包含ARM指令和Thumb指令时,可用CODE16伪指令通知编译器其后的指令序列为16位的Thumb指令,CODE32伪指令 通知编译器其后的指令序列为32位的ARM指令。

因此,在使用ARM指令和Thumb指令混合编程的代码里,可用这两条伪指令进行切换,但注意他们只通知 编译器其后指令的类型,并不能对处理器进行状态的切换。

格式:

1
CODE16(或CODE32

示例:

1
2
3
4
5
6
7
8
9
AREA Init ,CODEREADONLY   ……
CODE32 ; 通知编译器其后的指令为32位的 ARM指令
LDR R0 ,=NEXT+1 ; 将跳转地址放入寄存器R0
BX R0 ; 程序跳转到新的位置执行, 并将处理器切换到Thumb工作状态
……
CODE16 ; 通知编译器其后的指令为16位的 Thumb指令
NEXT LDR R3,=0x3FF
……
END ;

4. ENTRY

ENTRY伪指令用于指定汇编程序的入口点。在一个完整的汇编程序中至少要有一个ENTRY(也可以有多个,当有多个ENTRY时,程序的真正入口点由链 接器指定),但在一个源文件里最多只能有一个ENTRY(可以没有)。

格式:

1
ENTRY

示例:

1
2
3
AREA Init ,CODEREADONLY
ENTRY ; 指定应用程序的入口点
……

5. END

END伪指令用于通知编译器已经到了源程序的结尾。

格式:

1
END

示例:

1
2
3
AREA Init ,CODEREADONLY
……
END ; 指定应用程序的结尾

6. EQU

EQU伪指令用于为程序中的常量、标号等定义一个等效的字符名称,类似于C语言中的#define 。

格式:

1
名称 EQU 表达式 { ,类型 }
  • EQU可用“*”代替。
  • 名称为EQU伪指令定义的字符名称
  • 当表达式为32位的常量时,可以指定表达式的数据类型,可以有以下三种类型:CODE16 、CODE32 和DATA

示例:

1
2
Test EQU 50            ; 定义标号Test 的值为50。
Addr EQU 0x55CODE32 ; 定义Addr的值为0x55 ,且该处为32位的ARM指令。

7. EXPORT(或GLOBAL)

EXPORT伪指令用于在程序中声明一个全局的标号,该标号可在其他的文件中引用。

格式:

1
EXPORT 标号 {[WEAK]}
  • EXPORT 可用GLOBAL代替
  • 标号在程序中区分大小写
  • [WEAK] 选项声明其他的同名标号优先于该标号被引用

示例:

1
2
3
AREA Init ,CODEREADONLY
EXPORT Stest ; 声明一个可全局引用的标号Stest
END

8. IMPORT

IMPORT伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用,而且无论当前源文件是否引用该标号,该标号均会被加入到当前源文件的符号表中。

格式:

1
IMPORT 标号 {[WEAK]}
  • 标号在程序中区分大小写
  • [WEAK] 选项表示当所有的源文件都没有定义这样一个标号时,编译器也不给出错误信息,在多数情况下将该标号置为0 ,若该标号为B或BL指令引用,则将B或BL指令置为NOP操作。

示例:

1
2
3
AREA Init ,CODEREADONLY
IMPORT Main ; 通知编译器当前文件要引用标号Main,但Main在其他源文件中定 义。
END

9. EXTERN

EXTERN伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用,如果当前源文件实际并未引用该标号,该标号就不会被加入到当前源文件的符号表中。

格式:

1
EXTERN 标号 {[WEAK]}
  • 标号在程序中区分大小写
  • [WEAK] 选项表示当所有的源文件都没有定义这样一个标号时,编译器也不给出错误信息,在多数情况下将该标号置为0 ,若该标号为B或BL指令引用,则将B或BL指令置为NOP操作。

示例:

1
2
3
AREA Init ,CODEREADONLY
EXTERN Main ; 通知编译器当前文件要引用标号Main,但Main在其他源文件中定 义。
END

10. GET(或INCLUDE)

GET伪指令用于将一个源文件包含到当前的源文件中,并将被包含的源文件在当前位置进行汇编处理。可以使用INCLUDE代替GET。

汇编程序中常用的方法是在某源文件中定义一些宏指令,用EQU定义常量的符号名称,用MAP和FIELD定义结构化的数据类型,然后用GET伪指令将这个 源文件包含到其他的源文件中。使用方法与C 语言中的”include” 相似。

GET伪指令只能用于包含源文件,包含目标文件需要使用INCBIN伪指令。

格式:

1
GET 文件名

示例:

1
2
3
4
AREA Init ,CODEREADONLY
GET a1.s ; 通知编译器当前源文件包含源文件a1.s
GET C:\a2.s ; 通知编译器当前源文件包含源文件C:\a2.s
END

11. INCBIN

INCBIN伪指令用于将一个目标文件或数据文件包含到当前的源文件中,被包含的文件不作任何变动的存放在当前文件中,编译器从其后开始继续处理。

格式:

1
INCBIN 文件名

示例:

1
2
3
4
AREA Init ,CODEREADONLY
INCBIN a1.dat ; 通知编译器当前源文件包含文件a1.dat
INCBIN C:\a2.txt ; 通知编译器当前源文件包含文件C:\a2.txt
END

12. RN

RN伪指令用于给一个寄存器定义一个别名。采用这种方式可以方便程序员记忆该寄存器的功能。

格式:

1
名称 RN 表达式
  • 名称为给寄存器定义的别名
  • 表达式为寄存器的编码

示例:

1
Temp RN R0   ; 将R0定义一个别名Temp

13. ROUT

ROUT伪指令用于给一个局部变量定义作用范围。在程序中未使用该伪指令时,局部变量的作用范围为所在的AREA,而使用ROUT后,局部变量的作为范围为当前ROUT和下一个ROUT之间。

格式:

1
{名称} ROUT

示例:

1
xxxx

Author:Tenloy

原文链接:https://tenloy.github.io/2021/04/17/Arm64-Handbook.html

发表日期:2021.04.17 , 3:00 PM

更新日期:2024.04.07 , 8:02 PM

版权声明:本文采用Crative Commons 4.0 许可协议进行许可

CATALOG
  1. 一、跳转指令
    1. 1. B指令
    2. 2. BL指令
    3. 3. BLX指令
    4. 4. BX指令
  2. 二、数据处理指令
    1. 2.1 数据传送指令
      1. 1. MOV指令(传送)
      2. 2. MVN指令(取反移动)
    2. 2.2 比较指令
      1. 1. CMP指令(比较)
      2. 2. CMN指令(负数比较)
      3. 3. TST指令(位测试)
      4. 4. TEQ指令(相等测试)
    3. 2.3 算术运算指令
      1. 1. ADD指令(相加)
      2. 2. ADC指令(带进位相加)
      3. 3. SUB指令(相减)
      4. 4. SBC指令(带进位减法)
      5. 5. RSB指令(逆向/反向减法)
      6. 6. RSC指令(反向带进位减)
      7. —乘法指令与乘加指令—
      8. 1. MUL指令(相乘)
      9. 2. MLA指令(带累加的相乘)
      10. 3. SMULL指令
      11. 4. SMLAL指令
      12. 5. UMULL指令
      13. 6. UMLAL指令
    4. 2.4 逻辑运算指令
      1. 1. AND指令(逻辑位 与)
      2. 2. ORR指令(逻辑位 或)
      3. 3. EOR指令(逻辑位 异或)
      4. 4. BIC指令(位清零)
      5. 5. LSL ASL(LSL逻辑左移、ASL算术左移)
      6. 6. LSR(逻辑右移)
      7. 7. ASR(算术右移)
      8. 8. ROR(向右循环移)
      9. 9. RRX(带扩展向右循环移)
  3. 三、程序状态寄存器访问指令
    1. 1. MRS指令(从PSR移动到寄存器)
    2. 2. MSR指令(从寄存器移动到PSR)
  4. 四、加载/存储指令
    1. 1. LDR指令
    2. 2. LDRB指令
    3. 3. LDRH指令
    4. 4. LDP指令
    5. 5. STR指令
    6. 6. STRB指令
    7. 7. STRH指令
    8. 8. STP指令
    9. 9. ADR指令
    10. 10. ADRP指令
    11. —批量数据加载/存储指令—
    12. 1. LDM(STM)指令(加载、存储多个寄存器)
    13. —数据交换指令—
    14. 1. SWP指令
    15. 2. SWPB指令
  5. 五、协处理器指令
    1. 1. CDP指令
    2. 2. LDC指令
    3. 3. STC指令
    4. 4. MCR指令
    5. 5. MRC指令
  6. 六、异常产生指令
    1. 1. SWI指令
    2. 2. BKPT指令
  7. ARM汇编伪指令
    1. 一、符号定义(Symbol Definition)伪指令
      1. 1. GBLA、GBLL 和GBLS
      2. 2. LCLA、LCLL 和LCLS
      3. 3. SETA、SETL 和SETS
      4. 4. RLIST
    2. 二、数据定义(Data Definition)伪指令
      1. 1. DCB
      2. 2. DCW(或DCWU)
      3. 3. DCD(或DCDU)
      4. 4. DCFD(或DCFDU)
      5. 5. DCFS(或DCFSU)
      6. 6. DCQ(或DCQU)
      7. 7. SPACE
      8. 8. MAP
      9. 9. FILED
    3. 三、汇编控制(Assembly Control)伪指令
      1. 1. IF、ELSE、ENDIF
      2. 2. WHILE、WEND
      3. 3. MACRO、MEND
      4. 4. MEXIT
    4. 四、其他常用的伪指令
      1. 1. AREA
      2. 2. ALIGN
      3. 3. CODE16、CODE32
      4. 4. ENTRY
      5. 5. END
      6. 6. EQU
      7. 7. EXPORT(或GLOBAL)
      8. 8. IMPORT
      9. 9. EXTERN
      10. 10. GET(或INCLUDE)
      11. 11. INCBIN
      12. 12. RN
      13. 13. ROUT