性无码一区二区三区在线观看,少妇被爽到高潮在线观看,午夜精品一区二区三区,无码中文字幕人妻在线一区二区三区,无码精品国产一区二区三区免费

一口Linux
認(rèn)證:優(yōu)質(zhì)創(chuàng)作者
所在專題目錄 查看專題
4. 從0開始學(xué)ARM-ARM匯編指令其實很簡單
5. 從0開始學(xué)ARM-MRS、MSR、尋址操作、原子操作原理
6【從0學(xué)ARM】ARM如何處理異常
7. 從0學(xué)ARM-GNU編程、lds文件詳解
8. C和匯編如何互相調(diào)用?嵌入式工程師必須掌握
9. 基于Cortex-A9 LED匯編、C語言驅(qū)動編寫
作者動態(tài) 更多
linux系統(tǒng)監(jiān)控工具小神器:btop
1天前
有沒有權(quán)貴開后門讓子女做軟件開發(fā)人員?
1星期前
一文包你學(xué)會網(wǎng)絡(luò)數(shù)據(jù)抓包
03-15 09:26
C語言初學(xué)者編程水平上不來?不妨嘗試這10個C語言例子
03-14 20:31
Linux rootfs:如何開機就自動添加某個用戶?
03-09 22:18

8. C和匯編如何互相調(diào)用?嵌入式工程師必須掌握

ARM系列文章,請點擊以下匯總鏈接:

從0學(xué)arm合集

一、gcc 內(nèi)聯(lián)匯編

內(nèi)聯(lián)匯編即在C中直接使用匯編語句進(jìn)行編程,使程序可以在C程序中實現(xiàn)C語言不能完成的一些工作,例如,在下面幾種情況中必須使用內(nèi)聯(lián)匯編或嵌入型匯編。

  1. 程序中使用飽和算術(shù)運算(Saturating Arithmetic)
  2. 程序需要對協(xié)處理器進(jìn)行操作
  3. 在C程序中完成對程序狀態(tài)寄存器的操作

格式:

__asm__ __volatile__("asm code"
 :output
 :input
 :changed registers);

asm或__asm__開頭,小括號+分號,括號內(nèi)容寫匯編指令。指令+\n\t 用雙引號引上。

參數(shù)

「asm code」主要填寫匯編代碼:

"mov r0, r0\n\t" 
"mov r1,r1\n\t" 
"mov r2,r2"

「output(asm->C)」用于定義輸出的參數(shù),通常只能是變量:

:"constraint" (variable)
"constraint"用于定義variable的存放位置:
 r 表示使用任何可用的寄存器
 m 表示使用變量的內(nèi)存地址
 + 可讀可寫
 = 只寫
 & 表示該輸出操作數(shù)不能使用輸入部分使用過的寄存器,只能用"+&"或"=&"的方式使用

「input(C->asm)」用于定義輸入的參數(shù),可以是變量也可以是立即數(shù):

:"constraint" (variable/immediate)
"constraint"用于定義variable的存放位置:
 r 表示使用任何可用的寄存器(立即數(shù)和變量都可以)
 m 表示使用變量的內(nèi)存地址
 i 表示使用立即數(shù)

Note:

  1. 使用__asm__和__volatile__表示編譯器將不檢查后面的內(nèi)容,而是直接交給匯編器。
  2. 如果希望編譯器為你優(yōu)化,__volatile__可以不加
  3. 沒有asm code也不能省略""
  4. 沒有前面的和中間的部分,不可以相應(yīng)的省略:
  5. 沒有changed 部分,必須相應(yīng)的省略:
  6. 最后的;不能省略,對于C語言來說這是一條語句
  7. 匯編代碼必須放在一個字符串內(nèi),且字符串中間不能直接按回車換行,可以寫成多個字符串,注意中間不能有任何符號,這樣就會將兩個字符串合并為一個
  8. 指令之間必須要換行,還可以使用\t使指令在匯編中保持整齊

舉例

例1:無參數(shù),無返回值 這種情況,output和input可以省略:

 asm
 ( //匯編指令
  "mrs r0,cpsr     \n\t"
  "bic r0,r0,#0x80 \n\t"
  "msr cpsr,r0     \n\t"
 );

例2:有參數(shù) ,有返回值 讓內(nèi)聯(lián)匯編做加法運算,求a+b,結(jié)果存在c中

 int a =100, b =200, c =0;
 asm
 (
  "add %0,%1,%2\n\t"
  : "=r"(c)
  : "r"(a),"r"(b)
  : "memory"
 );

%0 對應(yīng)變量c %1 對應(yīng)變量a %2 對應(yīng)變量b

例3:有參數(shù) 2 ,有返回值

讓內(nèi)聯(lián)匯編做加法運算,求a+b,結(jié)果存在sum中,把a-b的存在d中

asm volatile
 (
  "add %[op1],%[op2],%[op3]\n\t"
  "sub %[op4],%[op2],%[op3]\n\t"
  :[op1]"=r"(sum),[op4]"=r"(d)
  :[op2]"r"(a),[op3]"r"(b)
  :"memory"
 );

%0 對應(yīng)變量c %1 對應(yīng)變量a %2 對應(yīng)變量b

三、ATPCS規(guī)則:(ARM、thumber程序調(diào)用規(guī)范)

為了使單獨編譯的C語言程序和匯編程序之間能夠相互調(diào)用,必須為子程序之間的調(diào)用規(guī)定一定的規(guī)則.ATPCS就是ARM程序和THUMB程序中子程序調(diào)用的基本規(guī)則。

基本ATPCS規(guī)定了在子程序調(diào)用時的一些基本規(guī)則,包括下面3方面的內(nèi)容:

  1. 各寄存器的使用規(guī)則及其相應(yīng)的名稱。
  2. 數(shù)據(jù)棧的使用規(guī)則。
  3. 參數(shù)傳遞的規(guī)則。

1. 寄存器的使用必須滿足下面的規(guī)則:

  • 1)子程序間通過寄存器R0一R3來傳遞參數(shù),這時,寄存器R0~R3可以記作A1-A4。被調(diào)用的子程序在返回前無需恢復(fù)寄存器R0~R3的內(nèi)容。

  • 2)在子程序中,使用寄存器R4~R11來保存局部變量.這時,寄存器 R4 ~ R11可以記作V1 ~ V8。如果在子程序中使用到了寄存器V1~V8中的某些寄存器,子程序進(jìn)入時必須保存這些寄存器的值,在返回前必須恢復(fù)這些寄存器的值;對于子程序中沒有用到的寄存器則不必進(jìn)行這些操作。在Thumb程序中,通常只能使用寄存器R4~R7來保存局部變量。

  • 3)寄存器R12用作過程調(diào)用時的臨時寄存器(用于保存SP,在函數(shù)返回時使用該寄存器出棧), 記作ip。在子程序間的連接代碼段中常有這種使用規(guī)則。

  • 4)寄存器R13用作數(shù)據(jù)棧指針,記作sp。在子程序中寄存器R13不能用作其他用途。寄存器sp在進(jìn)入子程序時的值和退出子程序時的值必須相等。

  • 5)寄存器R14稱為連接寄存器,記作lr。它用于保存子程序的返回地址。如果在子程序中保存了返回地址,寄存器R14則可以用作其他用途。

  • 6)寄存器R15是程序計數(shù)器,記作pc。它不能用作其他用途。

ATPCS下ARM寄存器的命名:

2、堆棧使用規(guī)則:

ATPCS規(guī)定堆棧為FD類型,即滿遞減堆棧。并且堆棧的操作是8字節(jié)對齊。

而對于匯編程序來說,如果目標(biāo)文件中包含了外部調(diào)用,則必須滿足以下條件:

  1. 外部接口的數(shù)據(jù)棧一定是8位對齊的,也就是要保證在進(jìn)入該匯編代碼后,直到該匯編程序調(diào)用外部代碼之間,數(shù)據(jù)棧的棧指針變化為偶數(shù)個字;

  2. 在匯編程序中使用PRESERVE8偽操作告訴連接器,本匯編程序是8字節(jié)對齊的.

3、參數(shù)的傳遞規(guī)則:

根據(jù)參數(shù)個數(shù)是否固定,可以將子程序分為參數(shù)個數(shù)固定的子程序和參數(shù)個數(shù)可變的子程序.這兩種子程序的參數(shù)傳遞規(guī)則是不同的.

1.參數(shù)個數(shù)可變的子程序參數(shù)傳遞規(guī)則

對于參數(shù)個數(shù)可變的子程序,當(dāng)參數(shù)不超過4個時,可以使用寄存器R0~R3來進(jìn)行參數(shù)傳遞,當(dāng)參數(shù)超過4個時,還可以使用數(shù)據(jù)棧來傳遞參數(shù).

在參數(shù)傳遞時,將所有參數(shù)看做是存放在連續(xù)的內(nèi)存單元中的字?jǐn)?shù)據(jù)。然后,依次將各名字?jǐn)?shù)據(jù)傳送到寄存器R0,R1,R2,R3; 如果參數(shù)多于4個,將剩余的字?jǐn)?shù)據(jù)傳送到數(shù)據(jù)棧中,入棧的順序與參數(shù)順序相反,即最后一個字?jǐn)?shù)據(jù)先入棧.

按照上面的規(guī)則,一個浮點數(shù)參數(shù)可以通過寄存器傳遞,也可以通過數(shù)據(jù)棧傳遞,也可能一半通過寄存器傳遞,另一半通過數(shù)據(jù)棧傳遞。

舉例:

void func(a,b,c,d,e)
    a -- r0
    b -- r1
    c -- r2
    d -- r3
    e -- 棧

2.參數(shù)個數(shù)固定的子程序參數(shù)傳遞規(guī)則

對于參數(shù)個數(shù)固定的子程序,參數(shù)傳遞與參數(shù)個數(shù)可變的子程序參數(shù)傳遞規(guī)則不同,如果系統(tǒng)包含浮點運算的硬件部件。

浮點參數(shù)將按照下面的規(guī)則傳遞: (1)各個浮點參數(shù)按順序處理; (2)為每個浮點參數(shù)分配FP寄存器;

分配的方法是,滿足該浮點參數(shù)需要的且編號最小的一組連續(xù)的FP寄存器.第一個整數(shù)參數(shù)通過寄存器R0~R3來傳遞,其他參數(shù)通過數(shù)據(jù)棧傳遞.

3、子程序結(jié)果返回規(guī)則

  • 1.結(jié)果為一個32位的整數(shù)時,可以通過寄存器R0返回.
  • 2.結(jié)果為一個64位整數(shù)時,可以通過R0和R1返回,依此類推.
  • 3.對于位數(shù)更多的結(jié)果,需要通過調(diào)用內(nèi)存來傳遞.

舉例:使用r0 接收返回值

 int func1(int m, int n)
  m  -- r0
  n  -- r1
  返回值給 r0

「為什么有的編程規(guī)范要求自定義函數(shù)的參數(shù)不要超過4個?」答:因為參數(shù)超過4個就需要壓棧退棧,而壓棧退棧需要增加很多指令周期。對于參數(shù)比較多的情況,我們可以把數(shù)據(jù)封裝到結(jié)構(gòu)體中,然后傳遞結(jié)構(gòu)體變量的地址。

四、C語言和匯編相互調(diào)用

C和匯編相互調(diào)用要特別注意遵守相應(yīng)的ATPCS規(guī)則。

1. C調(diào)用匯編

例1:c調(diào)用匯編文件中函數(shù)帶返回值 簡化代碼如下,代碼架構(gòu)可以參考《7. 從0開始學(xué)ARM-GNU偽指令、代碼編譯,lds使用》。

;.asm                                     
add:
 add r2,r0,r1
 mov r0,r2
    MOV pc, lr

main.c

extern int add(int a,int b);

printf("%d \n",add(2,3));
  1. a->r0,b->r1
  2. 返回值通過r0返回計算結(jié)果給c代碼

例2,用匯編實現(xiàn)一個strcopy函數(shù)

;.asm 
.global strcopy
strcopy:      ;R0指向目的字符串 ;R1指向源字符串 
 LDRB R2, [R1], #1   ;加載字字符并更新源字符串指針地址 
 STRB R2, [R0], #1   ;存儲字符并更新目的字符串指針地址 
 CMP R2, #0   ;判斷是否為字符串結(jié)尾 
 BNE strcopy   ;如果不是,程序跳轉(zhuǎn)到strcopy繼續(xù)循環(huán) 
 MOV pc, lr   ;程序返回
//.c 
#include <stdio.h> 
extern void strcopy(char* des, const char* src); 
int main(){ 
 const char* srcstr = "yikoulinux"; 
 char desstr[]="test";
 strcopy(desstr, srcstr); 
 return 0; 
}

2. 匯編調(diào)用C

//.c 
int fcn(int a, int b , int c, int d, int e)
{ 
 return a+b+c+d+e; 
}
;.asm ;
.text .global _start 
_start: 
 STR lr, [sp, #-4]! ;保存返回地址lr 
 ADD R1, R0, R0 ;計算2*i(第2個參數(shù)) 
 ADD R2, R1, R0 ;計算3*i(第3個參數(shù)) 
 ADD R3, R1, R2 ;計算5*i 
 STR R3, [SP, #-4]! ;第5個參數(shù)通過堆棧傳遞 
 ADD R3, R1, R1 ;計算4*i(第4個參數(shù)) 
 BL fcn ;調(diào)用C程序 
 ADD sp, sp, #4 ;從堆棧中刪除第五個參數(shù) 
 .end

假設(shè)程序進(jìn)入f時,R0中的值為i ;

int f(int i){
 return fcn(i, 2*i, 3*i, 4*i, 5*i);
} 

五、內(nèi)核實例

為了讓讀者有個更加深刻的理解, 以內(nèi)核中的例子為例:

arch/arm/kernel/setup.c

void notrace cpu_init(void) 
{
    unsigned int cpu = smp_processor_id();----獲取CPU ID 
    struct stack *stk = &stacks[cpu];----獲取該CPU對于的irq abt和und的stack指針
……
#ifdef CONFIG_THUMB2_KERNEL 
#define PLC    "r"----Thumb-2下,msr指令不允許使用立即數(shù),只能使用寄存器。 
#else 
#define PLC    "I" 
#endif    __asm__ ( 
    "msr    cpsr_c, %1\n\t"----讓CPU進(jìn)入IRQ mode 
    "add    r14, %0, %2\n\t"----r14寄存器保存stk->irq 
    "mov    sp, r14\n\t"----設(shè)定IRQ mode的stack為stk->irq 
    "msr    cpsr_c, %3\n\t" 
    "add    r14, %0, %4\n\t" 
    "mov    sp, r14\n\t"----設(shè)定abt mode的stack為stk->abt 
    "msr    cpsr_c, %5\n\t" 
    "add    r14, %0, %6\n\t" 
    "mov    sp, r14\n\t"----設(shè)定und mode的stack為stk->und 
    "msr    cpsr_c, %7"---回到SVC mode 
        :----上面是code,下面的output部分是空的 
        : "r" (stk),----對應(yīng)上面代碼中的%0 
          PLC (PSR_F_BIT | PSR_I_BIT | IRQ_MODE),----對應(yīng)上面代碼中的%1 
          "I" (offsetof(struct stack, irq[0])),----對應(yīng)上面代碼中的%2 
          PLC (PSR_F_BIT | PSR_I_BIT | ABT_MODE),----以此類推,下面不贅述
          "I" (offsetof(struct stack, abt[0])), 
          PLC (PSR_F_BIT | PSR_I_BIT | UND_MODE), 
          "I" (offsetof(struct stack, und[0])), 
          PLC (PSR_F_BIT | PSR_I_BIT | SVC_MODE) 
        : "r14");----上面是input操作數(shù)列表,r14是要clobbered register列表 
}
聲明:本內(nèi)容為作者獨立觀點,不代表電子星球立場。未經(jīng)允許不得轉(zhuǎn)載。授權(quán)事宜與稿件投訴,請聯(lián)系:editor@netbroad.com
覺得內(nèi)容不錯的朋友,別忘了一鍵三連哦!
贊 1
收藏 3
關(guān)注 181
成為作者 賺取收益
全部留言
0/200
成為第一個和作者交流的人吧