|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=25340 E2 Q5 W( S3 A( x" X
/ Y# P2 p* ^. C i k
从IRQ到IRQL(APIC版)* |: y* a5 b# L5 |3 {8 U
4 m! c, ?5 S; `4 S( ?* {作者:SoBeIt
8 B4 l, `0 t, M% W% d1 b& Y% }出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502) ~3 y6 u# z \/ D
日期:2005-02-04
7 [9 x( s7 c: s, ?2 i: l2 M: n' P. v
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。8 Z7 y/ ]* q6 |
8 B; }5 G2 N% R9 o) b ]9 E
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
7 ]6 Z4 Y' W3 a5 H4 u
$ H9 H9 w9 f- \2 k) l. \- [" A$ q% ~ 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。1 f* T" K! ]. v d3 r( z7 C! i$ n
& r* E2 a4 V2 _+ y; j: o, }
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:+ p& Z( |/ y" D
0 H- V8 R/ N) }#define ZERO_VECTOR 0x00 // IRQL 00 9 [! h1 R6 [# p' b2 k
#define APC_VECTOR 0x3D // IRQL 01
& V4 Z; _' e7 i3 h6 Q#define DPC_VECTOR 0x41 // IRQL 02/ g, }# ^* d0 b) M
#define APIC_GENERIC_VECTOR 0xC1 // IRQL 271 c5 z- B- e; W- {, l( t+ a; k9 J4 {0 L
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28* J* }) R" E# G5 o* Y- Y
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 286 v+ ~' a0 j9 z
#define APIC_IPI_VECTOR 0xE1 // IRQL 29. ~; y( Z- \8 w8 \" B2 S- f. O8 |
#define POWERFAIL_VECTOR 0xEF // IRQL 30
4 V# v. O2 D* O) R#define APIC_PROFILE_VECTOR 0xFD // IRQL 31- O( ?: w9 q5 j; r1 [+ h
8 S4 g' U& T: e, | e, U
+ C0 e* a, ]4 k5 `$ f0 V) V0 g
现在看一下一些重要的数据:9 ^- [/ S+ Z+ j( B- f
4 y# ^ C- X3 P& A U
这是我写的代码输出的IO APIC重定向表内容:6 Y. w2 g0 Z5 i* w
8 X) @, A: Q; o5 U- F( e
Redirect Table Index: 0x17
0 r8 F) ]9 [3 k) P) k: }5 I4 dRedirect Table[ 0]: ff! u! A9 V' {$ {' k6 ?
Redirect Table[ 1]: b36 f1 G3 a; `0 e* U. @$ U* s& P
Redirect Table[ 2]: ff
8 N$ `# d4 X- _2 V9 v7 W2 }Redirect Table[ 3]: 51
B+ r+ f! b9 N" U2 |Redirect Table[ 4]: ff5 ~1 Z7 J3 S+ T, P$ j
Redirect Table[ 5]: ff7 l5 Y. ?2 S5 v+ Q; a* A2 h
Redirect Table[ 6]: 62
& e" F5 b# M2 \Redirect Table[ 7]: ff1 W0 p8 _- x1 c5 Y1 V) L) j" D6 m7 c
Redirect Table[ 8]: d1
; p& Z$ r+ m x! a( X! f5 kRedirect Table[ 9]: b18 A" S [/ h/ w- W$ p
Redirect Table[ a]: ff, Q- x4 x" j6 x
Redirect Table[ b]: ff
, G9 u9 c8 S$ U1 D5 P! F1 y) rRedirect Table[ c]: 52
9 Z8 Z: k( `; c5 w$ oRedirect Table[ d]: ff! G7 B& U! z8 _1 k2 L
Redirect Table[ e]: ff* a4 F6 L* O e
Redirect Table[ f]: 92
! j- [, U4 b v" C1 Z: O% E' bRedirect Table[10]: ff/ Y# i3 T; o' i# j) A1 \; g6 a) l
Redirect Table[11]: a3! W' k/ P' O# C* @8 E2 x" J
Redirect Table[12]: 83) g, I4 D) B; f6 ^
Redirect Table[13]: 932 i1 O) j; G0 U
Redirect Table[14]: ff
5 V% I& D, a2 M8 T0 ERedirect Table[15]: ff
# ] j! ^$ s( y/ SRedirect Table[16]: ff
7 |8 R8 S, c& fRedirect Table[17]: ff
% ^4 G% B+ R0 A* |2 t0 K
( [# Z7 K( @, N' T5 e这是IDT表中被注册的向量:
/ W5 x" |: M$ A( b# Z3 X) a3 Y5 `8 S
1f: 80064908 (hal!HalpApicSpuriousService)
. X9 X, f+ T7 p! ~. T37: 800640b8 (hal!PicSpuriousService37)2 h+ T8 P8 [/ e7 }% t' l4 k% X
3d: 80065254 (hal!HalpApcInterrupt): A3 L; e$ r5 g3 o
41: 800650c8 (hal!HalpDispatchInterrupt)3 k) ^' i6 ]7 F- C
50: 80064190 (hal!HalpApicRebootService)- C# I2 p; r/ \6 J4 o m
51: 817f59e4
" K2 e- B8 w& W7 O" X" t(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
0 h& ?5 p3 D- k2 Q52: 817f5044 6 ~" `3 `2 U1 i" n- q% V+ S" V+ @
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))1 @8 H( U$ c! A0 O, V, k# |) f
83: 817d2d44 ' ` u4 c F( X* Y, H
(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))# W& m* a4 ?& V
92: 81821384 & j' f9 ] T( @7 o6 N! B
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))& d2 u: {. x' I6 \/ \6 W2 Q3 `
93: 8185ed64
* @% O" s) Y. _6 B7 r$ R2 q(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))$ M9 x# i* D2 c1 \# p$ f
a3: 8186cdc4 3 V, y' ^! X6 U3 q: z9 z
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
* X O' Y& m, z. q6 p9 [$ |b1: 818902e4
0 x6 f( l0 ~6 ^4 N5 v$ ?3 M1 |& u! k4 `5 ~(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
/ Z0 l" z a: c1 z l0 X" Sb3: 81881664
# P" h2 ~5 g; {(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))+ p+ k6 O/ g6 |5 W% D
c1: 800642fc (hal!HalpBroadcastCallService), t9 o' i( b) \, l9 a
d1: 80063964 (hal!HalpClockInterrupt) ? b3 R" D+ m3 G9 M
e1: 80064858 (hal!HalpIpiHandler)1 b- y- g2 C/ h' \8 u9 u2 l7 r
e3: 800645d4 (hal!HalpLocalApicErrorService)
7 b. N% O! B+ V5 sfd: 80064d64 (hal!HalpProfileInterrupt)& Z6 B5 { x+ j1 i+ C* P% K
fe: 80064eec (hal!HalpPerfInterrupt)4 U, z1 M0 `- b2 y3 ~( B
7 L5 ^. U0 e4 w- P, h) ]
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量1 p" B' H6 C% h6 v& D' F! U
/ L0 Z" C- j! m6 H
这是几个重要的数组:7 w3 a4 L5 c) h* H. h8 G
e% Y0 F! l: {. |% I; u
HalVectorToIrql(这个数组是以向量除于16做索引):' }& G3 ~; B- p. N5 Z8 }7 {) |
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e
, T5 t7 U+ L# I6 ?" g. n, R6 j$ U% s& c$ c2 j/ B
HalpIRQLtoTPR:
! {6 l2 B1 g0 w) I7 }8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1' ~ q, r8 v/ @. U( `8 v
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff5 F r2 }& |0 c* A5 o/ e# Q
+ L2 d. o& ?. \ f
HalpINTItoVector:
& [9 b( |1 L: O3 W* s6 J& G8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
; A1 e5 z* A$ Z; T3 K- x) r, X5 b8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
8 l( G( Q& }0 y; B- E$ I" [% b
6 Z5 }0 X, j, N/ W) P s# E2 qHalVectorToINTI:
1 r; N- l7 \0 L8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff0 u9 j6 g7 |" [5 f8 S
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
S- b. `2 F/ k' B3 e2 ] W7 H8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff' w( O3 Q. B) e3 @) Q, V7 C: x
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
: Y2 z2 m* u c! o- H; {8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff% I |1 R1 _" S" `+ S y! y
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff" G, d, T! Z1 E: F9 v8 x
8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
+ C2 g. I6 Z6 u% a/ f" ~8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
& I+ D8 c* l9 u h8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
' O! ^9 i* b4 |8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff" C+ o8 `; }- ^5 z
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff% ^8 M) u8 e; a
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
1 }1 N1 }9 A2 G* m8 [4 k& D3 N( W8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff, a t- y7 L1 S
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff. @: |0 \7 M6 B3 j$ M3 C9 ], V- S
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
/ P% \1 T2 M3 u* N. m8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
5 U1 P: T# Z$ h/ C$ S, \
( b# C. |' [# s
( k; Z' m4 K, j( i0 MvBucket:
/ p4 V( [& Z, f1 V& C6 ~. i" p8006ae30 02 02 02 03 03 03 032 S5 I+ Y4 l1 V
& w( P0 S3 o; O 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
8 m7 ~3 K1 P* u* i/ e
^6 |; M2 u8 f( Z9 v; m vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。1 D$ Y. Q, ]" p( z. f$ T
2 ?3 S% _- I# W1 d6 ?# @' ? IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
+ O$ `) g" g4 `% H# X% S8 q8 B3 q/ m8 P; S5 q. J) K4 Y
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|