找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 34075|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response

3 q- k( A- r* l; D4 s
  • Phenomenon
    ( c; x( _; F; ]* {

7 R; f' b1 n3 l. b, `- b! x手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:
& a3 g  E7 b+ {2 _! j$ L7 [) p! `
1
  • Why???" W8 F8 |; P9 U
, Y" f4 k8 ^  e. O0 R8 o

" Y) x5 ^6 o& b0 `5 R: q
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:
; |5 h" Z# L: y4 d
// AC Change event8 x. ]% `! a" C' S& J) B
, R4 x. ]' q" D5 P5 s7 _  [: V
Method(_QXX)

+ I7 \: \! Y8 q0 q, S- z1 E5 [9 [4 y+ y0 |
* c' V7 F1 E+ Y" k& _{
3 j+ M/ E& x3 T( \' z
; Y; u/ `+ A* ~+ Z7 F: C  p
Store(0x09, DBG8)
9 B6 M8 G3 s. l* h# l2 L

4 p& e5 m- B( bNotify(\_SB. ADP,0x80)
. k1 g1 R/ m) L; h# `//Power Source status changed

3 g% r" l6 N$ \% v* s% i# ~/ G! u' ?: u* i* w
Store(0x0A, DBG8)

& [$ @# e- {% j: ?0 y7 Z- |3 p 3 F& U6 c$ _1 b  M5 L& t
4 ?+ ~2 n$ x+ X% \" S
}
7 }3 ~/ d1 l1 y: f; M$ Y! s
' n7 j( {! x# o& \4 v: @# d
; L+ M* |; e. ^( {
3 ^* g+ v7 {; y# o
Method(_PSR,0)* I- r4 Z# P( m8 n" D# ?# w! |$ l
' G( X" C+ _$ S  Y
( H* b) N. I( [+ Q2 `, z
{
3 l% _8 a5 v7 a7 ^4 r0 l
+ |. f4 c( `- A. {6 p

' q$ i9 ]2 t+ C' @Store(0x0B, DBG8)* M0 Y- j- x2 q8 i3 x
3 l+ |) i1 g; O9 i- E

$ O( D- r. e) vIf(ACST)
& W/ R9 t7 o5 [- P) r' J5 ?//check AC status
6 }) L% n' c0 r' h) X8 {7 Q
9 C. b) R6 f: C  v" ~, m
{
9 A- x% p# U" A6 j
4 L0 B9 j) `0 `$ r
9 _8 ~5 o8 Q; M; ~* s
return(One)
6 a& c+ h" s, n0 T: K// AC Present

: @+ ^, @) u; D# s# t9 p/ D9 b5 o
}

' x7 D, ]3 l4 B6 z. G; z5 A4 R3 I4 S3 B: e+ B% n; I9 ~
else

1 l4 T' `- A4 o6 H+ t: Q7 L) S; i; H5 M" T3 E+ \  q! k
{

* [( q* L, |' C6 W$ k; V4 O
* x/ W3 L% {; y) l  k; Dreturn(Zero)
; z0 |$ J  C: X  z// AC Not Present
4 f* H- d- \) o5 L+ P. I1 _/ I

# D' Y2 _4 w) s; i3 k}
* k" S, _0 V7 z  P

. y+ Q; K5 @- R; y4 OStore(0x0C, DBG8)

* I+ Y8 y# k( K6 }. @* E  z- e  a# L) v0 h' m& X/ c$ |
}
8 p# Q/ E) F. U+ o! O) t) l4 j
' M" N% S* N7 L/ m

( A" m8 U( ]' h" A: F我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。  D+ u+ {; a1 v! D% r  r2 o8 H
状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:
& ?; r! x' e' ^+ UMethod(_BST)
& F1 k% q1 {# [/ t" Y{" L, j# s, o7 ~7 h1 k

, W8 b  l' d* {8 ~1 a/ f' CStore(BSTS,Local0)

& F$ J5 S4 q/ X4 ]- ]
! Z5 ]" m0 p+ [  N( |' n* \* Y* M! s  Y" i; x& e5 @5 G/ r
If(LEqual(Local0,1)) //Check Battery Present Bit

9 ?# A) j2 T3 d& a: P' @% a2 S
{7 J) \# p, R! u' T
! [( f: J3 }4 c4 Q

* J3 P1 q- n( x0 x2 t: o
6 e" R4 V; [) f7 R) x* Y! P6 d- o4 c: s2 T' E

* i, o: V8 S0 W; I" U//Read Battery information from EC
- y) B! O$ H1 P5 G2 }
& \' W6 F$ m, F
… …
' T, l" l8 N* V( X- D4 z5 F" [

' \+ f. i; ]9 W( c8 E3 O& c. `+ ~4 `# A
}

9 d2 O* E- T' T/ r$ Q, f; a; v0 `/ b6 n
Store(0x0D, DBG8)
7 P7 p8 f! U4 c" A0 k
} ' n! ]( V3 w& @
那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。9 H* }; C. p# ]) \4 a& E& {' c' ]4 e
那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:
! H' F: b4 M; R  I
6 \# H" X' N. E2 @* f( c$ ^; N
# h1 N7 R( l- k3 l1 I) u7 ?$ o
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.% D+ L  ?5 b) }* c% w: r: d. G. J
9 S3 b4 c$ \$ L3 ^: D# c. h
  • Solution

7 I5 S6 v& Z; |2 U  H2 L* h  ?  S$ R: P  i% P% H7 r- B- l
经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!& ]& Y# P8 f% ?& S9 z
* X0 a5 ^( T. s' w4 j  A, ?
' D) m2 I+ W. H( @- S

6 w4 A3 |! a5 | 2 O: q7 x' w3 `8 L
That’s all!3 X( _5 o. i" m7 r5 [/ Q6 J+ p

* t1 b% G' }" \7 J8 sPeter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!; _4 V- N; P5 G1 O* u
) P% ^3 l- Z: s
谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!' V+ c3 q, ?4 }. |/ K7 l' Y( ~; J
我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...) ~8 Z0 N: M* @+ l
很高心这篇文章能够对你有帮助。
2 Y1 v3 e2 R' P3 f1 g上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是
  T- f/ v7 A5 e! NACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.
) o2 `$ X0 d6 s: R8 N简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。
( Q+ {2 K% H) j% F( }, ~5 T对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!
1 E+ [1 _. [  S; X4 ?# R) Q" _
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了2 u" i6 r1 n! y# w  r
呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!
0 T& v! B# n9 G+ o& _1 Q8 O% L     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:% W% }6 m+ t0 {/ L$ n" {
1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock
& J1 m% X' G+ K2 P9 @5 P  m) Rchipset reset pci reset系统重启。  Q+ Y& j' u( J" {5 C
2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)
) {5 z* K: Z2 R3 v5 N: I等等一些琐碎的动作。
; a: A. A$ G. X1 g' i7 V1 F' ^之前碰到问题比较多的地方就在idle这部分了。' ^5 A6 p2 H) d1 m  f' ?% E
你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...# T) D  p8 _; h+ x7 @' p# M
还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。, o5 F! ]* B0 ?7 y' E6 P0 P; ?! i
以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!
8 |! O# }3 V+ _6 f1 A6 }  h    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!
' \. S" T$ `+ `     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:; n6 ?: g. m5 s$ K* O$ E& J, x
BIOS发FE不是通过SCI,而是透过60h,64h port。5 T7 I$ B4 @3 _2 ^0 _& g  a
BIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2026-3-15 05:35 , Processed in 0.184101 second(s), 17 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表