找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 33463|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response

8 j" w4 F6 _8 H( e& t( Y
  • Phenomenon6 H" O5 h& O  L; J
8 Y9 b7 M# U' \4 e/ G  y0 ^1 T8 w' d
手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:
) Y( d2 y( s; l6 I" O
1
  • Why???
    $ @& ^; T) t( Q' g9 W% w6 `- d

& u8 T/ S  p) T( v- W/ [, ]( u% o" F% n' p% V0 V5 @
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:
  L  Q% G% r" f- g
// AC Change event; e9 E# ?, G) a, b7 k

9 g- i+ U" K1 C9 kMethod(_QXX)

3 m; J) I) h' `  k( X- \  q5 S0 ?, B3 n) A1 f
{
' ~3 Z  K4 ?' W3 q% I' A

% c) K1 p' R" B( ]1 k6 z: }5 X/ \Store(0x09, DBG8)
3 J0 U; o* M* j4 p+ r5 G
7 D: E, M. u3 `# _& l2 Q% @' h' V9 ~
Notify(\_SB. ADP,0x80)$ Q9 ^4 h# [+ Z' m; a2 t3 i: T: @
//Power Source status changed

/ d% z' ]) O& [$ o/ P: O% a
* `$ b3 E9 I- k# m! E  PStore(0x0A, DBG8)

+ u0 C; f1 R( r- L4 C
( J& d; y5 c/ S& f
# Z6 c7 B; C) o$ [- {$ N}
0 h" ^: a' }# s% U, s" o

/ m+ A% D3 {+ Z/ Q& }
6 \- Q! B4 ~3 h# J8 z2 n9 |# l" Y
! T% p+ K2 A$ J, y5 v: A
Method(_PSR,0), S; R% t7 T. J' h2 I

! M6 ?/ P2 F4 ~2 q
2 j- }/ @; J2 Z9 |0 A" K5 \6 ?{: |* l  k! ?0 F; L5 i( x

- v6 z% m4 \. c# h4 r. i8 a3 h$ o9 D3 B
Store(0x0B, DBG8)! s  I* U- S$ ^) h/ t+ \
3 @0 s! E0 X# H* O3 ]% G

4 Z0 s9 d1 c4 k# j# JIf(ACST)1 M5 M) C) U( J& p% M' b2 S
//check AC status
7 \) o+ D6 V$ Y( H& c; ^
. R, L' {9 ?2 C; w- {
{

  E4 T* B# k: |$ ~6 v# C& q- p
1 z! O" ]3 o. r
2 G% Z- \2 c7 m0 e, c! ^return(One)7 g. j4 D2 `, H" k: |5 r* y
// AC Present
8 X: G! X, h. l5 D: r. R$ ~. T) z; }
7 L5 f) ?) a, _
}
' U- i& T: _; O8 U9 M  j
/ {5 Q5 E0 M+ x! \6 c
else

4 U, f+ ~3 [% Y. Q: E# {8 P% }& N' p' u$ a, D* m
{

. A' k9 l4 P! p9 H5 R5 `# D/ J, D: j) O: e8 w  @  m
return(Zero)) V& R$ ]  Y' n' P7 R
// AC Not Present
; t. A* A3 J' y8 t( {# C! A& L
9 \9 |! k; w# Q  C3 y
}
( Y! d0 N5 X3 g# t  Q  o
$ y3 T3 ]( Q* @/ s# H; I
Store(0x0C, DBG8)

; y, S5 g. \$ p) ^& b  n  c0 c6 B) W7 ^: A
}
3 |2 Z* o9 C5 s+ p  S
) o$ \& Z1 R) g* d: t
- [, i. N7 b2 _( ~; h
我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。
) k+ B7 Z/ {  ?状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:+ {  U% n7 H! q& L; \; d9 n
Method(_BST)
% |7 ^( N+ g( Z; n. F2 M4 M, \{
- Y' h) Q" R. Q% ?. F3 O# r* m0 Q. Z" V. c& N  M- n
Store(BSTS,Local0)
) E- ^) A2 _; N+ [+ ?# f
; y- W) p1 o% H

# m1 l( `, k$ O" K) KIf(LEqual(Local0,1)) //Check Battery Present Bit
% n( Y) [' ]$ ?  m: [8 u# K+ I' T

1 B! o6 M" z1 v0 F. F{
0 z5 t2 d" e. G7 K
$ [' F! R5 T8 s+ h' ^4 m; R+ x! S. ?! B: `. V* s8 E! R
' a- Q7 G6 V+ @
0 ~6 o) \  i7 J" W

4 @- @" \9 h* \7 L# J" I//Read Battery information from EC
( h$ Y# Y. W! b' v0 e
" `( W/ n& f7 T6 ^0 t1 _. L! R
… …
4 M  L( U& C1 O
8 v5 g+ r- c8 e1 a

' j5 k- l, q) M! {. o  @! M}
, q9 p  P. N3 @, y& a6 h+ S) c

  Y, y# J& C6 `* S5 M. v' J8 dStore(0x0D, DBG8)
* P+ V  Y8 t2 b' l+ d  `# {5 ~4 f
}
2 m5 @1 }- V# N8 p" J( N! v那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。( u! }: s3 ?0 r1 y
那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:

! p( ]- Q8 Q  \9 W+ m5 x2 L; u6 ]
  ^1 e2 C, ]/ ]; E0 p+ q
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.
1 Z$ t, i, D9 W% v. V4 a7 U7 w, [   x8 y- r7 f7 i, [
  • Solution

1 t5 O- \4 r% R+ C  {% ?/ j4 Y, H  h9 Z1 \- v# d
经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!
; ?* |& _* K8 N( j1 _; @: u- R
. U9 v/ a. o& @  A' a$ D7 o7 N2 c4 M

: p. P/ M/ ]. H7 ?4 ?) Q6 t

* h8 i1 e1 q0 e/ D0 f8 i6 h
0 ?) j3 X# U( ~; w/ @, xThat’s all!
: H  D4 ~  ?5 t! c$ N/ r + `- A' `! z; W5 x  a9 H" L! R/ i
Peter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!
- [  j! M. K) ~' R3 E* Y4 U' D  x4 u3 e: Y4 X2 c  f! v! B
谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!& g3 ?6 R! H9 m, u
我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...
, h" @" V# ]4 b. X1 W$ i很高心这篇文章能够对你有帮助。5 z! _$ w- ~' _0 s" R- h% x* L
上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是
  w# }! d. B6 _. c; l5 @ACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.& I: y) x0 Q7 \2 Q1 l5 u. D
简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。
' m* K$ C3 w2 o对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!7 E: t7 l2 z1 }6 q- @# u9 G
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了
& ]" @! j0 |0 W+ D3 `4 Q9 j呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!
% {+ k# Z  `" J! q3 r     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:
3 P  V6 g, k1 \7 U9 c7 G4 w! u1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock& \9 I: s( D# a9 k( k: r
chipset reset pci reset系统重启。
% @% O" p6 e1 d2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)
/ m+ C$ p# w3 M, e7 [9 F8 {等等一些琐碎的动作。" u0 l% t' q; s: c& U  U
之前碰到问题比较多的地方就在idle这部分了。( s2 W9 O- @) U7 f0 u
你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...
# o5 {( b' Q0 b% Y3 ^9 W还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。9 Z: x. G' ]1 ^. G: S& f8 g7 [- ^
以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!
# a- r7 v  K2 Q5 ]    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!6 B( z7 n& V1 w6 S! g
     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:
% \& ^1 B+ ?0 ~* X) \4 Q& NBIOS发FE不是通过SCI,而是透过60h,64h port。7 ]6 @( z  Q4 v, T/ `
BIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2025-12-1 07:15 , Processed in 0.080331 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表