找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 34881|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response
8 u7 [2 z2 }' J' v
  • Phenomenon. S6 d( T% Q* F  {
5 c, t5 a5 _- j: v3 l
手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:
  U% n3 U9 ~, E) W0 `
1
  • Why???2 _  d) P$ a9 Y7 v3 ?% W
, k0 S  m. D+ I. \$ E, n
/ R2 A1 s, z; S/ {" U: b
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:

4 g" u0 m& L8 N// AC Change event, C8 ]- I9 q0 g6 }) P5 _- b0 D2 }

. }% @- Z( R/ U; @/ }, ZMethod(_QXX)

! K; w. ^. [/ e& o
% V, G9 |( j6 T, m3 p" @' P{
+ Y- p$ b+ z# P, Z. e& ^7 U1 l

$ r0 R, y6 s; ]1 s6 E& cStore(0x09, DBG8)
7 b: x* x; G% [# C8 A5 ?8 j! S, u

1 W7 M% c8 A1 o- ^Notify(\_SB. ADP,0x80)! w) I/ e8 [% ?
//Power Source status changed

! ^9 a+ r3 ]3 @% g& K( j' c! B! ^
" d: }" z1 T; y0 ~3 eStore(0x0A, DBG8)
: }1 ~2 J6 k& g# N+ f0 h: c# |' p( R
$ u6 M' k  Y! q5 m

; ]- g. d+ [0 C}
; w  U' s: W5 x- b+ G; j+ ~/ G! J# ?
( Z+ Y6 ^& {' u, T+ [7 P: ?- t, T
# R9 {0 ?9 B% c: ]+ K
) o, E5 b! D/ k( p% Y
Method(_PSR,0)
9 ]* @' k, f' S, x

9 ]) {) ?" i  G# {! S4 j+ A' B7 m, B$ G
{
& _  S5 U7 w2 w  A& m! e: A, R5 Z% e

4 C- B8 ?( [& a! w0 I" g( @3 O7 W8 _) `% C: g2 ]
Store(0x0B, DBG8)( S+ O! z- k2 |8 u+ r" r
' J( O! }# Q$ y7 V9 h. f
# g' t% |( g- W+ k" Z# ^2 a
If(ACST)
( d! J3 I3 }7 S7 ~. e+ |8 v& ]/ o; e//check AC status
) t  N' q% q' @9 a  o5 G- j
9 p9 w. J. Z% f# n
{
. i8 Z* ~: T* S
5 z% f/ O' b) f+ m

+ m  A/ V- ^9 K( V0 D  qreturn(One)
# Q$ Q9 p  ^! c0 @8 h. v8 a* j& z// AC Present

# Z9 R0 I- D$ j% ?" @2 W% ]" |$ ?1 p2 T/ @. ~
}
4 D# ]1 @4 W5 H2 @' i4 k" Q
, }" B  \) Q8 |2 c+ q
else
/ N# }( _! U/ T1 |2 m

4 d! u/ O: T  z1 n3 A5 _7 c- C{
" X- d8 @& E6 d
0 c3 J, U9 L  g
return(Zero)
3 h% H9 {0 E- u; M, `! C# o// AC Not Present
/ F1 F6 P1 h' S/ V, x3 A
+ e2 r+ `- G% C- v2 r
}

* K( V6 }+ J0 a7 H4 d  }; R& _7 I5 r* F% |8 B4 S
Store(0x0C, DBG8)

8 Y8 Z5 L' q) M/ n, S- d) C
" u4 p% x$ y$ x+ s, b9 h}
  a8 M6 {; u- A4 t* Y# a: I# j* @" H- R' F* ?

; n( U# ]0 ^, h/ g- X' }我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。
3 w+ W6 N6 x( L状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:- y& M" Y+ a7 p5 P& v
Method(_BST)
; `! v) P5 O& X3 {; a; V1 o7 T: ]{  c! ~" O9 k% _( L2 h( H8 n1 v& h

* D" @6 r  G! |: ~# aStore(BSTS,Local0)

+ }0 |# a+ u, c5 M) D" y9 X% S( L
" v. B1 l7 c/ z. M9 W; f% {4 n  `+ k( ?& A% `% Q
If(LEqual(Local0,1)) //Check Battery Present Bit

* i4 w# ~5 G2 H; H, m# Q" S/ X! W- h  O1 @; x3 X9 U
{
" i6 _% s" t- P) v6 n+ _: l7 \3 u" k* ^9 K, o7 N8 s

$ e$ s6 w! u% {+ I
2 C4 D* v* S( |# Q: v7 Z4 x; p4 m6 C( [+ ?2 Z1 I
# H) @" k+ U% }
//Read Battery information from EC

, V9 M+ N' v* k+ J. Z: O& F$ o
5 f8 s" c, L, C' q% \" C7 C… …

" d9 u7 t3 b% r. J" U, K5 ?7 v) V4 A; B

" N6 ]6 g( Y2 R8 e' s  _5 ?}

! M7 o& W. C; m! ?' a% F6 h7 F
, A- ?: C: ?- [% uStore(0x0D, DBG8)
5 a( b4 b$ l7 ^7 p
}
! Q! ], b" ~" e2 P" w6 N3 t那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。5 X0 K. w' t; }
那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:
/ n1 P& U& a( z2 l& A
/ ~4 t0 A0 [8 n5 _2 ~. s
- M' }1 T2 `& W) [( z! K
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.4 G) }5 k0 T  J3 o$ e

+ u/ u: _7 S" q/ @) N3 k' B
  • Solution
& F8 s/ O2 ]3 L1 Q

7 X" {! d. ]# G6 X6 K经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!
" [3 p6 |8 v) }8 M) E+ @' e5 d
7 P9 V( ?+ N9 v1 F1 ^

" l9 e# `( c; }7 e4 l: q( @

) \( h% q. y3 j 9 n( Z3 A) M0 Z# B+ ^5 Y" [4 y
That’s all!; E9 p* t# A3 _3 @2 `% K9 y9 v
- B9 G4 P/ a$ ^& F$ k
Peter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!# z6 k8 \* Y& J' s) i' E

/ N- c: a$ }+ M4 R- V% Z( m谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!
, C8 V/ i8 c3 |我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...$ W6 j" N6 ~+ W% U$ F
很高心这篇文章能够对你有帮助。/ t$ j+ a  J- ^/ P; ?
上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是
- ?* q( X8 Y  e$ L0 |ACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.' E+ j6 |  J# G) c% l3 Z- a
简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。
/ `1 S5 _% U- w, Z对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!* \* |3 w( p9 k) e; k, |
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了8 A/ T0 M8 O) B, Q- o
呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!: ?, H0 u- r' c! B, x
     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:+ V1 q- S/ J" Y$ K" K
1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock; B9 Y& n! z/ I6 e3 O- {" G; }
chipset reset pci reset系统重启。  y) z: t# i! {& s; n  h0 {" m7 [
2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)" ^* D  A, S4 t1 y" i/ m
等等一些琐碎的动作。$ Q+ M/ K# |+ B
之前碰到问题比较多的地方就在idle这部分了。
+ k2 t8 q9 w: N你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...
5 H5 S1 z  R4 r还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。* }% P5 w- J5 h! b( ^. P- J* n
以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!& `5 Q/ G  q1 \0 r
    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!
- T$ }* {/ Y& y* @     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:& [! y; n$ Z$ @- a
BIOS发FE不是通过SCI,而是透过60h,64h port。. T7 _8 z1 p6 X) R) G" N
BIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2026-6-29 02:40 , Processed in 0.094967 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表