找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 32918|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response

! m  V; i% z  `" b
  • Phenomenon
    4 F$ n* s8 T  v9 |5 j
8 D* C2 I; A, Z2 G0 _! W4 X
手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:
" k$ r0 h% P/ B; G
1
  • Why???7 Q' c$ k% D+ e7 N; W- }$ a' V
: o5 }, A) `2 O+ V6 \$ ^& E
; N% {9 r0 q) Q7 z( r. X3 k
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:
, b4 B* y# K0 t% b% T( I3 N" v
// AC Change event3 Y% E2 t; s' s5 I1 S# }

, O1 _3 \* A  B- T( H7 PMethod(_QXX)

7 y' O8 r5 {* W" B9 m) i) K3 u1 ?0 p) V# l( z- |
{

, M8 z! \/ z& U- Q, o. I- L% p$ ~8 U! {7 p2 ?+ v
Store(0x09, DBG8)
$ M, r. D+ r# x& {: Z9 {0 t

! k% \# ~0 r# V4 ]9 p  I3 q% CNotify(\_SB. ADP,0x80)3 y6 l$ {4 M: l% m0 m7 F& i( Z
//Power Source status changed
& J5 d& l6 a; Z
: t+ w2 v2 A8 t. n! k
Store(0x0A, DBG8)
$ Z. W2 f. G3 |( I4 g- N

7 a- k9 M. Y. F& Z4 e: t0 ~
1 |2 V- A. b- o/ p) _# o5 ?8 t" ~}
  n. r7 S2 ~% Y" ]) T4 j- F  Z) c
5 ~* [$ w, Y4 S& U0 J

, s9 R: ~' W7 {9 m1 h1 f- C- P3 W2 B0 z8 D3 m4 c
Method(_PSR,0)
% n+ |. V1 }; O* @/ y" J) e
1 C: q+ _7 |  ]

9 B$ P% c' m" E! q) ~{
& y7 g& U/ ~6 L$ G
) g: }6 J' v  W6 l
3 G- _" r3 G" L5 b$ ~, X: L1 A, O
Store(0x0B, DBG8)
% `$ i* n" E7 D% \# Q: f
2 ?8 F6 t$ J# l. H3 E: \

% }, |0 L; O) f; E( n7 p! [If(ACST)
- ^" F+ G$ s0 B% }" v8 m. j% Y//check AC status
. i- l3 ^' x; l' z1 [8 @8 M: L
, g; \% ]9 Z. `
{

$ a; |# \% w( \4 z1 v* ~* w$ f9 S) I2 N' r  w4 `! F
7 g& g8 y7 M7 a1 U- g* Y
return(One)
) P! u$ a% x# @0 U// AC Present

" U; E7 ?( `( m, C( S
& G. D- s: o+ ^0 \6 A}

  t) t# V0 ?, q5 d9 x  `3 n
" ^: t, G5 d" A8 D9 Ielse
4 G6 i9 n# t- v) p

! n- x/ c0 \9 T" i7 r/ z1 {! O# g{

, G$ {  i. ]6 {& f9 D5 R2 P" p  u- x. i: \+ S1 [5 S
return(Zero)& `' {/ C8 X3 [, b; e9 D$ i1 N
// AC Not Present
1 \( |% A' U( j

- B+ k  h4 V  O; N6 o}
  D, b" O- J, i% O
( @: P7 D8 {4 ]* v: a
Store(0x0C, DBG8)
8 A4 ^- X- x" [3 ~9 g, I3 M

7 A6 y) W8 ?4 G$ o: X- j* _}; T. Q6 y- ^' L: r& m" C4 h+ K8 r1 u

/ |, ^& P' v* l: v; Z. x
% k2 J0 h# f# K% a6 Z. ?
我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。( N! z# p+ `3 ?- M- D
状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:
% F! Z& I* {+ o  i- ]" j/ F' \Method(_BST)
8 S5 v# T8 c3 w4 }2 E6 M/ @3 z{. j. D$ d+ b% b2 z6 H" h# C
' m' h7 [7 [: h; b1 n
Store(BSTS,Local0)

+ m# H' d" o6 F; ^  D  x9 R/ u1 }* s  E
3 Y0 ^. O3 v5 {/ g. B+ |+ R
# |' F, e! X; J9 p1 RIf(LEqual(Local0,1)) //Check Battery Present Bit
" b7 d+ x$ _" @
/ ^" b# F8 S$ C5 n# M2 V+ s
{
  U  T7 E6 K; S" y' \& U, L5 s9 C; e6 B' }/ R

; q& a9 K' l' L( k5 p! Y7 w0 Y& |) \: C% q& h' [

- L+ S4 Q; N! L, D/ @1 ^  ?9 t9 |: O) }) k2 Z7 @
//Read Battery information from EC
2 u) S: r, R3 m" W3 `5 Y# B
& {( g! d: b, A
… …

  X8 d1 z* m0 O; P6 P7 i. T
! M) M# m3 H6 z% Y  n4 e* w* S! l- X8 t
}

- H2 [9 M  Z/ S0 y. ]& Q! i. a6 l0 _4 W0 W$ q+ E
Store(0x0D, DBG8)

+ h$ m! M! b/ R8 e0 C3 Y/ x}
* O$ J7 ^3 G; \* s那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。
  E4 L& u# o+ J  W- m3 w那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:

  c, M8 ?# F3 M* T4 B
- L, w, d3 w$ W9 u
. h5 R* ?5 h& r& @& Z
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.
/ \* Z! V4 p5 M - [  \0 P$ F' g: N$ f7 `& R
  • Solution
9 \  n) S: L, ?- Y* A

& U, L4 h' K" b2 T; d: a4 n经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!
; |& M7 v2 G& W3 L
3 m! J: e/ D: R; i, k2 {* T6 I

2 o5 M) _7 |1 H. v: G
4 F7 H# K8 ^; j4 B. F1 v
6 K. K  i9 i) W# A" s" l
That’s all!
5 @- U; P" g  r0 \
1 a) }0 M2 \5 |3 ^Peter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!
: h* g8 V  E2 e& O# d
: \0 t' a8 l9 ~- J谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!
. B8 f# a* b7 Z4 c% h我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...- _1 T+ v2 f6 x
很高心这篇文章能够对你有帮助。" |9 B+ s/ c" w; P. N
上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是7 m2 p5 v0 x' \
ACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.7 S+ q1 i& ]+ D  i! T! o
简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。
% ~% W/ m& A: n) [& D对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!* J* j7 Z$ N, C" W: o2 M! a
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了
: B* Y: H7 Z" o* J. z4 w呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!
0 x" b* y' c" m7 ^7 a! C/ o0 P     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:
, {* s8 m9 @2 r9 n% T2 r1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock9 K! i% O7 m: D) i' `
chipset reset pci reset系统重启。  m' i" B7 B. S, `
2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)
, ^7 O; Y+ g9 J' q0 z等等一些琐碎的动作。# ]# a3 ^8 }% Z
之前碰到问题比较多的地方就在idle这部分了。& }& H. b5 ^" f, v" @
你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...
: Q, ?& C* m5 J5 n+ `还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。. K5 Q) y- ^  B  p+ P! ^
以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!
0 l" ^7 I6 o- _) V7 u    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!
2 f( F% V+ {3 X6 \3 @     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:( S4 T+ H0 C( y0 i$ e% |3 ^
BIOS发FE不是通过SCI,而是透过60h,64h port。
! Y0 m0 `( z% o% U; MBIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2025-6-13 06:58 , Processed in 0.042193 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表