找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 33708|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response
  H9 t3 k2 m8 ]1 E
  • Phenomenon
    / r" k4 q7 S- t. J- e3 `

4 `0 A# L8 y. X/ H5 ?0 i( g* e手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:
* C1 \# e& l$ y& v2 F
1
  • Why???( I0 P$ y3 h% c

% ~, {: p, q- }0 Q9 ^: Q2 `7 Y, C/ O: z7 N: ~4 A. b/ G7 V
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:
( S1 Z3 C  r2 b# A5 ~
// AC Change event7 N9 I8 P$ U# e+ A

) L! G5 z/ [4 ?5 t' o9 X2 R+ F& [" gMethod(_QXX)

7 D% U3 ^6 [+ k* [( ^1 k* W! c9 T% e2 _7 C' A
{
$ D  k  O. S& U  r& d

5 ]' t+ Q" y- U0 h; W8 ?Store(0x09, DBG8)
* [. E5 t) N, `3 ?7 b

+ M; n8 A! i' t! x# GNotify(\_SB. ADP,0x80)
: \- T( n. K% q) _7 |//Power Source status changed
. k# w& ?, V5 k7 r4 W2 Z- B+ \

" b  S6 ?% r" ^: j/ A* b+ WStore(0x0A, DBG8)

8 ~& [- D/ F; \. Z" Q5 R & _* `7 y0 Q+ \9 Q

& e% I4 \* q: |7 j, q: I$ _" |}
- s4 X- `- ], r

* w7 ^9 P; g9 B/ Y) V$ c

! t% v2 U& i& n+ P% k+ r% o" k0 r$ o
Method(_PSR,0)
4 q' y# Y6 F! A
, k# D+ Z9 H! C( Q8 y7 \

  P2 O- X" e/ C0 p9 H% H: q7 m{1 P8 ?. [) x, R' P) F( F
# }$ Z) |, E" O
% u& V5 p7 R4 C$ |; n; t
Store(0x0B, DBG8)
  O, N/ Q8 j2 i4 D

8 _: o; z" P) H  I7 t! A$ M8 j
! b: s- H& \* M' ^  }If(ACST)* C+ S5 }, N; C" Q6 ^
//check AC status
2 M& p: [# ~: X
6 a5 d4 I$ z* V/ o) N( _
{

1 e* o3 Q/ N  Q- S) i: t- |7 w" Y) l( V5 @3 U' Y

$ y; I5 \) _5 K9 i/ g$ x# _return(One)
: @; q7 S5 `! ]/ b// AC Present
; _- I' L3 `5 C4 d( e1 k
& z0 V  u0 `$ s9 Q# h* v( j
}
) v& e7 d$ ]2 R, n# G; Z: ^
' m2 e& C0 d) b: o) x/ d) l
else
: S" H3 A, Q  V4 K$ s: w

3 A8 J! n) B) D/ D{
% D9 o0 T2 L. R* `: p
, M) I9 o+ o1 |. \9 G; _: V: B2 t
return(Zero)
) z7 Y: O' o1 W, Y: c, D// AC Not Present
6 _* \8 |' z6 |: U

4 f0 f# I6 p+ `+ M! T% @3 f}
( G; O! o* H: {, Z4 Q* S
% v$ G- G' L! M
Store(0x0C, DBG8)

, P8 t& z( N, H" [2 b+ _
2 V* s1 a" P' L7 j$ `! G+ q: w( i}
+ v# Q6 S5 P3 r; D" b2 V
. @4 Y; K4 K) u. R1 N: L
, d& u# Z. F9 M5 T+ n
我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。
* \6 e8 f! @7 F状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:
6 l9 C% g8 D7 k$ cMethod(_BST)
& w# a/ s- S, \* N" {7 F{
8 q8 _: n( N  s  A
+ V: ^2 t, L2 [9 L, D( ]0 kStore(BSTS,Local0)
# g7 L5 }1 e+ H4 J# o

2 ^9 |" o& z5 C) L& w* o$ a  H6 u5 R! _% E4 b+ |3 X7 f
If(LEqual(Local0,1)) //Check Battery Present Bit
* E. Y8 G" W/ u8 E/ [1 M. F
3 K7 A+ l: A8 u. A6 l9 G9 H
{
) d8 k! U* r- N; [8 Y+ \3 i1 k4 R9 ]4 ?; I8 L
4 l! K- h# l" C8 x) W9 O+ y' L

" e  U2 u: k& J; a4 M) F8 \* ?- Y  `, a! _. J
! n3 ~9 b. O* k' ~6 A! h$ Y- c% `
//Read Battery information from EC

4 T; _, Z1 s0 l$ i; Z
+ \+ ^7 a/ M. j+ _2 u- t1 [! M& @% r… …
! c9 h9 x3 ~  `7 m/ W8 `" A7 f
7 ]2 s) z' Q: F, H
* U4 u# H4 \+ t5 \+ i* Q
}

7 h4 }1 A; H; r1 K8 B! X) q! F! Y6 e2 S; O* _3 N3 o9 D
Store(0x0D, DBG8)

9 Z/ y/ D  B7 ^# ~6 g; b}
* K$ }" `& O; J* j那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。7 v3 t! ^9 u* e7 W
那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:
% g5 t% S# y* U

8 X. T: f; e. a* g9 x+ o! h4 H3 H
$ r& \5 Q7 I+ d1 u. C% J
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.
& h+ K$ m1 l; ?* p) O / y' e1 ^$ M; c
  • Solution

1 D$ b- L2 A! x# D2 H8 A8 x# f* R7 o( F3 W' n0 ^
经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!
# P  e/ V5 [0 y; v; Z1 b, Y+ v

; j  N+ K% j+ M- [
4 S% M1 Y0 Q4 ~* f5 j3 ~/ F! B
- L) d3 j5 Y/ f7 ~$ A! r

7 ]! X) O) d& H3 H; fThat’s all!- P& E5 [+ n7 R4 L' e

( K, o% O- s8 X# O+ OPeter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!
  K+ A  b  {: O. U( o2 U5 V3 N' m7 t# @+ Y
谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!
, B. Z9 o, \$ }/ k( E我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...& c' _0 o! d) N1 ?3 G! T
很高心这篇文章能够对你有帮助。2 M, ?: f  o! f4 m" A0 b  k2 u
上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是
2 H5 u# c6 R9 Q/ N1 J, JACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.
% D, [! T9 o/ q0 h$ }简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。
9 v" K- a; w" N5 ?8 U" U* v  G3 @对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!
( s) B, [" f, ?/ X% h% G4 u9 f
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了
5 M8 D& Q$ w4 b! p呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!
4 u# ?, i3 F: Z+ g) f( S3 [     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:
* d6 ^5 l1 T: H  c' |1 B' R1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock) P. D( l( x: n$ A' w. C8 z
chipset reset pci reset系统重启。
7 H$ U5 H# x- u) `" i2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)' e7 {- z; m! H4 D1 ]
等等一些琐碎的动作。
" C; z5 K- R6 R4 ^1 }6 n之前碰到问题比较多的地方就在idle这部分了。
. ~% H4 N0 a# H1 N# |& ?你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...
5 l1 @7 H8 x1 p1 v还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。/ T" x  K# Q+ T& F. k
以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!9 y1 D9 \. P2 N( j
    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!* U. k- z; x. l% w
     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:
6 M  G: Z+ Z9 |* E3 fBIOS发FE不是通过SCI,而是透过60h,64h port。
; |- @" S4 ^/ A' g, q! eBIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2026-1-12 00:44 , Processed in 0.170059 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表