找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 34266|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response
8 A" s/ u4 k! L0 |# O
  • Phenomenon, M% [$ C  A6 P5 k/ K$ ?
$ O: I( k9 o$ `7 i
手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:

, k. G0 o' Z- U" e& f0 [
1
  • Why???
    5 V/ t4 B7 M$ C# b- p, |" ~
" e8 A+ r; r5 W5 H, _0 Q+ R
9 i" {6 q+ {  o* U8 J. |
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:

2 e% g& c( T8 S5 U8 F// AC Change event) C; \6 Q2 R! ?2 ^  P$ g( v

4 h+ m8 K8 s% [Method(_QXX)

! f, y3 a+ l' A$ o0 @$ x' R: A: |9 h$ \( v
  v" m: v5 ?; E# b{
- b( m% b6 A( v
5 W& X& r7 c* i7 k/ P  d
Store(0x09, DBG8)
( d* Y2 H8 b7 \6 t& P' d. R
6 R# b- h' ^) C2 m5 q! s. p: ?# h5 d
Notify(\_SB. ADP,0x80)* s: P0 {5 t' C  K! H
//Power Source status changed

9 ~7 J# V3 W- v( _9 C! G) P$ W! u2 N! ]$ O) E* B
Store(0x0A, DBG8)

! r+ c( J# W/ w9 I! C+ ^ 8 ~; f7 K1 D2 {' h: P
& N2 s+ @6 [6 E7 ~1 O3 l* F3 L
}

# g, Y7 b1 J2 g. N+ o- d9 h% J" @$ K7 A& d: j$ m& {$ y1 j

( ^; n; A6 X/ i$ O4 ^$ h+ y0 Y; i( k1 @
Method(_PSR,0)+ g& P/ ^' Z7 O3 V: F' M- k

; o% ~7 n! Z, f8 O/ ]% i
: z# `0 q5 z( z0 j1 D{
9 U7 R( Z* K  `

9 J5 H8 p8 E; @2 x" `8 N5 w
  t* P/ o4 U6 J  o* G$ DStore(0x0B, DBG8)9 P& Q( G; R6 n! W, G" J, `7 Z

3 U, l7 ~* V6 l' V/ l6 D
; d% A$ v0 }( \0 [If(ACST)! h# |! q& D* @; {( s
//check AC status

5 l. u$ W, z8 P+ _5 f; s) v  t, M6 M
{
2 z5 @! T6 M: r
5 w! q/ T4 f8 B" c

' h5 R) ~* p- Zreturn(One)# W; d& |: ?$ x/ g
// AC Present

8 ^9 q& T7 I. |& l0 F6 |
$ }! X, b( w2 @9 U3 i9 [% F}
6 D0 |6 ]9 b) p. Q9 [0 \$ @
* L# x% O3 u" @9 D
else

2 L  |( o) \: J$ d6 e, U4 d4 ~  v& D  d
{

* I/ \3 r+ U- z' S) r2 C$ B& T; M* l$ S* l& @
return(Zero)
0 f& d* h+ }$ C1 B' a* Q! R// AC Not Present
: x( n$ m  a# p: b* @8 S3 f; p9 J6 K% J
  ~( [/ W0 f) l; X( Q2 i
}

( L) |2 A' l! a( ~4 T7 c# k$ g
& J: y' H3 f- R$ p" FStore(0x0C, DBG8)

# y1 \9 `' A4 U* j4 O
9 e6 @8 c8 X  b6 Q3 L: _}. L; J2 K' O( L4 W8 W

& j* f0 L; F. w/ J3 i5 r) h: a; V
# J" L3 N# Q$ B
我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。
0 s* X! w7 P) D3 x, f, A状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:  f/ c/ [0 v. Z7 n; ~) H0 K
Method(_BST)  u& S5 L& J1 l6 k1 S( x: @0 y
{6 L# q6 C3 L9 e' ^: T$ x$ C& e

! K3 d$ g$ R6 @( @Store(BSTS,Local0)

6 k; E$ g2 m  `) H1 V& N8 j# f
! M; a( R: U7 C5 a* M- }3 R. p- B1 G( X6 h
If(LEqual(Local0,1)) //Check Battery Present Bit
' o# a+ x$ f! {
8 `" G2 T3 A& `. q
{
* R7 U! J. n' G% c9 c$ o( q, Q  D! C4 O( s+ s" i% B! R8 L
' H& u: e/ {& u; U% x+ e% X
! q- ]& ^1 p7 F6 `" l- r" L5 z
0 H3 V3 Y* S. c8 X9 K$ ?- U* l$ R

3 B5 y1 R2 \' r: T//Read Battery information from EC

3 |7 k7 I) }8 @
: U7 a) j1 f, a2 \8 H) K' o* T( q… …
4 j5 V7 X+ r2 }" w
  Y+ E3 I3 t8 T9 l# A% N+ ?3 K

$ a0 J6 Z. N2 H/ E! T1 f}

& J% ]$ y/ q6 j9 F
1 G6 E% ?/ y! N% {) Z* N; K. b5 m) H' wStore(0x0D, DBG8)

2 k: g! x9 v  L2 k+ q0 m" V}
, D9 b; ^+ I) ~, Y. d/ P那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。
* B5 U! a2 e) y4 z( B: g那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:
8 c! o  `6 L3 Q& C' @

6 A: P5 F2 J5 i% v: F5 F
) a% ~  Q4 z' z7 _; h- h1 ~
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.
' D. I  I4 |% O% @
  Q. U3 D6 K/ c* m/ H! Z
  • Solution
- u1 c7 g& a$ b! H" {& x
+ w; q- H6 v% C" v
经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!
! K6 Y; t- H1 U# E* p

" L3 y! p, p- o& {# N
; Y$ H# U: C  f4 D! Q8 c+ Z

, }+ ~5 G! e+ m) U  m   Z; i- |4 N+ p8 e  S9 U3 z# v- p
That’s all!; g9 {! g  t8 U0 }# T9 W/ ]1 F5 _# j
+ o9 F" N3 d9 z5 `4 M
Peter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!
' L( C0 R9 m. t* I- C9 l
5 K% g9 v+ h  E3 X) [谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!
; k4 r- Z/ a: a1 U我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...( e9 W" `' P- |3 y. W; c3 `
很高心这篇文章能够对你有帮助。: ?* l! g8 H7 c
上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是0 E% X- F9 X: n; a& }+ n  M$ I" l
ACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.
+ F3 M- k/ z: m, ], i简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。
, z9 q6 ~. p/ l9 ]* A对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!
+ ~' Y+ n6 v9 h& T( @* X
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了
1 z8 z) m) {# w* f呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!6 @% t5 V9 i3 E9 v; }" r
     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:
* K( I4 P# r3 x# P0 g: x1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock
* B# O8 M$ j4 A5 h' e% U; j- w% Achipset reset pci reset系统重启。+ ^% W9 y. p5 \5 V
2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)& D6 x) X9 ?; Q9 Y  O
等等一些琐碎的动作。# M& O! _, U( G% v7 Q  E
之前碰到问题比较多的地方就在idle这部分了。3 L5 ]& ~6 |  q' I( M* v1 w
你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢..." v8 r5 X3 ^( I& l0 ?
还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。
7 Y$ W3 Y! a9 G$ f以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!
& _' M2 o5 y* e  M  L    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!5 U! @3 g7 w9 Q1 ]9 W: b# o
     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:: z2 K% _+ H' o1 D( ?, f% ?( o
BIOS发FE不是通过SCI,而是透过60h,64h port。9 Y+ O5 A0 M8 O0 I' R! Z- l
BIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2026-4-24 22:37 , Processed in 0.046114 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表