过期域名预定抢注

 找回密碼
 免费注册

Google Closure Compiler 高級模式及更多思考

[複製鏈接]
發表於 2011-7-10 09:23:36 | 顯示全部樓層 |閱讀模式
 本文將詳細介紹 CC 的高級模式部分,更重要的是,闡述 CC 高級模式背後的思考
$ ?, r. j& X0 O) d+ F+ I  CC 是真正的編譯器
( j+ m4 t  W; _3 i& w  Closure Compiler 和 YUICompressor 並不是同類產品,雖然 CC 和 YC 同樣產出壓縮後的 JS 文件,但是 YC 只做了詞法上的掃瞄,而 CC 並不只是一個 compressor 那麼簡單,器如其名,它是一個compiler。  X" C' M' }; L0 f, E; b
  對於一個 compiler,一般地,它需要做到:" M7 n  P; L' M2 B
檢查源文本中語法、語義、語用上的錯誤;6 v/ v! \: G. \$ p8 E
根據分析產出物(符號表、語法樹等)產出目標 / 中間代碼;
7 U$ d7 d! u9 k7 `' h8 U7 Q! e0 Z優化。
: H5 C+ Z- F+ Q2 _- T/ @9 y! p  代碼錯誤一般來自三個方面:7 k' @$ t. @! i1 Q, ~! S0 u
語法(Syntax)* Y, f$ z4 I! {4 m6 a0 z2 @
表示構成語言句子的各個記號之間的組合規律。大體上,parser / interpreter 在詞法分析和語法分析階段,產生符號表、語法樹等分析產出物,具體見編譯原理教科書……
* q& y6 W% P/ T! I語法上的錯誤,如:
) i, }/ Z7 m- _$ z$ H2 T9 X$ mdoSomething(;) // SyntaxError: Unexpected token ;
! K: x8 o0 {" Q/ U, y+ r. q% }根據語法規則,在非 for 語句中的 ; 意義是分隔符,而分隔符前的 ( 並沒有配對),因此報錯。* D9 J8 n. G, G) W# U& i- Q
語義(Semantics)
* Z; l) H. D4 }3 [- G表示各個記號的特定含義(各個記號和記號所表示的對象之間的關係)。compiler 需要根據語義分析產出中間代碼,對於不產生中間代碼的語言如 JS,則在運行時的解釋期間指出錯誤。9 z; f3 F# t" p; a! P% o
語義上的錯誤,如:
- p- \8 ]2 i' i: P0 = {}; // ReferenceError: Invalid left-hand side in assignment; X- V9 ?+ c: P8 l
根據賦值運算符 = 的意義,左操作數不能為字面量,所以雖然這個賦值語句包含了必需的左操作數、運算符、右操作數,仍然出錯。; b' E( J  G  ?
語用(Pragmatics)& W. p* t$ |" [) z/ j: q
表示在各個記號所出現的行為中,它們的來源、使用和影響。, M: n) D: V# a0 r3 {8 U% I# ]1 l
語用上的錯誤,如:
( K8 ~5 Q, Y. x7 `doSomething(); // ReferenceError: doSomething is not defined* |2 M) J1 |( I! I/ a, D4 t
在這裡直接調用了一個未定義的函數,導致出錯。在一些其他場景中,雖然程序運行正確無誤,但是仍然可以優化(這種優化並不是技巧上的),比如:
5 E3 ?# L  z& s1 }function doSomethingElse() {}(function() { return; doSomethingElse(); // No Exception but Redundant: Unreachable code})();
: v  E! @: H. h( H8 \  在這裡,doSomethingElse 函數之前由於有 return,因此這個函數調用將永遠不能執行,這種冗余代碼對整個程序來說毫無用處,可以去掉。
/ F2 X1 s' D$ ?6 n" n+ I  對於 Closure Compiler 來說,它處理的對象是 js,不需要產生其他中間代碼或彙編代碼 / 機器碼,因此輸出的還是 js,但是是經過分析的、優化後的 js;另外,它也可以選擇輸出 parse tree(使用–print_tree 參數),所以,CC 的確完成了一個編譯器需要實現的功能。, r$ `/ ~% O, m# m+ A  O4 {& T
  CC 功能概述
7 ~( m5 `0 F2 U" d  在詳細討論 CC 的高級模式前,還是簡明介紹一下功能體系。, u4 D9 i' U3 C! m) F3 N
  編譯級別7 X7 ^( K4 A% |7 f( B+ _
  CC 的 compilation_level 包括三個級別:
) m& e* u9 e7 H" ~, _- WWHITESPACE_ONLY, X7 o, r+ o% K+ T* m6 n
只刪除空白、註釋。0 r3 s% r# X! P! p# P
SIMPLE_OPTIMIZATIONS
% d/ ^4 p, \! h在 WHITESPACE_ONLY 基礎上將局部變量和參數轉成短名稱。
9 D! x* j3 Y. R. a2 D% MADVANCED_OPTIMIZATIONS% }! \3 U2 q  m
更加激進的重命名、移除垃圾代碼、內聯函數。4 e, c5 X7 M  j  _* F; Z0 m
  可以看到,SIMPLE_OPTIMIZATIONS 級別的 CC,和 YC 無異,沒做什麼真正的編譯工作,所以說,使用了高級模式的 CC 才是四肢健全的 CC 。, q7 M5 E0 H) j4 O( k) O
  約束條件2 y/ P0 X* `% r; u$ o9 Z
  使用 CC 有一定約束條件,這影響到我們的編碼風格:2 {0 J! G  ?* ^
WHITESPACE_ONLY, u& v' M1 m" ?) e! n3 g
不認可 JS 1.5 以上版本的語言特性
8 x+ l/ t- E2 ^5 Q, S) }, c" m6 s不保留註釋
3 G9 L6 N1 S! q. n  l2 M& j+ tSIMPLE_OPTIMIZATIONS' Q* ]  {+ U: q0 @  T' z5 G7 ]
完全禁用 with 和 eval
# s5 s2 n9 w. O+ U, ?字符串中引用的函數名 / 參數名不會改動(CC 不改動所有字符串)& E# D5 D& N" J% \$ w+ P/ \' B
ADVANCED_OPTIMIZATIONS 模式下的約束放到下文詳述$ \, q$ H# z- y' Y3 n7 F5 F% b
  註解$ |( ~0 Q! B" u0 T/ }$ N
  Annotations 也是 CC 的重要組成部分,使用 JSDoc 風格,用以輔助高級模式下的編譯,下文詳述。
2 N. A/ I2 n" t9 A, A0 a# Z  使用 CC 高級模式4 Z! a* u( Z/ @, c
  在 CC 下,啟用高級模式的方法是加入參數 --compilation_level ADVANCED_OPTIMIZATION。" ^" K6 r4 m4 `' T% l
  作為一個 compiler,CC 的高級模式下,額外的優化政策是:: K. _) j6 M* p" d* |
更激進的重命名,如 obj.property 改為 a.b,將深度過高的命名空間平坦化等;6 k, P2 E9 {( }
移除垃圾代碼,如刪除未被調用的方法定義,警告邏輯死角(return 後的語句等);. Z  ~! {% ^) i. u3 c( H
將函數內聯,如 a call b, b call c,a(),那麼直接執行 c()。/ V3 s' d; E) K9 D* r. n0 Y
  要達到高級模式的預期優化效果,開發者必須對自己做一些約束,因為 js 是弱類型、動態性的。否則6 d* E( r% i' \6 J( e
js 的這種靈活將使 compiler 無能為力。
- Z: a3 V- z* X+ q5 y  總體上,這種約束包括限定某些 js 編碼風格,以及使用相應的 JSDoc 註解。
! x  H% `8 _# z  以下詳述具體的約束以及代碼的檢查 / 優化效果:
2 |9 p$ {9 u6 \* `: }; d9 V1 L" \  強類型的模擬, d0 L" R# d* Q# r
@param 和 @type 中定義的類型會在編譯期間得到檢查,同樣避免了在運行時檢查,提高性能。$ D: A, z5 M1 r* z" [1 [& l' o
@const 標記常量,當常量被寫時會報錯。
, [3 |( A# t+ @% `模擬枚舉,將同類可枚舉常量定義為一個對像字面量,使用 @enum 標記:+ F8 ]9 s5 g. W% j
var STATUS = { LOADING: 3, COMPLETE: 4};
9 k# y2 j! U7 ?/ n編譯結果中 STATUS.LOADING 會被直接替換為 3,其實完全模擬了 C 等語言中的枚舉。5 h- I2 \% O2 i; J
使用 @constructor 標注函數為構造器,它僅能被實例化,而不可用作普通方法,甚至是工廠方法,CC 會確保構造器被合法使用,否則報錯。這樣確保開發者不必在運行時判斷,構造器函數到底以怎樣的形式被調用。3 `$ v4 C0 ?& ?6 n7 U: b, `
在表達式中也可以使用 @type 來限定類型,這對於 JSON 特別有用,如) ~* J$ y) Q' J9 E
var data = /** @type {UserModel} */({ firstName : 'foo', lastName : 'bar'});8 Z  B+ W: ^/ w3 Z
在這裡 UserModel 是個構造器,也可以使用 @typedef 來自定義複雜的數據類型。- u& S& ]1 |) @! t. l
  域可見性的模擬
! ]$ l# F" S0 z" f) S& y使用 @private 標注私有域,私有域被外部引用會報錯。開發者也可以按照「國際慣例」給私有域加上_ 前綴或後綴,以提醒自己 / 協作者這是一個私有域,@private 註解用來告訴 CC;這樣,開發者可以不必使用諸如老道的「模塊模式」等技巧來真正地隱藏私有變量,將檢查工作丟給CC,讓開發盡可能樸實簡單。! \8 c1 i6 ?! I# G- X7 G0 W
類似有 @protect+ Q) \5 F3 x+ x# p2 o; y
  類系統的模擬
2 W8 \8 D( w" Z( l0 f2 r6 d' v使用 @extends 標注繼承關係,繼承體系會被優化。$ s  |8 z# e% n5 R/ W
使用 @interface 標注接口,接口是類似 function ThisIsAInterface(obj) {}的函數體為空的構造器定義,編譯後將移除其相關代碼。同時,標注 @implements 的構造器必須實現implemented 的接口的所有方法(正如其他 OO 語言一樣),否則,CC 報錯。這同樣簡化了接口 / 實現的約束,靠 CC 來保證實現關係的可靠性。5 _, C: m) d5 m( g5 D' {) d+ Z% w# ?
  條件編譯的模擬/ O; A( C* D  y7 S: I$ X% P" Z
使用 @define 標記狀態開關,適用於調試 logger 等 開發 / 發佈 狀態需要分離的模式。
2 K; F& Z1 x; y& K, O& k可以在編譯時指定參數來標識 define 參數的狀態。這其實就是一個條件編譯,真給力……
5 }8 @& F( c& L! {  對像平坦化及屬性名縮減
/ A1 s# I! r4 y5 B0 D1 {. m對像屬性會被編譯為單變量,比如 foo.bar to foo$bar,這種標記方法看起來很像 java 中被編譯出來的內部類~~之後 foo$bar 被進一步縮短。對像之所以能被平坦化是因為在 js 中對象可以看做是一群引用 / 原始數據類型的容器。
' K- e) Q$ l1 |但是,js 對像實際上更複雜,所以被平坦化後會帶來一些副作用,比如如果在對像(字面量)中使用 this 指針,則編譯後的結果會導致 this 指向錯誤。所以 Google 建議僅在 constructor 和 prototype methods 中使用 this,這意味著,在所謂類單例(對像字面量)和類的靜態方法(綁定到constructor 上的函數)中都避免使用 this 指針。
  m* b: B* u4 f6 X  y9 u, ^在縮減對像屬性 / 方法的名稱長度時,有另外一個注意點,那就是必須始終使用 dot syntax(.運算符),而不使用 quoted string([] 運算符),除非索引名是一個變量。這是因為 CC 始終不處理字符串中的內容,所以,var o = { longName: 0 }; o["longName"] 會被翻譯為var a = { b: 0 }; a["longName"] 導致出錯。實在想使用 quoted string,則在定義的時候也要使用 quoted string。$ ?1 }$ T- z) t7 O0 ~1 d
對於全局變量,如果出現以 window.property 的形式引用的,必須始終定義為 window.porperty 形式:
! m% [# \9 Y) a6 ~, ?# B0 C! A. {& \) }window.property = 1;var property = 1; // wrong!) L" `* J- y3 i, y* S
否則也會杯具,CC 可不會 window.property 翻譯為 window.a。0 A7 K7 H' q3 C% L, h
  垃圾代碼的移除
+ O' q5 m- t/ w1 e" M3 t! ]" J一個函數聲明卻未被調用時,默認地,聲明體將被幹掉。
5 a9 d1 j# j% O8 C# a4 r( f7 u在這種機制下,如果一個方法是以 for in 的形式調用的,那麼原方法也會被幹掉,因為這種動態特徵使得 CC 無法清楚方法是否確實在 for in 的時候被調用了。
. J. d, ~; n+ D+ I6 _對於一些 unreachable 的代碼,CC 將報警告。- z- h! \7 D/ y, G! ?" r7 o
如果要產出一份被調用的公共接口,例如庫,使用稱作 export 的方法將函數導出,防止函數定義被3 |5 ^, s5 Z+ J" Z+ g' g
CC 回收。具體的做法是將函數綁定到某個容器,比如:5 A' }, f( ^. e7 ^9 L8 w
function displayNoteTitle(note) { alert(note['myTitle']);}// Store the function in a global property referenced by a string:window['displayNoteTitle'] = displayNoteTitle;% Q/ w0 W# {4 F
對於需要 export 的函數,均使用 quoted string 風格。$ G* K7 d2 s; w1 f
  背後的思考( O) b0 q* r$ K9 T. M
  根據以上高級模式優化的行為分析可知,CC 附加給開發者的約束主要有:! Y# I* V! X  u- y
強制以強類型的靜態語言風格編寫 js,將關注點從運行時的動態技巧轉移到組織代碼、編寫邏輯/ }  B7 x! A# j+ {9 o9 d2 r% ?
本身。而可能由弱類型系統和動態特徵產生的問題和風險則交給 CC,即通過開發者與 CC 達成一種
( Q2 S8 A+ u* M+ ?+ X編碼約定而規避掉。/ v- H8 |) v% @) K. p
嚴格要求區分面向開發者的代碼和面向機器的代碼。* }3 U- Y$ I* s+ g9 Y" O! f
雖然不像 C 等語言會編譯產生目標代碼,但是 CC 在一定程度上也生成了面向機器的 js,包括壓縮空白、縮減標識符、條件編譯和冗余代碼去除。這和第一點其實是一脈相承的,同樣要求開發者將關注點轉移到開發本身。
7 b4 C" Q1 f! O1 S) C+ \  _4 s7 e使用規範化的接口方式。* G& J6 h) a3 T3 J* v
這不僅包括要求開發者使用恰當的 annotation(extend, interface, …),同時也給整個 OO-JS 打下了一個框架,開發者必須使用同樣的模式進行 OO 編碼。另外,要求使用 export 技術統一導出公共接口更強化了這一點。總之,這一點進一步限定了開發者的編碼風格,但是帶來的好處是明顯的:可讀、可控、一致性。
" U+ u: A5 z/ g2 Q  曾經有讀過 Closure Library 源碼的童鞋評論道:3 M1 U0 [& h; [7 l, R$ N9 K
Google 根本不懂怎麼寫 javascript!代碼裡面各種冗余,並且充滿了 java 的味道!1 R- i% m1 y9 C7 }- Z9 d
  當時確實也有這種感覺,比如 Google 把 if(foo) 寫作 if(foo != undefined) 等等。7 B5 r' \3 j6 A& u8 }
  Javascript 固然充滿了豐富的動態特徵,而且很多特性非常優雅,能夠讓代碼簡潔精悍,或者構造出一些3 g" k1 t6 V; q* Y+ q- h0 ?: {6 ?
令人驚歎的技巧,但是也會產生一些副作用:
+ i0 g- a1 T- X* W- S首要的問題是可讀性,靜態的東西容易一目瞭然,動態的東西需要經過一番運算才能得出結論。) ~# V& R) M5 x! Z: Q9 Y8 \6 ~1 L
比如 js 中的極晚綁定,再比如標識符運行時重寫。
9 `" m" k6 c: N5 \其次的問題是執行性能。一個比較經典的眾 js 工程師都在使用的技巧就是「模擬函數重載」——
" Z# u. ]* H2 s7 @5 e在函數體內判斷 arguments 的特徵,從而對應給出不同的邏輯。由於缺乏強類型,js 本身不能具備
8 C! ~( V3 `  e  ?真正的重載,但是運行時的判斷在帶來靈活性的同時,必然會多出很多模擬重載的邏輯,降低性能。
  p7 \8 Z) Q/ f8 d5 f  在今年的 D2 大會上,Hedger 童鞋指出,大多數 js 開發者像是個 ninja(忍者),他們身懷絕技、神鬼莫測,單兵作戰還可以,但是一旦碰到 army(軍隊,比如 Google 團隊這樣的 )就是個悲劇。! C; {7 d" e. W7 u4 U& V; n- Z8 x
  我比較欣賞這個比喻,大團隊要良好地協作,必需遵循一定的規範和限制,優先保證可讀性和一致性,與此同時; C4 P) ~0 `- [6 h5 u0 H
失去的是奇技淫巧、自由靈活。所以採用何種編程風格、理念,需要具體問題具體分析…………# \- B& f/ L$ J* n( {$ C9 s
  至少,目前 CC 提供了一個好的思路,它的高級模式推崇的編程風格也是很值得嘗試、借鑒的。
$ t0 P+ n4 l7 e2 B3 T( u  最後附上 CC 的常用命令選項……選項實在是有夠多……/ I0 u2 M) `, K- p+ B3 S* j) `$ h
  CC 常用命令選項" s1 b9 {8 i- X) _8 s6 ~
–charset VAL 對所有文件定義的編碼格式$ y! D) v4 m0 Q$ h
–compilationlevel [WHITESPACEONLY | SIMPLEOPTIMIZATIONS | ADVANCEDOPTIMIZATIONS]
4 q" S6 D2 i; x$ C' z. Q) N+ w. a設定編譯級別
  T+ `, w$ u, ^" D6 D, ]0 ^$ u2 ^5 P6 H–debug 開啟 debug 選項8 q# a, Q+ ?. y& K
–define (–D, -D) VAL 設定文件中使用 @define 標注的開關值,即條件編譯
! a/ U, ^' d8 |+ o* g–externs VAL 編譯代碼需要調用未編譯的代碼時,使用它- x) x; |+ `! q7 C* u
–formatting [PRETTYPRINT | PRINTINPUT_DELIMITER] 格式化輸出
, s+ Z& ~8 v" O) H. l9 Q' N7 L–js VAL 輸入文件,多指定多個,將會被合併  J) z/ ^- q2 V; j* I
–jsoutputfile VAL 輸出文件,如果不指定的話,直接輸出到 standard output 流
3 C+ @) n3 {0 n; I" o) c0 H–module VAL 定義模塊- k7 G1 g- T# H4 L3 R' i7 Y! h9 F
–output_manifest VAL 打印編譯文件清單7 T- c: A! g  K+ e; ?
–print_tree 打印語法分析樹
8 M/ U7 c, H4 N–warning_level [QUIET | DEFAULT | VERBOSE] 設定報錯模式
發表於 2011-7-10 14:17:30 | 顯示全部樓層
這個是做什麼用的
回復 给力 爆菊

使用道具 舉報

發表於 2011-7-11 23:23:30 | 顯示全部樓層
這個基本上 不懂!
回復 给力 爆菊

使用道具 舉報

發表於 2011-7-12 14:36:33 | 顯示全部樓層
貌似這個東西太深奧......
回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

过期高净值品牌域名预定抢注

點基跨境 數位編輯創業論壇

GMT+8, 2025-5-12 23:42

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表