2 K6 x# p5 M; k
Google Correlate是Google Labs裡的一個新的實驗室項目,它可以幫你找到真實世界裡流行趨勢的搜索序列,有兩種呈現方式:按時間和按區域(暫時只支持美國地區)。比如咱們搜索「mittens」(手套),你就可以看到每年這個詞彙的搜索熱度(上圖藍色),每年都在冬季的時候火一下,然後迅速降溫。同時Google會列出10個(或更多)跟手套相關的搜索關鍵字,比如「knit hats」(針織帽),你可以對比針織帽(上圖紅色)和手套在各個時間段上搜索熱度的比較。由於搜索的趨勢(曲線)很類似,所以Google覺得針織帽和手套是同一類東西,這麼判斷確實很有道理。
* Q: k* W. z6 E0 L, p當然這也不是絕對的,比如搜索「losing weight」(減肥),可以看到人類真的是越來越胖了,對減肥的需求逐年增加(下圖藍色)。但這個趨勢居然跟「outside wedding」(室外婚禮)近似(下圖紅色),你就不能說減肥跟室外婚禮是同一類東西吧(也許室外舉辦婚禮是為了減肥?):
& q' e" r9 I- j( G% Y/ E% w 0 b u0 Q* d4 n0 A) U
更厲害的是,你可以自己畫一個趨勢圖,然後讓Google給你匹配出最符合的關鍵字。比如我畫這麼一個曲線,想看看啥玩意突然在08年火了,之後又突然銷聲匿跡了:9 v0 A$ D- q% T# ?: U# q; ~3 |
% {* M3 C6 P/ @. v- K) k* r; Z
結果匹配出來的結果裡,原來挪雞鴨6120突然在08年火了,然後很快又死翹翹了:
6 a* R, m" C7 ^" c" { 除了時間匹配可以判斷出二者可能是同一類事務,地區匹配也是一個因素。還拿「mittens」(手套)來說,可以看到美國哪些地區對手套的搜索量最高,同時右邊則是針織帽的搜索量,二者在時間和地區上都很匹配,那基本可以證明它們是一類貨了:
/ N( ?1 h. M, Z& Q' N , u2 r0 ^) C; {! \
Google Correlate是個挺有意思的研究工具,尤其是允許自己畫趨勢曲線圖,大家不妨去試試看。
, e( D8 E( S7 s2 i9 J0 ^9 c |