过期域名预定抢注

 找回密碼
 免费注册

跨境電商的大數據時代

  [複製鏈接]
發表於 2014-9-9 15:09:55 | 顯示全部樓層 |閱讀模式
文章原名是《揭秘大數據玩家eBay:猜出你的購買慾》,內容主要是涉及eBay對於數據的應用方向。4 x+ p5 ?+ e# P% w
其實,如何尋找各平台數據、如何把數據用在自己的店舖成長上,感覺一直是相關跨境電商培訓的必有部分。
: e+ G, f' n) h5 _+ k+ M3 t畢竟,尋找一顆鑽石進行打磨,與隨手找到一顆石頭打磨,即使一樣用心,結果還是天差地別的。" L+ }  r; R; u* i4 S
很多平台都有類似數據公佈,希望這篇文章能提高大家對數據的認識,讓自己先人一步找到藍海。+ E/ d% i+ L" E! {- @

, W: C4 C( K, a) F1 U# ~" d4 D    在網絡世界,數據就是金錢。作為全球最大的拍賣網站,eBay對這一點深有體會。眼下,eBay對各種在線數據的分析無所不至,就像在每個顧客前面安裝了攝像頭一般。毫無疑問,eBay擁有的數據量是驚人的。其每天都要處理100PB的數據,其中包括50TB的機器數據。可以說,eBay每天都面臨著天文數字般的大數據挑戰。% D8 }" L$ ~' J& m+ O% B
' i: G" i1 p$ U( h8 r  S7 Z5 B
111.jpg   g# `6 \1 y9 w4 s+ Q0 N

* F, }5 B/ Z5 y% z) M    早在2006年,eBay就成立了大數據分析平台。為了準確分析用戶的購物行為,eBay定義了成百上千種類型的數據,並以此對顧客的行為進行跟蹤分析。然而,這同時也為eBay帶來了新的挑戰。要知道,公司的數據量多到難以想像,沒有人能分析消化這麼多的數據,也沒有人能基於所有數據建立起模型。事實上,eBay真正應用到的,只是其收集的數據中的一小部分。「剩餘的數據,eBay或是將其丟棄,或是將其存儲起來。因為說不定哪天,科技實現了突破,這些數據就會變得有用。」eBay大中華區CEO林奕彰指出。% ^$ y: v' f( ^
    那麼目前,eBay是如何利用這些數據,來促進業務創新和利潤增長的呢?# B) [3 c) ]* t7 P1 \2 S8 d' i2 }

: F& p* h  @3 @2 Y# _為用戶「畫像」0 ?: h; P2 T3 p% F

$ n% T: k  V* H6 u$ P" Q% H1 T3 b    eBay擁有近2億的用戶,網站的商品清單項目則有3萬多類。在平台的日常交易中,eBay幾乎每秒都要處理數千美元。而這些交易數據,其實只是eBay全站數據信息總量的「冰山一角」。
# x+ l  g2 |3 v* m- F, g# T
; u( c/ Y! N* @6 |* r! o# I    基於大數據分析,eBay每天要回答的問題有很多,比如,「昨天最熱門的搜索商品是什麼?」而即便是這樣的簡單問題,都需要涉及處理五十億的頁面瀏覽量。從這個角度看,任何一個基本的業務問題,對公司來說都是一個相當巨大的問題。
" t# @7 K( r, c- C& R' o
, y- B% `+ y% L0 j2 B- r: S    就eBay如何利用大數據來增加在線交易,林奕彰舉了一個典型的例子。譬如,一位年輕的女性早上10點在星巴克瀏覽eBay網站,eBay應該推送給她什麼樣的商品呢?
* B# Y; F- a! L5 T' H
- o1 i, N% E. S    「就這幾個信息點,我們其實已經做了不少研究。」林奕彰說,「事實上,用戶早晨10點、中午12點,或是晚上7點,她瀏覽的商品是不同的;在餐廳或是在家裡,同樣會對瀏覽和搜索產生影響;此外,還有用戶的年齡、當時的天氣等等,都會對購物產生影響。eBay要做的,就是學習不同情景下的不同購物模式,並推送給用戶最想要的商品。」
3 g0 s" ]: V- F- ~+ ?, t3 n% R( x7 _
    據悉,eBay可以從用戶以往的瀏覽記錄裡「猜」她想要什麼樣的商品,也可以從設定的成百上千種情景模型中計算出用戶可能的需求;或是對照另一位有著相似特點的女性用戶,看她當時買過什麼樣的商品,從而推斷出這位用戶潛在的需求。在綜合各種考量因素後,eBay的後台需要在短短幾秒內將商品頁面推送給用戶。這意味著,eBay的系統需要有非常快的運算速度。' w+ C: g- i. f* [; P% i

4 p& C# ^* C* c5 U# E    這種運算模型,有相當一部分人為的因素。比如,機器可以搜集用戶的上萬個數據,但eBay的工程師可以定義其中的100個數據為有效數據,而模型則建立在這些有效數據之上。此外,當計算機自動「學習」分析各種數據形成的趨勢時,eBay需要將機器學習的邏輯設定在與商品交易相關的行為上。$ v% n9 L. b4 l  c( |% {- K, M, q

: d6 i) n( @. q% n    除了通過大數據為用戶「畫像」而向其推送有針對性的商品,eBay此前還嘗試利用大數據進行搜索引擎的優化。
% z/ a* A3 N2 |/ o$ g1 n
/ c0 W9 E* A5 c% c( F- ~8 H5 I    具體說來,eBay可以把握用戶的行為模式,使搜索引擎更加「直覺化」。如果時間倒退幾年,用戶在使用eBay的搜索引擎時,會發現它只能理解字面的意思,並按照字面意思尋找。很多時候,搜索引擎並不能理解用戶的真實意圖。但現在,eBay正試著改變或重寫用戶的搜索請求,增加同義詞或替換語句,從而給出更相關性的內容,並由此增加在線交易量。而這背後,統統離不開大數據的支持。
/ r2 C' \+ {" u$ Y& R$ ?; w& X) C# A. u7 }
為商家提供「情報」5 g9 x0 o( l! p' M6 Q

# p4 w% ~/ S* G7 `    基於用戶購物的數據,eBay同樣會給商家提供各式各樣的「情報」。比如,eBay會告訴製造商用戶正在網上搜索什麼商品,或是各種出口行業的數據,製造商會立刻對此做出反應。$ V# o$ G  A/ N; O* I9 j: d' u

* o3 u' D9 o% U- `$ f  K) Y    很多時候,eBay會根據自身或其他電商網站的交易情況,向商家建議其應該銷售的品類。「這也是eBay大中華區正在做的工作,」林奕彰稱,「比如,一個中國的商家希望將產品賣到澳洲,我們通過數據分析可以告訴他,他一個約可以賣出多少產品,定價應該在什麼範圍內,市面上還有多少商家在賣同樣的產品,他的市場佔有率大概是多少。」
7 e8 ?- q! D9 A: b& F; w* E; I/ [+ s7 O7 f/ L' J. y: o9 s) H
    在此基礎上,eBay還試圖算出商家的補貨頻率。事實上,海外倉儲是商家非常頭痛的問題,一旦計算失誤,便可能造成庫存積壓或缺貨。而在eBay,一旦用戶下單後發現商家缺貨,將是非常嚴重的問題。這種情況下,eBay可以通過過往的數據分析,得出商家第一批貨的大概銷量,以及按照過去銷貨的速度什麼時候應該補貨,物流的時間又是多久。通過這些數據的計算,eBay可以測算出商家補貨的邏輯。
& }* ^* y+ v7 h. u" I# @6 C
3 Q0 R, m% b* @    這些數據分析,對於商家開拓新的銷售品類非常管用。因為通常情況下,商家需要四五個月,才能摸清楚一種貨物的淡旺季銷量,及其在各個地區的受歡迎程度。7 f  m& j3 ~- l, S3 i
" d( t/ E' i  v( t; k* I
    當然,eBay所做的只是為商家提供各種潛在的商機,至於賣家是否願意投入生產,或能否找到合適的供應商進貨,仍需要他們自己去完成。很多時候,eBay推薦商家銷售200個新品類,而最終商家只能找到50種新產品的供應商。4 Z$ k# o$ v/ o; }3 v
% V$ z7 B& r/ H9 ^9 |
    除此之外,憑借平台上產生的各種信息,eBay還可以扮演「品管(品質管理)」的角色。舉例來說,一個賣家要在eBay上賣1000個產品,當它賣到50個產品的時候,有5個產品出了問題;賣到200個產品的時候,有20個產品出了問題;賣到400個產品的時候,有40個產品出現質量問題,以此類推。而eBay要做的,就是在其早期出現問題的時候,就及時提醒賣家。
; k( O0 r* v8 y( I# @/ `& ~, w4 ~: r3 O2 i- G) m2 O4 O. T+ E
    進一步說,當賣家賣掉10個、20個產品的時候,eBay就要根據退貨率、買家評論等把可能的問題檢測出來。與此同時,eBay會提醒賣家,讓其監督供應商改進品質,或選擇將商品下架,或是修改物品的描述。
, T: s, }& K: A! c  r* n
. n3 z6 \2 s9 Z6 @7 @    在理想狀態下,這種品管系統會形成一個大數據的循環,並幫助賣家減少退貨,銷售更多的商品。假如賣家在收到這樣的通知後依舊我行我素,eBay就會認為這樣的賣家並不重視品管,到了一定階段,eBay會對其實施交易「配額」,限制其交易量。
( G' V; O. i6 L# ?* q1 Y' ^" K0 _0 f; A$ y) b- J% x
    「品管的難點在於,我需要通過數據模型在賣家交易量很少的時候就發現問題。這種早期預測涉及複雜的運算。」林奕彰表示,「一旦交易量大了,賣家自己也會統計退貨率,之前的損失也就無可挽回。」
. ~0 O2 L7 e  b3 B' c3 K
8 A. X3 a% g( k, P7 r& V: w試錯與挑戰
' L/ E* I* T% R1 X& v- a
( s2 g6 W% ]; d2 q4 U: k6 S5 [    和其他在線交易平台一樣,eBay對假貨亦十分敏感。眼下,公司試圖通過大數據技術,讓系統「智能」地識別出假貨。& r6 _. y& ~& s9 A

, a0 C* M) J& v$ {2 u    實際上,「網絡打假」工作並不容易。要知道,假貨常常以各種形態出現在網絡上,且屢禁不止。以Rolex為例,假貨商家可能在單詞中增加一個空格,也可能將其中兩個字母互換位置,甚至名稱裡根本不出現Rolex,只是圖片展示出Rolex手錶的樣子。eBay上有如此多的品牌,自然有形形色色的假貨充斥其中。這種情況下,單是靠在商品名稱或描述裡抓關鍵詞,根本抓不住假貨。
+ `% `8 C* j/ j& A3 x6 t! L" l4 N: B& T( z: w: a  T
    而eBay眼下做的,就是通過數據分析建立起一種模型或規則,假如商家的交易符合這種規則或特徵,便有可能是在賣假貨。" i7 V4 U5 K- E7 Z

! e, b! K0 f( {$ b) r) _# {    打個比方,當一個賣家的商品賣的很便宜,賣得很快,但後面的抱怨和退貨很多,系統就會把這個「可疑」的模式識別出來,然後再由工作人員去判斷,這個賣家是否在賣假貨。換言之,「即便數據的量再大,賣假貨的人都有相對固定的模式。」林奕彰稱。而通過這種方式,eBay有效地鑒別出不少假貨商家。0 X6 W4 r& f3 w! i& z

: w& Z+ V% c  D" g9 x- E    不過,林奕彰並不諱言,這種大數據分析方法亦有其弊端。「就假貨問題來說,這種方式只能在事後將問題查出來,而無法事先預測。」他表示,「這不是那麼容易解決的問題,因為無論用什麼樣的模型去套,假貨交易總是能先騙你一陣子。」
: j3 }  q! U# D2 b/ |. B7 c/ `/ X5 x, p, z8 I) S$ ^9 C
    除了分析的滯後性,eBay的大數據挑戰還體現在龐大的數據處理上。儘管企業數據倉庫為查詢提供了巨大性能,但它仍無法滿足eBay存儲和靈活處理的需要。要知道,這些系統的造價相當昂貴,當eBay每天增加50TB的數據時,其成本是相當高昂的。
' ^4 w9 W3 f9 E' Z% g  ]* x0 v( @  e- z1 j9 a
    在此基礎上,eBay收集的相當一部分數據,在目前看來是無用的數據。畢竟,數據採集得越多,變量越多,而由此帶來的「數據噪音」也越多,模型越失真。從這個角度看,eBay要做的是記錄那些有意義的數據,並銷毀那些不需要的信息。問題在於,eBay要分析的85%的問題都是新的或未知的,「eBay並不知道哪些信息未來或許會有用,」林奕彰坦言,「那些現在看起來無效的數據,明後年可能就會隨著科技進步被消化,我們現在只能先把這些數據儲存起來。」0 J1 h1 T4 o  O3 r; C
( k$ C  x0 A0 c8 d/ H
    但另一廂,假如將所有信息都儲存起來,那麼eBay每個月都會新增數以億計的數據信息。在如此浩瀚的數據海洋中,分析工作根本無從下手。因此對eBay來說,這是一個必須平衡的難題。
: s- @! [+ k% V! j2 b# C/ h. ~( J
9 x! `5 ^0 n& y' e    需要指出的是,eBay當下的分析模型也還不夠完美。無論是「猜」用戶,還是分析商家在eBay上的生意,eBay猜錯的情況非常非常多。對於這一點,林奕彰舉了信用卡的例子。在他看來,「銀行其實是運用大數據最厲害的,但無論風控模型怎麼完美,全球依然有2%左右的信用卡賠率。」況且,eBay用的並不是成熟機構認證過的模型,很多時候要靠自己去猜,那麼誤差也就不足為奇。
5 u3 k: _) i9 M——文章轉自「21世紀經濟報道」,作者文亮。/ K, A/ P) q/ S& T
' I6 P# P% r% v, j4 i- P! w/ T
最後提一句,雖然數據很重要,但如果您不是天秤座,也不要把過多的精力放在這上邊,畢竟,想完了並去做了,才知道結果對不對,願大家好運。
5 Y: R: C8 k, J1 @
5 G$ g$ y1 T8 t& L: O
回復

使用道具 舉報

發表於 2014-9-9 16:36:54 | 顯示全部樓層
呵呵 樓主這文章算廣告算啥?# k  `4 D  e' x- q# f# e8 A
9 z" V% q! t9 A3 M$ ]
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2014-9-9 16:49:32 | 顯示全部樓層
minlab 發表於 2014-9-9 16:36 & m# f3 P( ^. C
呵呵 樓主這文章算廣告算啥?
, x  G" z$ }' z2 A% {
驚,不要嚇我
/ {6 e' A' k- ?( N  Y' H5 v4 y這個真的是」21世紀經濟報道「原文轉載加上我一點點自我看法啊,連我的公司名字和服務都沒提啊。% Z+ |4 @9 K1 ?7 b& z/ }
+ w; ]' t7 V# x* h& J2 X4 J7 ^% V) i
$ o$ W& X4 o) w1 [% t. f
* m! `* P$ u7 A3 Q' [( l
回復 给力 爆菊

使用道具 舉報

發表於 2014-9-10 19:19:43 | 顯示全部樓層
馬雲成首富了,和我們沒有半毛錢關係
3 A. V3 {& s( T4 y- g; W
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2014-9-11 09:23:45 | 顯示全部樓層
fullmoonboy 發表於 2014-9-10 19:19
6 |% t) A+ p0 u# \9 A$ f馬雲成首富了,和我們沒有半毛錢關係

$ V8 j4 I. M6 ?- @& ?4 q不過,他創造的購物模式,幾乎完全改變了我們的生活。0 T1 }8 C5 B" H% v
! z9 M* x+ I+ n  a, D+ x  a
回復 给力 爆菊

使用道具 舉報

發表於 2014-9-13 21:29:39 | 顯示全部樓層
不錯的文章,起碼學到了些知識。
+ y+ M9 @1 t  q: c4 o
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2014-9-13 21:40:58 | 顯示全部樓層
getpower 發表於 2014-9-13 21:29
( E% n# }2 }" @: N0 L1 s不錯的文章,起碼學到了些知識。
7 P4 N$ t, p- N0 G! z: o3 P8 l
您這麼說我心裡就安心點了,多謝支持^^
, Q% q  F- K# c4 u  i- F  X! J$ p- ]* w; T$ z2 q/ S5 ]
回復 给力 爆菊

使用道具 舉報

發表於 2014-9-14 14:30:26 | 顯示全部樓層
數據不一定值錢,分析才是值錢,,,,
1 |' Q5 y8 m  ?) H) u* A) H
回復 给力 爆菊

使用道具 舉報

發表於 2014-9-14 14:47:19 | 顯示全部樓層
淘寶開始走下坡路了!* w$ l/ `* ~9 B2 w1 V; }( s
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2014-9-15 09:45:12 | 顯示全部樓層
1988chg 發表於 2014-9-14 14:30 ) p2 M5 A( m. q1 ?( M# i, U/ F2 `# y
數據不一定值錢,分析才是值錢,,,,

* t; r- |- O9 K6 D. b分析不好找啊,發現網上很多分析都只是結果,不太敢放上來,萬一假的就誤導大家了。
) C6 ~7 H" m- A# s+ s5 i9 T
: _# [/ R* k+ y
回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

點基跨境 數位編輯創業論壇

GMT+8, 2025-5-11 09:07

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表