EP15: 靠數據科學走南闖北的十年:企管系 ➡️ 英國碩士轉分析 ➡️ 上海Ebay ➡️ 台版Home Depot
「用聽的」
追蹤訂閱,不錯過數據女孩最新資訊
YouTube, Spotify, 小宇宙, Apple Podcast, B站, 小紅書, Threads, Instagram
「用讀的」
Amy: 大家好,歡迎大家收聽新一期的「數據女孩的中年危機」。我是Amy.
Stella: 大家好,我是Stella.
Amy: 感謝朋友們的喜歡跟支持,也歡迎新朋友們來聽我們聊天。大家在網上直接搜「數據女孩的中年危機」就可以找到我們了。在YouTube.各大Podcast平台,Spotify、Bilibili、小紅書、小宇宙都可以直接關注我們。
Amy: 今天邀請的嘉賓又是我們的聽友。很開心,越來越多聽友開始加入我們的活動,直接肉身參加節目的製作。
Amy: 今天來的嘉賓是Vincent,你要不要跟大家打個招呼。
Vincent: 嗨,大家好,我叫做Vincent,我來自臺灣。
Vincent: 我會把自己定位成是一位在過去十年之間吧,依靠著對數據的熱情,跑遍大江南北的一個數據科學家或者數據分析師也行。
Amy: Vincent 其實待過蠻多地方的喔。他在臺灣受教育,後來也有去過英國。也去上海做過數據分析在臺灣也有一定的經驗。今天可以跟大家多聊聊。他多采多姿的求學跟求職生涯可以。
Vincent: 啊, 沒問題,今天很開心能夠被邀請進來分享。
Amy: 那Vincent,你可以在節目開始之前跟大家介紹一下。你大概待過什麼樣的產業?你是做數據分析的嗎?
Vincent: 我是帶一個數據的團隊。這個數據團隊其實包含數據分析跟做數據科學,頻道上我們比較常稱DS,其中還有包含另外一些 data engineering 的一些同事。我這個團隊其實是在一家臺灣的 local 的零售行業裡面服務,那這零售呢,本身有線下的數據也有線上的數據。這個團隊其實就是在能夠去從這些數據裡面當中除了分析之外,還去做一些數據的產品啊等等,設法能夠去提供這樣子的一個business value。所以當時的這個團隊是這樣子的一個情況。
Stella: Vincent大學讀的是什麼專業啊?
Vincent: 我大學是念的企業管理。我這一路上走來的路程我覺得其實也蠻有意思的。可能跟很多DS的background會不太一樣。我自己認為我自己稍微有點跨領域了吧。
Vincent: 我原先是你可以想象,比較偏向是一個商學院的學生。後來慢慢的發現到對數據方面的熱情之後,才有點半路出家似的在走進這條路。所以我以前大學念的是企業管理。我的第一個Master就拿的是MBA學位。後來在臺灣工作了幾年之後我就發現,好像自己的熱情怎麼感覺好像在數據這個地方被更多的點燃。所以當時就給自己一個機會說好吧,那,不然就花個一年的時間再到國外給自己充電一下。
Vincent: 所以後來就跑到了英國念了一年的Business Analytics的Master.那只不過說,在求學的過程當中其實花蠻多心力在研究ML machine learning的這個領域裡頭。從英國離開之後才開始後續了職業的下半段。
Stella: 當時,為什麼會選擇去英國留學呢?
Vincent: 其實當時的想法也比較直觀,因為我自己感覺啦,當時我其實已經工作大概三四年的時間,而且那時候心態上覺得說,我已經有第一個Master了,那我還需要第二個Master嗎? Or should I just go for PhD?會有這樣子的一個糾結,但是後來覺得在英國可能速度快一點。
Vincent: 因為我覺得一來英國的學校generally,可能相對於美國的大數據的program可能相對會比較容易一些,它本身課程的時間也比較短,但是就給自己一年的時間,自己好好的上課跟自學,所以當時就比較快的選擇英國。
Stella: 當時有考慮留在英國工作嗎?還是去之前就想好,我是去哪一個學校,然後再回亞洲?
Vincent: 當時去之前其實並沒有想好,然後去的時候呢,邊求學的時候邊想,因為我覺得其實大家對找工作都挺焦慮的,而且像我這種已經有了一點工作經驗才去英國的同學,我覺得至少在我當時讀的學校裡頭,周圍我這樣的人大概只有10%,大部分的人還是蠻多是應屆畢業,我講華人學生哦,應屆畢業。
Vincent: 那就感覺到受大家各種找工作的心情有一些影響這樣子,那後來我最後決定沒有留在英國是因為判斷當時英國的機會,一來可能我們這些當地的外國學生找工作也比較困難,當時英國脫歐的經濟背景,再來如果要追求數據的話,可能還有一些更不錯的國家可以去選擇嘗試,後來就決定不留在英國了。
Stella: 而且如果是一年的program的話等於是你剛進入這個program,就要開始找。
Vincent: 對。其實當時很多人是這樣,但我那時候心態上就不太確定。我念完之後回臺灣嗎?還是我要留在英國還是我要再去其他第三個地方? 剛去還沒感覺,但大家都開始拼命在找。那時候心裡就覺得有點焦慮,但後來覺得還是隨順因緣吧,就沒有跟大家一起陷入那樣的集體焦慮當中。
Stella: 但Vincent,讀這個Business Analytics的Master之前。有寫過代碼嗎?有coding的經驗嗎?
Vincent: 有。我剛提到在臺灣先工作三年前後的這個時間,我在這個工作的中間我就有寫代碼的經驗,但其實更多的還不是公司的要求,更多還是自己覺得有趣。
Vincent: 這個可從剛出社會的background說起,我其實真的剛出社會的時候,我是傳統的這種Market Research的公司,這個行業在地球上已經比較久了,這些方法其實都是幾十年下沉澱下來,比如說量化,用問卷的方式做數據分析,或者說用這種座談會的方式做比較qualitative消費者的這種心態的話。當時大概14, 15年的時候臺灣這邊開始有一點在講大數據這件事情。我覺得可能是美國這邊先火吧,然後這個信息就到臺灣來,就自己有覺得這個東西跟研究蠻像的,挺有意思的,然後就自己鑽研進去看看到底這是什麼樣子有趣的東西。然後就發現哦,原來要自己處理很多的data set.看起來,excel是不夠給力的,好像需要編點程這樣子。
Vincent: 然後那時候想想哎,我自己也沒真正這個編程的經驗那怎麼開始呢?就看看,當時這個R最火。所以呢我就想說那,不然這樣吧, R最火,那python好像在數據分析上面當時還沒有這麼多的套件。
Vincent: 我就先從R開始。那你不知道怎麼辦,怎麼開始。我就發現網上有很多這種免費的tutorial教你從什麼寫第一行R代碼啊到簡單的處理一些for loop啊等等。那就這樣,慢慢的就接觸了,就入行了。
Stella: 你剛才說excel不能處理太大量的數據。我想到之前我有遇到一件比較好笑的事。
Stella: 我之前呢有一份工作,marketing的head.他也是MBA.他是Harvard MBA畢業。
Stella: 我不知道臺灣的MBA是不是啊,但是美國的MBA真的就是用excel,用的會特別的多。他也是有很多數據要處理。
Stella: 他有一天就來跟我們,這些在data team的人,來說我今天處理了half million的data.
Stella: 我們想說half million records.我們想說那你是用什麼處理?他說excel.我們當時驚呆說你的電腦不會死機嗎,因為他比較高級別,配了一個特別好的電腦。但是我們當時就很無語覺得說為什麼你不來跟我們聊聊?
Vincent: 但我覺得在後面的工作當中我是感覺到Excel還是有它蠻突出的地方。
Stella: 對。
Vincent: 對 Disclaimer.
Stella: 我並不是說Excel不好,我只是正好想到了這一件比較有趣的小事。
Vincent: 對但是如果說今天很簡單的一個SQL joining或者R裡面的merge,一個簡單的功能就不用在VLOOKUP那邊弄很多的工。
Amy: 所以你的啟蒙語言是R,跟我一樣欸。
Vincent: 好巧喔。
Amy: 學統計的基本上。
Stella: 大家都是。
Amy: 我真的還蠻懷念可以寫R的日子。現在很少有機會可以寫到R,因為大部分的codebase.你去argue寫R的話其實還蠻難get buy in。你要多support一個語言,很難,而且也不是大部分的人都真的很喜歡這個語言。
Amy: 其實Vincent在碩士的時候還做了一個R package,而且放到CRAN上面,我覺得這個還蠻厲害的。
Amy: 你要不要跟大家介紹一下你的package?加兩個download也好。
Vincent: 對,我的這個R package的名稱叫ebmc (https://cran.r-project.org/web/packages/ebmc/index.html).這個跟我剛剛提到我在英國拿我第二個 Business Analytics的碩士有關。因為剛剛提到說我當時花蠻多的時間精力在鑽研Machine Learning領域。我想要做的論文題目是我之前在工作當中,我發現到蠻常出現的問題,二元分類器的類別不平衡的問題。
Vincent: 比如說你今天要去偵測哪一些交易當中是欺詐交易,那這個天然你從行業的角度來理解它就不可能很平衡嘛。一平衡的話,這個銀行早就倒了。
Vincent: 所以我就發現這個問題其實挺有意思的。那我的ebmc其實就是想要來把前人做過的一些算法自己的研究去比較一下這些算法哪些更好的performance那我當時挑了一些算法它都是跟集成方法有關,比如說bagging, boosting,這一系列方法。
Vincent: 結果,就發現我在R上面就找不到相關的這個package.那時候因為在英國念書一段時間我發現自己的R功底稍微有一些累積。就想說自己寫寫看,最後就把自己的論文給做完。那做完了之後,覺得秉持飲水思源,開源社群理念,就乾脆畢業前把它包一包,包成一個package上傳到CRAN,也蠻順利的就publish了。所以很開心的就畢業去。這樣子。然後這個包就一直放在上面。
Vincent: 偶爾還是會有一些人發郵件來說你這包裡為什麼要這樣弄啊?這個function什麼意思啊?你這裡面這個代碼,這行寫為什麼要除n分之一啊,等等的。
Stella: 所以你現在還在support嗎?
Vincent: 對 但是現在不確定是不是新用戶越來越少了。就最近收到的訊息越來越少了,我覺得可能跟R的這個漸漸式微好像有點關係吧。
Amy: 對,我還蠻想念R的這個部分,因為R使用者其實都跟你的Journey一樣,就是他可能在念碩士博士的時候發現他突然非常愛了一個小的statistical method或者算法,然後就沒有人implement過,他就寫一個包, 編一個R的CRAN的package這樣,然後在尋找這個算法的人就可以找到一個很niche的method,就可以直接用。在Python Community我就比較不能感覺到,因為Python Community都是一個一個大包,然後你要去comply to the bigger package的那些requirements,要怎麼把他加到這個大的包。
Amy: 你覺得這種小小的可能一個package裡面就一兩個小功能,可以幫你達成一個數學分析的小功能,覺得還蠻有趣。可是現在這個 R 已經越來越弱勢了嘛,這種事情就發生的越來越少。
Stella: 這會不會和 R 和 Python 的應用的場景也不太一樣。比如說,如果是 MLE 或是 Data Scientist, 選 Python 的話,有要進 Production 的需求。
Stella: 我們在用 package 的時候。其實經常去看 package 在 PyPi 上面。它的下載是多少。它上一次更新是什麼時間。如果說有一個 package 它的最後更新的時間是三年前,很有可能就不太敢用。
Amy: 哦,還好,我覺得還好。而且我覺得 R 要進 Production 很大的程度是需要整個團隊的支持,就是你整個團隊覺得說我們就是要用 R 解決這個問題。然後 Docker 啊,各方面,這個 package management 都做到大家一起合力做到一定的程度去維護的話,才能夠起來。一般最慘的就是那種一整個 team 都用 Python,只有一個人寫R,那他要進 production.大家就說「好啊,你弄啊,你 end to end 啊」他就很 lonely 然後也沒有 support, 最後就會 give in。對啊,那我覺得 R,至少在我幾年前的經歷啦,大家看那個 package support 沒有那麼 active,其實不太會卻步欸,比較會是說我直接去看他寫這個 function也可以。我對 R 的愛是蠻深的啦,可是已經是前男友的角色了。
Stella: 是你愛過的前男友。
Amy: 對,我以前辦過很多 R 的社群啊,很喜歡聊說你喜歡用tidyverse還是不tidyverse啊,這種奇怪的debate以前就常常會加入,覺得很好玩。但現在,因為新工作的nature,我就是那個全組只有我用R那還是算了吧的那種人。
Stella: 其實我的感受和你很不一樣欸。我不知道是不是因為時間不太一樣其實在我剛開始用Python的時候,我感覺是很多package是R有,Python沒有,尤其是涉及machine learning.
Stella: 所以很多時候我其實是更想 stay with Python,但有時候不得不去再去看一下R的一些package,它的implementation.
Vincent: 我比較尷尬。我覺得現在R對我來說是不知道該不該分手的現任女友。
Amy: 那我來問你一下看法,你覺得 R 是不是真的沒有用了?而且現在新的人已經漸漸不問這個問題了。
Amy: 前兩年還有會問說,我還要不要學 R 啊?那現在連這個問題都很少被問到了。你覺得 R 是不是沒有用了?
Vincent: 我覺得 Python 作為一個 general purpose 的 language它可能還是因為這個特質,後來居上吧。我覺得 R 現在看起來比較像是單純為了 statistical 分析而生的,但是真的要跟其他的 language glue 在一起的時候,Python在這方面表現還是比較好。
Vincent: 所以當這個工作本身,一個人假設要cover更多面向的時候,就很難說好像一個人他只寫R,跟其他的面向還能很好地匹配在一起。所以我自己的建議啦,如果說現在真的開始入行而且在糾結要學R的,我會比較建議這邊入手,而且現在的Python跟我當初入行的時候,10年前,相比東西已經差很多了。所以其實現在我覺得絕大多數你會要的東西大概Python多一點。不過我感覺好像是不是在學術圈裡面,用R的這個機會還比較多,因為我之前在維護這個package的時候,很多發信給我的人其實都是學校的老師或研究人員。
Stella: 我覺得R的package它可能要考慮 production需求的這方面的要求會少一些,可能也是相輔相成,因為這樣所以學術界用的更多。或者因為這樣所以很多的比較新的方法,他會先在R做出來,之後,如果被大規模的應用了,才會進Python的community.
Stella: 實話講我在剛開始工作的時候我也有過這種Python versus R的debate.我是非常堅決的就放棄了R,然後直接開始用Python.
Stella: 所以二位分手吧!已經分手了,就不要再去留念前男友了。
Amy: 我以前就是當然認識很多R很passionate的人。現在偶爾還是會email我說欸,你怎麼不寫R啊,你怎麼回事啊?
Stella: 挽留。
Amy: 對的。
Stella: Vincent在Business Analytics的Master畢業之後,是回到了臺灣嗎?還是去到哪裡工作?
Vincent: 我當時其實就直接到了上海,因為回到那個時間點就是有臺灣跟上海比較。我會選回到亞洲,也是因為可能離家人會近,家人是比較主要的考量。當時選擇上海可能是我在上海看到的機會、待遇這些方面都會比相同工作的臺灣的工作來得更加適合。所以我當時就還是先到這個自己比較不熟悉的地方歷練一下。所以就選了上海。
Stella: 我還挺好奇的,作為一個臺灣的同學。在英國讀書要找上海的工作。這個流程和大家一樣的過程嗎?還是會有什麼其他不一樣?
Vincent:有蠻多面試是遠程開始的沒錯。但我自己有個堅持就是我真的要入職一家公司之前我一定要進這家公司看看,所以我其實當時在eBay這邊interview,我是專程從臺灣飛到上海 interview完了之後,我再飛回臺灣。
Vincent: 我覺得這還是一個比較重要的,一個career decision要過未來好幾年的一個發展比較慎重一點。
Amy: 因為我還蠻好奇的就是像臺灣找過就用104阿1111這種平台,像這種去上海的機會,要去哪裡自己去找。
Vincent: 當時也是上網找,臺灣可能就是104主要的一個。那像中國大陸就有比如說像猎聘這種不同的網站。它其實定位的有點不太一樣。我當時用的是猎聘,把簡歷放在猎聘之後,結果就蠻積極的,有幾個獵頭就找上來。
Vincent: 其中就有說這個eBay這邊有機會你要不要來試試看這樣。我知道現在大家都在找data的工作,尤其是剛入行的同學都非常的struggle,但我覺得當時我還蠻幸運的。那個時候你只要簡歷看上去,好像基本上你有些經歷,都不會太差,有好幾個機會來找你。
Stella: 嗯,方便問一下那是哪一年嗎?
Vincent: 那是2017,18,那時候。17,18年。對,那時候我感覺數據分析的工作,尤其在中國大陸,真的是非常的好找工作。大概很多,我覺得大概有點資歷的人,然後學經歷也比較突出,大概手上有個四五個offer的,跟現在確實蠻不一樣。
Stella: 那你當時去上海親自去eBay的office看,去面試,是有一些什麼特別的點讓你覺得說,哎,這家公司是ok的,我是願意來上班的?
Vincent: 我覺得還是看那個chemistry,工作本身當然是做事啦,但是我覺得工作本身還是跟人的相處。
Vincent: 那你了解說,你大概要做哪些事情,然後跟那邊的人真正有些交流,更多的人去對話。看看那邊人的走路急不急啊,辦公室有沒有偶爾有一些笑聲啊,等等的。都是一些很好觀察的,一些indicator。
Amy: 辦公室有沒有笑聲這個indicator可以加到我清單。
Vincent: 這是我以前MBA上課某個老師。他分享的一個觀點。他說你要看這家公司的tempo怎麼樣?你就看那個公司裡面的人走路的速度。
Stella: 所以是快好呢?還是慢不好?還是說要找一個自己喜歡的速度。
Vincent: 我覺得後者,找自己速度。有的人可能天生他是需要比較多的時間才能沉澱好,那他找一個每個人都是急驚瘋,就肯定不適合的。但是如果說你是動作非常快的話,那反之亦然。我覺得我算快的,但是可能跟那種最快的又沒辦法相比。所以我覺得eBay就是一個對我來說還蠻不錯的一個fit.當時我蠻幸運的。
Stella: 你剛去上海的時候有需要花很多時間去適應這個新的環境嗎?
Vincent: 其實沒有花特別多時間,但確實要適應一下。我覺得那個時候讓我覺得比較有意思是整個移動互聯網,因為在臺灣跟在英國其實我們對移動互聯網的應用,不能用今天的日子來看,要回到當時,光是支付就不一樣。比如說臺灣跟英國都還是非常習慣用現金支付。在英國可能更多是信用卡這種路線,但是在大陸可能就是支付寶呀,微信,那種環境然後很多的服務都已經完全是通過線上化。所以那個過程當中從一個比較線下的一個經驗,生活習慣過渡到一個比較線上的,我覺得那個時候那個反而花的時間比較多一點。
Stella: 那你在上海的時候,你的交際範圍除了工作的同事以外還有別的途徑認識的朋友嗎?
Vincent: 我覺得我可能比較兩點一線,就是工作。我必須說這不是eBay的問題了。這可能是我個人當時的一個選擇,我覺得當時去eBay之後,我自己有個想法,感覺eBay其實內部的這些數據的基礎建設跟有的數據量體是我以前從來沒有,也是我在那時候英國念書,我很想要找到的。所以那一段時間的工作,我倒比較像是健身。怎麼講,我難得找到一個很不錯的環境。我想要在這個環境比較更多的充實然後看看這些比較上規模的公司,他們一般對於這些問題都怎麼解決怎麼操作。
Vincent: 所以那時候變得我的朋友的這些交集。我反而其他的這種比較玩樂性質的交際會少了一點,那更多的朋友都反而是在辦公室。但我可能算個案了,我不算通案。
Stella: 坦白講我是覺得很多人都會有這麼一個階段。就是你的很多的樂趣都是來自於工作。
Amy: 有這個階段真的很幸福啊,工作很好玩,能講這句話,很幸福。
Stella: 嗯,那Vincent,你在上海的工作,如果拿來和你在臺灣工作的這個經歷對比的話,你覺得有什麼差別?剛才說到,可能待遇有差別,除此以外呢?
Vincent: 我覺得在臺灣,如果只是單純就我之前在臺灣的工作跟在大陸的話,因為行業也不太一樣,沒辦法直接拿工作跟工作這樣點對點的想。
Vincent: 如果真的說有不太一樣的,臺灣可能因為線下的行業比較發達,然後人的生活的便利性也比較高,所以對於線上的一些接受度或者理解的程度,我覺得天然好像不像在中國大陸感受得這麼深。
Vincent: 所以我覺得這個是在思維上面的,如果今天你想把互聯網的一些方法推進到一個比較實用的環境裡頭,你會發現到你會需要跟很多人去說明的方法有什麼好處,可以帶來一些改變跟加強,我覺得這個地方的說服會要比較多,我覺得這可能只是我個人從我工作的點對點的比較,可能很多其他臺灣比較互聯網的行業就不會有這麼深的感覺。
Stella: 我們在說起中國大陸的互聯網公司的時候,也經常會說到996,就是這個工作時長特別長的問題,你當時有體驗到嗎?
Vincent: 我覺得eBay是一個比較人性化的環境。
Vincent: 我覺得以平均工時來說吧,上海來說肯定會比臺灣來的要長。臺灣現在我觀察大部分人的工時相對的已經沒有這麼長。
Vincent: 我覺得就先拿這個下班的車流量,我們用數據分析的方法來推論,下班車流量的高峰其實是在6點,7點之後,你就會發現車流量明顯的減少。
Vincent: 我覺得用這個交通的這個數據,我們來做一個粗略的比較,可能可以看得出來上海的工時比較長,但個案的話就不一樣。
Vincent: 我在eBay的時候有一位team member,他當時跟我提到說,他其實在某一家local的企業,也是為互聯網企業,就是996的比較辛苦吧,所以後來就比較萌生是不是可以找一個相對時間上可以比較穩定點的工作,所以後來我們才有緣分在一起工作。
Vincent: 他跟我說他最extreme的時候,曾經大概連續一個月吧。大概都是早上的10點到晚上的12點,連續大概一個月的,人就會有一種比較被掏空的感覺。
Stella: 我並不驚訝,我在上海工作過兩年,我其實也有類似的工作時長,甚至比他還要長。
Stella: 然後大概也持續了一個月,到後來的時候,已經人就麻木,沒有感覺了,然後還會默默地流淚。但也不是哭啊,就是生理性的流淚,就真的是覺得扛不住。
Amy: 像eBay.它的工時比較沒有那麼長是因為上海的外商他的這方面會比較好一點?
Vincent: 我覺得外商整體來說都會比較好一些,但具體來說還是要看一下對接的業務,像在eBay的時候不同的 team,他們還是會有不同工作的,但每個人struggle當然也不一樣有的,可能是跟著他服務的這個business partner.
Vincent: 我這樣說明好了,就是我們做analytics的嘛。那當時在eBay的這個環境呢他其實是一個類似像center of excellence的一個單位,就是他等於把analytics這樣的function完全在一個office裡頭。
Vincent: 那我們這個office裡就會需要面向不同的國家的business unit.那你的日子基本上很大程度是跟當地這個business unit他們本身運營的tempo,速度決定,因為Analytics在這個角色可能被更多定位是在support方。
Vincent: 像我們也有一些比如說要跟美國這邊對接,那從上海對接到美國的話,那它時差上面就會變得挑戰,那這個可能就不單純是長工時的問題,而是時間上要比較有彈性。
Amy: 我們已經聊了一下下eBay了,但是,因為我們有些聽眾應該蠻年輕的,eBay是一家老牌科技公司哦,我查了一下它1995年成立的,已經是30年前了。然後他survive了Dotcom bubble,所以也算是蠻屹立不搖的一個公司。Vincent可不可以給大家介紹一下eBay的業務,以免有些聽眾已經不太熟悉。
Vincent: 唉,需要介紹這個。就覺得有點傷心了,哈哈哈哈。
Amy: 不過可能跟你們的user base也有關係。一般在上面的賣家可能年紀也比較大才有一些二手的東西可以分享。
Vincent: 對,eBay其實是一個老牌的互聯網電商平臺。這個電商有不同的營運的這個業態。
Vincent: eBay的純粹是做這種買家跟賣家的這種撮合就是你今天有東西想賣,他是最早是從跳蚤市場起家。那就變成說你今天有一些不要的東西可以拿到eBay上面賣。
Vincent: 那看看有沒有人想要,要的話你們就在上面會成交就可以把這個交易做了。可是時到今日呢,eBay這個公司他慢慢的成長,其實絕大部分都已經不是跳蚤市場。
Vincent: 畢竟一個這麼大規模的企業,他不可能只靠跳蚤市場。所以他後來其實都已經大概90%以上的都是偏向B2C的這樣子的這個業務的銷售。那eBay現在在全球至少就我之前的理解吧, eBay大概每一年在eBay上面會買東西的人還有一點二億,eBay的這個業務看起來他可能沒有一個非常尖鋒的成長,疫情時代除外啦,但是現在看起來嘛還是相對穩定的一個狀態,維持他的業務。
Vincent: 那它的網站界面可能相應的,看起來也會比較復古,但是我覺得這非常有意思啊,就是我以前耳聞啊,這個我沒有親身經歷,就有點道聽途說,曾經eBay有想要改過網頁的UI,但是改過網頁UI當然就變得可能,用現代審美來說,更加的漂亮啊,更加modern一點點,但是發現就開始客服會接到一大堆電話說,哎,我那個當時那個按鈕在哪裡,我那個按鈕我找不到,我這單結不了之類的,然後GMV呢在ABTest裡面就瘋狂的掉,就沒辦法,只好rollback到舊版,所以呢,改變用戶的這個行為可能確實是很困難吧。
Vincent: 我在後續的經驗當中也有體會到類似的。我覺得改變人的行為還是。。。
Amy: 我其實也是在 eBay 上面有當賣家。你們之前做 UI 改版的時候,我有感覺到!我已經算 tech savvy 了。我有時候有一個按鍵找不到,我也覺得很煩。雖然之前有點醜,不過現在改了,我找不到,好像我更 annoyed.那 Vincent 進去 eBay 前對這家公司的印象是什麼,因為我在臺灣沒有什麼接觸到 eBay,你進去以前知道 eBay 嗎?
Vincent: 我進去前知道。知道可能更多是從他當時在臺灣營運的時候,就是他自己拿eBay的招牌營運的時候。大概知道說啊,這個可以把不要的舊東西賣掉,可能是進去前是一個比較偏向跳蚤市場的一個想象。那進去才發現說啊,早就不是當年那回事了,這是比較大的一個落差。
Amy: 那在上海的Analytic這個中心它主要是負責什麼市場?因為我不太了解eBay在亞太國家業務。
Vincent: eBay在亞太地區呢,它主要的幾個市場有說像是大中華,比如說像澳大利亞,韓國。
Vincent: 不過韓國在2010年的時候也賣掉了,但我當時的時候還有一些其他的,比如說像當時叫ICB,ICB講的是International Cross Border Trade,就是在很多的跨境貿易裡頭,因為國家那麼多,就不是完全只有主要國家,還有一些比較零碎的這種用戶,他們會被歸類到這樣的區,雖然他是定位在亞太,但是還是會有跟一些團隊是跟這些業務,據我自己的理解吧,就是當時為什麼會需要在上海去設立這樣子一個單位,因為有兩個比較主要的。第一個是工作時差。雖然eBay的整個母公司是在美國,但是Analytics其實需要大量的跟前線要有很及時性的互動。所以,如果今天有美國的Analyst直接去support各個亞太區地方,那時差的問題會讓溝通的效率變差,所以需要一個新的單位相對讓大家overlap的時間比較長。但這是其中一個。
Vincent: 另外一個我覺得可能還是跟人力成本比較相關吧,因為我相信在美國要僱用一位DS跟這個BA,企業嘛都將本求利,如果我們都把自己看作是經濟學裡面的生產要素的話,他當然會盡可能選擇便宜的生產要素來盡可能的擴大他的利潤。所以這個,我估計應該也是一個重要的考慮。
Amy: 那剛才可能有提到一點點了,不過也可以給大家介紹一下像eBay這樣核心的metric是什麼?
Vincent: 如果說真的要講到比較核心的metric,通常都會是GMV跟active buyer的人數. GMV其實它的全名,叫做gross merchandise volume。為什麼不直接講這個平臺的收入就好,是因為跟平臺的運營的模式有關。舉個例子比如說Amy跟Stella今天在eBay上,Amy想要賣一個杯子,然後Stella就想買這個杯子,如果定價500塊錢,你們兩個交易成功,那這個平臺的GMV就計入500塊。
Vincent: 這個GMV呢,實際上不完全是eBay的收入,因為eBay是在這個500塊的基礎抽過路費。那我們假設eBay要抽取這個10%的過路費來說好了,那這個500塊的交易呢就會被抽取100塊的這樣一個金額,那實際上賣家到手的金額只有400塊錢,大概是這樣子。
Vincent: 那這個是GMV的概念,所以呢通常用來衡量電商的這種平臺,尤其是這種屬於媒合型電商平台,通常都是用這個GMV去衡量它整體規模的size,然後再去乘上剛剛講的10%,這一般我們叫做take rate。那由這個GMV再乘上這個take rate就會成為這家平臺公司的收入。
Vincent: 剛剛我還提到還有另外一個指標叫做active buyer.那active buyer是有多少的buyer在過去的一年當中在這個平台買過東西,來看東西不算,要真的下過單,至少下一單買過東西才算。這樣的話就比較好衡量說這個平臺是現在對全球人口來說有多大的一個penetration,影響力,大致上是這樣。
Stella: 對而且一般就是要同時看gmv和active users的數量的話。還有一個可能是從buyers或者是merchants的distribution上來講,因為如果有的平臺它就被幾個大的business去dominant的話,這個會在它的gmv上你可能看不出來太大的差別,但是在它的active users上會有很大差別。
Amy: 就是一方面看量,一方面看這個平臺的活躍度。
Vincent: 對,可以這麼理解。
Stella: 我挺好奇的就是Vincent你在eBay的這個期間,你們大中華區會經常討論,比如說,我們eBay在大中華區的主要competitor是誰嗎?
Vincent: 還是會有,這個跟eBay後來的整個公司的策略重心調整有關,因為大中華區其實eBay並不做買家生意,它是做的是賣家生意。
Vincent: 大家熟知的嘛,就是當年eBay在local,在中國大陸並沒有競爭過淘寶這樣local的電商平台,所以它就變成說,那我沒辦法直接面向中國大陸的消費者。所以那反過來,它是個全球體系,所以那還不如他就把大中華去當成一個供應鏈,他在這邊找貨,然後把這些貨呢,從大中華去賣到全世界去。
Stella: 那從這個角度來看的話,eBay和AliExpress或者是Amazon這些平臺,它的競爭優勢在哪裡?它的competitive edge是在哪裡?
Vincent: 我個人的感覺是跟招商的優勢比較相關,因為如果今天你是從供應鏈的角度在經營這個電商網,那你怎麼樣找到比較好的廠商,用戶願意賣,而在海峽的對岸,用戶願意買的這個廠商就變得至關重要。招商會是這樣的平台模式很重要的function。
Stella: 雖然我的年齡看起來應該是eBay target的用戶啊,但是我其實很少用eBay。eBay上中國的Manufacturer把產品賣到美國的這種模式它和前一段時間特別流行的Dropshipping的這種模式相差大嗎?比如說,它要把貨賣到美國來,它的Inventory是在哪裡?是在中國呢 還是在它要賣的這個地區會有warehouse?
Vincent: 兩種模式其實都會並存。這個好處會是這樣,如果今天這個中國的賣家的貨已經在當地的上,那這個一般就是onshore的一個,如果是今天他還在中國這一側的是offshore,那這個東西會跟物流速度一樣。你一旦接到訂單之後你中國這邊出貨一定會要比較久,那如果在當地的話會比較快。所以通常一般,如果你宣稱你的listing今天我的貨已經在你的當地,通常在搜尋引擎我在推薦的會比較高的會有這樣的,那就對於賣家來說,那他就要去考慮我現在把貨擺到當地,我就會有比較好的一個露出機會,但是我擺到當地我就需要有足夠的貨量,成本加上去。那我no pay, no gain,我要不要gain,就會陷入這個階段。
Stella: cost和delivery eta帶來的conversion的這種tradeoff.每個商家自己去衡量。
Amy: 我個人用的感覺,非常微觀,可是我對於因為eBay的delivery ETA的tolerance比較高,因為我心裡覺得說欸,這個可能是一個二手賣家或者是可能我就一定要在這邊才能找到這個二手商品。所以我就覺得那寄慢一點,沒有關係。可是如果是AliExpress啊, 淘寶,就會覺得哇,怎麼寄那麼慢?這個不是一個電商平臺嗎?這個是我心裡的感覺。
Stella: 在eBay,中國對美國的這種e commerce來講是B2C比較多,還是B2B比較多?
Vincent: 我的理解應該是B2C比較多。其實eBay現在上面的業務,相信B2C應該還是主要。像一般這種當年早年的跳蚤市場一般稱C2C,現在這個比例應該是蠻少蠻少的。
Amy: 我知道Vincent在那邊有稍微做一下韓國的業務。那個時候剛好遇到疫情,有什麼有趣的故事可以分享?
Vincent: 對,當時遇到疫情真的是剛剛好,我transfer到韓國team這個地方,疫情就來了。那韓國在當時2020年,那時候是疫情剛起來。韓國也是最早在國內爆發疫情的國家之一。所以馬上國內的消費,整個lockdown。eBay因為它是一個比較大的平臺。這邊補充一下,eBay在韓國它的business其實並不完全是用eBay這個品牌,它其實是用Gmarket跟Auction,主要是這兩個品牌,因為當初其實eBay是靠著並購的方式進去到韓國,所以他並沒有去更換品牌。
Vincent: Gmarket跟Auction這兩個網站,跟eBay的本質很像,就是 eBay是一個幾乎什麼都賣的平臺,那有些商品會因為疫情的關系賣的很好,口罩,這種衛生用品等等,那有一些呢,因此就沒辦法再賣,比如說旅遊產品,比如說像那時候當時的國際航線都飛不動,所以更不用講說出去玩,所以這種東西就會受到影響。但是對平臺來說,它的淨影響,就是它一定有些東西會賣的特別好,有些東西會賣的特別不好。那平臺到底是受惠還是受害?這個東西就需要Analytics來幫忙回答。我花了那時候蠻多的時間在做這個project找到之後發現說,欸,其實好像平臺好像還是小小的受益,扣除掉那些負面影響的話。這個project的影響對我蠻深刻的。
Amy: 後來eBay好像就把韓國的業務賣掉。我是看wikipedia,它說2021年的時候 eBay把它韓國業務賣給Emart.你有什麼insight可以分享嗎?
Vincent: 哇,這個是C level的question耶,我盡可能在我的level回答。我相信一個公司要賣,一定是要牽涉很多很多因素的交織吧,對不對?但我覺得可能吧,就我的解讀跟eBay的整個這個輕資產的策略有關。因為你會發現其實eBay在大多數它運營的一些國家裡頭,它其實並不太傾向去建很多大量的物流系統、倉庫系統等等,它更多可能就算需要也是跟第三方合作。它就可能不太想要把手伸得那麼深在某一個特定的國家裡。那在韓國當時,電商已經是coupang非常的強,然後還有其他的強敵環伺,所以它的利潤率可能相對比較不好,有可能是這個原因,或許是覺得在這個國家市場,如果不真正去投入比較重的資產,可能比較難以獲利的情況底下,公司可能就堅持他的策略,把這個地方的事業體賣掉。
Vincent: 所以我覺得這個可能會是一個比較大的考量。那買的人呢,或許他本身有一些local的business,就像這個故事的結尾是Emart,但中間聽說還有傳聞好幾家啦,相信一定是各種大家想要買想要談,最後是Emart得手,那Emart肯定他自己已經有在當地運營的基礎建設。
Stella: Vincent,你剛才提到一個也算是在e commerce裡面大家經常debate的一個問題就是 asset light或者是 asset heavy或者是operations heavy的這兩種模式,那在eBay內部這個是一個還有在討論的問題嗎?或者說大家就已經非常的堅定的認定說eBay就是要走一個asset light的模型。
Vincent: 我相信在不同的國家可能還是有不同的debate,因為當時其實我的理解,在eBay真正賣掉韓國之前,他在韓國當地是有建倉儲跟物流體系。
Stella: 所以還是有試圖想做一下。
Vincent: 對,我覺得應該是還是有試圖想要去挑戰一下,但是我想輕資產這個東西還是在他大多數的國家採取的策略,或者說他覺得這個國家未來市場發展比較好,他才會願意再花更多前去耕耘這個市場。比如說,像我的理解,在德國吧,不然他的東西都是五天七天到貨,結果他的competitor都是一天到貨,那這個遊戲就不用玩了。
Stella: 因為你也是需要一定的scale,你的 operations heavy或者是asset heavy的模式才有可能營利,所以也是要看你在那個地區的量。
Amy: 我會想問這個問題是因為這個好像是過去十年來,很多美國公司的Pattern.他可能想要全球擴張,選一個市場,然後就想要用自己的名字在那個地方複製在本來地方的成功模式。但是在一些特定的區域,例如印度啊,中國啊,韓國我覺得可能也算,就是這種localization要做得比較深根,asset heavy,operation可能會比較重要的地方,他就做不過local的公司。
Vincent: 或者做不贏amazon。
Amy: 其實你看,過去10年很多公司,有點像是eBay把韓國業務賣掉的這個劇本。就他本來想要做做看,但是最後可能就還是先放棄好了。
Amy: 好了,對那eBay.還有另外一個比較有趣的公司。 這兩個公司的關係很有意思,就是PayPal跟eBay.
Amy: 2002年的時候,eBay把PayPal買了,然後2014年的時候又把PayPal分開獨立營運這其中隔了12年。
Amy: 然後作為一個Payment的一個公司,你可能想說 既然兩個算是同一家公司了,應該eBay所有的交易都要用PayPal.但是2018年的時候,eBay又決定不用PayPal為唯一的Payment Processor,然後還加了那個Adyen.
Amy: 想問一下為什麼有這些奇怪的故事?因為從外人來看的話,買一家Payment Company,然後你做一個平臺,這個是完美的結合,但是為什麼有這麼多分分合合?
Vincent: 好 你。這又是另外一個C Level的Question.你們真的非常看得起我 謝謝你們,哈哈哈哈哈哈。
Amy: 就是想聽聽你的猜測。
Vincent: OK,我的理解是這樣子哦,其實還是說了那個道理吧,天下合久必分,分久必合吧,就是總有一些那個因子在驅動著這些改變。那我就先回到你剛剛一開始提到就說eBay當年為什麼買PayPal?
Vincent: 因為回到當初那個eBay剛剛acquisition那時候,eBay相對已經有一個比較不錯的成長的勢頭了,但是PayPal相對還是一個比較剛開始的新創那這個初創企業,他當時就,我的理解PayPal已經在eBay上頭大概在那個,acquisition發生的那個時間點,他有大概三分之二左右的業務量其實是來自於eBay.
Vincent: 那如果這個PayPal,他有這麼多的業務,其實只搭在一個single的這個client裡頭的時候其實對他的業務來說是稍微有一些些的危險的,那當時呢其實eBay也想要自己去做自己的支付業,就我的理解,那個時候應該是eBay在跟Wells Fargo銀行在談另外一個支付業務叫做Billpoint.
Amy: 沒聽過。
Vincent: 你想想看喔,如果說你今天是PayPal的這個經營者,然後你發現你的業務三分之二來自於eBay。但是eBay現在看起來好像想跟另外一家銀行談也是支付業務然後搞不好,要把你挖掉一大塊肉。其實你是會有點怕。所以可能或許吧當時就有一些這些心理吧等等。那maybe當時對PayPal來說它cash out是一個比較好的一個選擇。
Vincent: 就把它賣給eBay。所以後來那個Billpoint就沒有真正的在eBay上面上線。那個project就應該是後面就沒有了那這是當初他們兩個合的時候這個底層邏輯吧。
Vincent: 直到後來大概是14 15年的時候就是你剛剛提到的是把那個paypal再次分家出去。我覺得這個部分,這次的分家呢更多的也是因為行業的發展,因為paypal本身自己成長的,如果今天 eBay一直把paypal當成是自己的一個獨家的支付體系的話 paypal可能自己他就沒辦法去承接其他電商方的業務。
Vincent: 舉個比較蠻好理解的例子。比如說今天比如paypal跟這個阿里巴巴談成了一個業務合作,可是呢,因為paypal現在是被eBay own的,那eBay不會希望阿里巴巴能夠成長的比較快。
Vincent: 所以呢,那肯定這個paypal跟這個阿里巴巴在他是被eBay持有的情況是很難發生的。
Vincent: 所以,如果這個兄弟們以前還比較小的時候在大海裡面各自遊泳,誰也不會踢到誰,那到了某一個狀況大家都長得有點大了稍微會互相撞到的時候。這時候就要談的比較細節就是那大家怎麼樣可以達到彼此利潤的最大化。
Amy: 哦,我覺得還蠻有意思。我自己只是看看Wiki.我沒有想這麼多,不過我覺得還蠻有道理的。對啊,感謝你,可能你可以參加C Level的面試了。
Vincent: 哈哈哈哈,謝謝你吉言,不過你剛剛有一個問題我還沒來得及回答。
Vincent: 你剛剛提到說 eBay後來還再找了一個支付的服務公司進來,Adyen進來做後續的這些支付的業務。這是有的而且這個後面剛剛好,我自己在工作的內容當中也有參與到一小段。
Vincent: 但是其實就是本身PayPal這塊業務,支付本身就是一個還不錯的一個現金產生器。所以呢,如果今天PayPal這塊從eBay自己的,這個Org裡頭空缺出來,其實如果他自己做的話當初PayPal賺的那塊錢,其實就變成ebay給自己賺,可是在輕資產的這樣的一個方向底下,要完全從頭到尾自己build一個service能夠提供這樣的金流服務,可能這個effort也太大。所以呢,他可能就找了一個外部廠商 which is Adyen那可能還有一些其他的這些廠商去共同促成這件大事發生。所以還是最後我覺得還是在算那個經濟帳,就是怎麼樣做可能是利潤最大化,然後大家花的effort最小。
Stella: 你在eBay的這個期間,因為你會接觸到各種各樣的內部的data嗎?PayPal是作為一個什麼樣的存在?在你們的data當中,它是屬於一個deeply integrated的一個partner呢?還是它其實已經完全是一個third party vendor的角色了?
Vincent: 在內部還沒有真正完全拆分乾淨的時候,因為你剛剛提到,我們說14 15年它拆分,拆分只是在外面宣布說它拆分嘛,實際上大家底下東西都還長在一起啊,data base都還共用。所以,在那個當下其實PayPal它會產生的數據就是支付數據,那支付數據其實跟電商上面交易數據是有一些綜效的,特別是在一些比較反欺詐的場景上,這些PayPal的支付數據跟這些eBay的賬戶之間的關聯其實是可以被更深一層的發現到一些一些關系這樣子。但是之後兩家公司真正完全要拆分的時候,你一定是一開始說宣布說,哦,那我們到org上先拆分然後開始慢慢的我們在哪一個層次網站上或者是在什麼地方在拆分,然後最後是到真正系統層面,比如說data base,data就完全互相不能訪問了這種拆分。所以它其實是一個很長的一個走了好幾年的一個過程。
Stella: 所以就是直到你離開 eBay,之前這個系統以及data的 separation還沒有完成?
Vincent: 在我離開那會兒差不多完成了。
Stella: 哦ok。
Vincent: 對但在更深的地方還有其他,就是像剛剛說的,有一些不知道的team在做不知道的事情,他們那邊是不是還沒拆完不知道。
Stella: 還有偷偷的在用PayPal的data.是嗎?
Vincent: 哈哈哈哈,哦,這個應該不會。這個我必須要給eBay一個很大的稱讚,我們內部的這個信息管理的,這個安全性還是非常要求,像PayPal,這樣的數據其實如果像數據分析師一般在公司內部都會有比較大的訪問權限吧,那在這個方面,eBay的數據分析師我覺得他對個人的考核,他需要去involve你的老闆跟幾級以上的主管讓你有這個權限。其實這個管理是非常嚴謹的。
Stella: Vincent在離開eBay之後是就回到臺灣了,是嗎?
Vincent: 對我在離開eBay之後我就回到臺灣,對那比較大的考慮還是這個家人因素吧,因為想說自己這些年在海外也有蠻多時間,比較沒時間陪陪爸爸媽媽他們年紀也慢慢大了。所以我覺得這個可能好像隨著這個職涯進展,人的這個年歲漸長,大部分的人都會碰到這個問題。你要更加的去追尋工作上的理想,還是需要回頭處理一下這個世間的人際關係,哈哈哈哈哈哈。
Stella: 所以當時回到臺灣就是打算在臺灣找工作了?
Vincent: 對,當時其實一開始回來的時候,我還是那時候有點想去念PhD.
Vincent: 那後來呢,這個我後來到了另外一家公司在臺灣叫特力集團,那也是一些因緣際會,是當時在之前還沒去英國,之前在臺灣工作的時候,認識到的朋友經過他的介紹然後才到這個這個特力集團工作。所以本來也是有一點點在這個變化當中找方向。
Stella: OK,可能我們很多聽眾朋友不太了解特力集團。能跟我們介紹一下這是一個什麼樣的公司嗎?
Vincent: 特力集團其實歷史蠻悠久了。它算是臺灣當年可能這個進出口貿易在發展那個時候所創業的公司。所以至今應該都快要對不起實際歲數我有點忘了,但是四五十年跑不掉了。
Vincent: 嗯,那特力集團其實我面向的部分比較是它的零售業務的部分。那現在的特力呢,零售比較偏向是臺灣自己,整個臺灣自己內部的這個市場環境,那其實裡面兩個比較大的一個事業體,一個叫做特力屋,那另外一個叫做HOLA.
Vincent: 那特力屋呢,他一開始其實是跟英國的我先這樣介紹好了就是特力集團。他在零售方面是比較偏向家具行業。
Vincent: 所以特力屋呢,你可以把它想像成是全臺灣最大的五金賣場。
Amy: 我覺得他就是臺灣的home depot啦。
Vincent: 欸,對對對,用美國比喻就是home depot。其實也是,因為最早的時候特力屋是跟B&Q的一個joint venture,應該是英國的home depot吧,應該可以這麼講 B&Q 。對那後來是B&Q決定撤離臺灣市場之後就剩下特力屋自己用這個品牌。
Vincent: 但整體來說他們賣的東西跟home depot的就非常相似。另外HOLA的話它是賣比較家居的其他的商品,比如說像是沙發啦,桌子啦,這種比較它已經是成件的家具。
Vincent: 所以整體上都是這兩個通路看起來賣的東西稍微不太一樣,但是他們基本上都是瞄準居家的需求。大體上是這樣。
Stella: 所以這個和eBay相比較的話,雖然都是賣東西,但是從一個完全的線上的平臺轉到了線下的店面為主的公司,有感覺到很不一樣嗎?
Vincent: 我覺得挺不一樣的,不過我覺得先這樣子描述它。它其實並不是完全沒有線上,只是說在這樣子一個線下起家的這樣子的企業裡頭,它的線上自然佔比不會特別高,但是它有網站跟APP等等的,這些e commerce其實也都有。
Vincent: 那在線下裡頭,如果我們今天從這個數據分析的角度切入吧,我覺得線下business比較大的這個挑戰就是它數據的取得比較困難,取得成本比較高。
Vincent: 我舉個例子,比如說像在eBay做分析的時候其實因為人的互動都在網上,所以只要你的數據有埋點,基本上你都能夠抓到這個人在官網站上的路徑按了什麼,最後他的整個交易,他在你網站上的整體的行為是可以完整的刻畫。
Vincent: 但是在實體的場域上面對於收集這樣的數據就比較困難。我舉個例子,比如說像我們最多可能只能夠去知道說今天現在這個賣場有多少人在這個賣場裡頭可是今天這個某一位用戶或者顧客他看過哪一個商品最後他決定沒有買這件事情其實通過線下,純線下的數據是看不見的。
Vincent: 所以以前在電商上我覺得有一些推薦的邏輯很好使,就比如說這個人看看不買。基本上你再推薦他,這個成功的概率都會高很多,但是這件事情在線下的這個看看,你就不知道是誰。這就會非常難落地。
Stella: 因為我之前主要的經歷是集中在e commerce,就是線上的這種你剛才提到的一個數據。你說在線下的店面裡面今天來了多少人,這個數據容易取得嗎?其實我還挺難想象的。我會覺得這種數據對於線下來講也比較難。
Vincent: 線下的人數可能沒辦法追到個體,但是如果要去估計一個總體的數字,還是有方法的。那有一些的不同的技術線去實現這件事情。你可以看到,有的時候一些那個店的門口他會裝一些這個像柵欄這樣的東西。他其實裡面有紅外線的裝置,其實他可以知道是有多少人進去,然後多少人出來。他就可以去區分了一算出來說裡面有多少人現在在賣場裡頭那像我們當時用的技術再更不一樣一些是我們是通過聽WiFi的方式。
Vincent: 我們自己用像Raspberry Pi這樣子的這種技術路線。我們就做了一個這樣子可以去偵測WiFi的一個裝置那這個裝置呢他就可以放在這個這個場域上頭,那在這個場域上的WiFi能夠detect到的範圍裡頭有多少裝置,就用這個裝置數據推估他有的這些人數。因為絕大多數的人可能還是一個人帶一個裝置,你說一個人帶個十支手機出門,這種絕對是corner case嘛,outlier了,就不考慮了。那這也是一種技術路線去實現的。
Stella: 很有趣,線下也很多有趣的東西。
Vincent: 對。
Stella: 那Vincent在特力屋主要做的內容是什麼呢?
Vincent: 我在做的內容。主要是跟數據分析,還有機器學型模型的開發,然後還有一小部分的data engineering為主。那數據?
Stella: 有特定針對的產品嗎?
Vincent: 我們所針對的產品主要就是偏向零售上面的客戶的分析,會比較多一些。那線上的話,我想可以做的東西會比較廣一些,比如說像我們還做過這些跟網站上的推薦系統有關,曾經也內部想嘗試開發這個搜索引擎。
Stella: 嗯,就是特力屋或者特力集團的線上的這一些平臺的推薦系統。
Vincent: 比如說像這個特力屋。它有自己的網站,那HOLA自己有自己的網站。但是這兩個,這兩個網站上面它服務的客戶群體不太一樣。
Vincent: 所以變得說你就算要訓練一只模型。這個模型的目的都一樣是要推薦商品,那其實你要喂給它的數據去訓練的模型還是稍微有些不同。我覺得這也是我在特力工作一個比較大的一個學習點就是,如果你單純只做算法的時候,這個算法你要真正能夠放到網站上去還是有點挑戰的。你還是有很多系統的前端後端的東西要配合才叫一個系統嘛,它不能只有算法。一直一個人只有那個心臟。這樣子不叫做一個人,還是要有手有腳的。所以當時我們的團隊其實就是在做這種系統面,包含推薦這個算法的內核的開發。
Stella: 對於特力屋這種公司,來講它的線上系統和線下的門店的 volume.這個流量的比例大概是什麼樣的?方便分享一下嗎?
Vincent: 大概我在臺灣零售行業觀察到的,其實臺灣零售行業,如果它是線下起家,然後它開始經營線上業務的話,理論上做到30%就非常了不起了。對這是一個比較難達到的一個數字。那絕大多數的公司應該會落在大概10%上下。這是目前我對臺灣這方面一個觀察。
Stella: 嗯,那剛才Vincent,你也提到,說這個線上系統和線下門店,它服務的對象可能是不太一樣,或者這個對於線上線下的用戶的這個畫像是會有所不同的,那這個不同主要是體現在哪?是年齡的不同嗎?比如說,就是年輕人會更願意用線上的平臺一些?
Vincent: 內行。你這個一下就問到年齡。確實,年齡是一個蠻重要的區別的變量,但是這個年齡並沒有像大家想象的這麼極端差距啦,說好像會走線上的全部都是年輕人,然後相對於可能年長者比較習慣線下,其實也沒有這麼絕對,但是你可以看到,你畫出histogram其實你會看到分布是不一樣的。那一個比較明顯線上會比較明顯的往年輕人這個群體靠過去,這個部分是有的。
Vincent: 我覺得這談到另外一個概念就是,我們自己曾經花很多時間在思考這件事情,是online merge offline 這件事情,因為,如果從一家公司的角度來說,我今天我的線上客戶樣貌是這樣,線下客戶樣貌是這樣,我在經營的這個角度上面,就把它變成是separate的話,其實它沒辦法幫助你的客戶看成是一個群體,一個整體。
Vincent: 那換一個角度說,如果我今天要服務我的客戶比較好,應該是我可以通過線上去滿足他哪方面的需求,那我又可以通過線下去滿足他那一方的需求。在這個線上線下裡面取代一個比較好的一個綜效的那個點可能才會是這個online mergers offline裡面那個sweet spot.
Stella: 但是這種線上,線下的attribute還是非常有挑戰的。
Vincent: 對。所以就變得在某一些分析上面大家最大的公約數就是交易數據嘛。
Vincent: 線上有交易,線下有交易,那在線上跟線下交易大部分的feature是比較好整合。
Stella: 那我還想再問一問這個推薦系統啊,這個推薦系統是針對你的這個線上的平臺做的,因為你也提到說可能最好也就是30%左右這樣的數據是產生在線上的,那這個數據的量或者數據的這個diversity也會對於推薦系統的這個performance會有一定影響。
Stella: 就好奇想聽Vincent講一講你在做這個recommendation system的時候遇到了一些什麼樣的困難和挑戰呢?
Vincent: 這個就是這個挑戰與機遇並存。其實剛剛聽起來,這個是劣勢對不對。我們後來把它變成優勢。因為你想想看一家,這個企業,它是線下的提供量比較龐大,它如果想要鼓勵它的線下用戶去線上消費的話,其實你可以用它的線下數據去做你線上的推薦系統那,從用戶的這個視角來看的話,你就會發現說,其實本來我天天都是到線下的實體店來。那有一天我突然間開始使用這個特力的這個線上網站或app的時候,我一進來發現你怎麼知道我線下都買什麼。你推薦的都是我在線下買的東西。
Vincent: 所以反而就變成說我們在訓練線上的這個推薦系統的時候,不會單純只用他線上的數據,我們把線上跟線下的數據合並在一起,之後讓模型去train。如果這個人,他更多的信號源是來自於線下的交易的話,那自然體現出來就會是他線下交易的這些processes.
Stella: 嗯,特力屋,是會員制的嗎?是有membership的嗎?
Vincent: 對,是有會員制的。這部分我覺得在特力裡頭是做的蠻好的。會員的其實推展的深,就絕大多數,可能90%以上的交易其實你可以接到個人,就不是單純只是一個pos機,就是,幾點幾分,今天有人買一個電鑽,就沒有那麼單純。
Stella: 哦,那確實是。你這樣的就是這個Full User Journey就會畫的比較完整。
Amy: 嗯, 我可以證明。我們就報手機,Unique ID,就進去了。然後他通常就是,我記得當時sign up完全沒有懸念,他就說 欸,你報手機,你可以抵200塊,然後就進去了, 一開始就是Enroll拿Coupon嘛,你手機報進去,抵200。那大部分尤其是像媽媽群體,就直接就會報下去。
Vincent: 哦,這在臺灣這個很常見,就是就直接就用手機號碼。你就直接告訴他,他就直接就幫你歸檔,就進去了。他也不真正一定要去掃你的碼。他就用電話號碼 當作替代。
Stella: ok ok,這個倒是跟美國還挺類似的,但我感覺好像大陸比較少。誒,不對大陸直接掃微信,所有信息都有了。
Amy: 對對,就是每個地區的 Unique ID的選擇不太一樣,但伎倆都一樣,就是促銷。你綁一下,然後下次每次來就掃一樣的Unique ID這樣。
Amy: 那我其實還蠻好奇臺灣的數據行業現在的情況。那Vincent,這次回去以後,有發現臺灣數據行業的機會多嗎,工作好找嗎?
Vincent: 我覺得臺灣的數據,我現在就講General,只是我自己的這個面向。我觀察臺灣的這個就業市場裡頭,可能數據分析的工作在製造行業還是挺多的。我覺得這就跟整個市場經濟裡面它本身的產業的組成有關係,因為臺灣一直以來都是以製造業、建廠,所以製造業的公司裡頭,他們會比較相對的有這樣的資源去請數據分析或DS的人進來做一些模型。
Stella: 製造行業是指比如說芯片這一類的製造行業比較多,還是也包括比如說輕工業這一類的
Vincent: 當然包含芯片,那芯片可能是臺灣相對更知名的這種製造業。我剛剛講製造業可能有點太寬泛了。我剛剛 我覺得我可能要比較 narrow down 到比如說電子製造業就是這種 OK,或者在臺灣會比較直接稱呼叫做科技行業等等。那一般在臺灣講科技,其實會更加直接連結到硬件,那除了芯片之外的制造,其實臺灣還做了很多東西,比如說像大部分的世界上的這個notebook其實也都是臺灣的這些工廠公司代工製造的。
Vincent: 我可能無法盡說,但是這些跟電子相關的,這些電路板啊,一些設計啊都在這個裡頭。所以他們比如說,舉個例子,在工廠裡面判斷一個商品的良率,做機器視覺去處理這件事情,其實就會是臺灣的行業裡面很需要的一種人才,用機器去判斷,而不是傳統用人的眼睛去做質檢。
Vincent: 所以這是一個臺灣我覺得可能數據的機會也會比較多的地方。那再來其次可能會是比如說像是金融行業吧,金融行業其實因為他本身天然數據多嘛,那這個地方的喂納量會比較多,再剩下的行業我覺得就不見得了。
Amy: 那現在,如果一般Data Scientist、Data Analyst,他可能在臺灣這個數據市場上找工作,他的第一志願、第二志願大概是什麼樣的產業?可能就是從工作環境和待遇來評量的話。
Vincent: 如果這個找工作的人是非常在乎工資啊、薪水的待遇的話,很有可能他可能會瞄準科技製造業吧,因為這個行業在臺灣來說還是比較特別賺錢的行業。但有的人可能比較追尋自己個人的理想。比如說他就想要做一些這種零售行業的推薦系統,那他可能就需要往零售行業去找,那當然這就有些取捨了。
Amy: 會很多人去新創嗎?還是這個是比較不受歡迎的選擇?
Vincent: 我感覺在年輕一輩的小朋友們好像還蠻多人願意去新創的呵呵呵呵,就是願意take那個risk吧。然後但是會比較想要去做自己真的想要做的事情。我覺得這樣子的那個心情是蠻明顯的。
Amy: 嗯,那如果就career prospect來看的話。Vincent覺得在臺灣做數據分析在什麼樣的公司或產業最有意思,適合長期發展。
Vincent: 我也不知道,自從有了LLM之後,我們是不是有長期發展。。。
Stella: 沒有未來了是嗎?
Vincent: 這個好像是另外一個更大的主題。那如果我們先LLM aside這個面向的話可能我覺得像在金融行業至少我覺得在臺灣相對會是兩個比較sustainable的。其他的行業, 零售行業當然也有一些local的巨頭,但是這些巨頭呢 他們可能這跟臺灣的業態比較有關,臺灣的零售可能更多的是這種實體起家的那Data Science跟DA的工作可能相對會少一些,但也不是完全沒有機會。
Amy: 像美國的話, 一般數據分析師的profile,就還蠻多樣化的。那臺灣一般會去從事數據分析師或者數據科學家工作的人,一般typical的profile長什麼樣?我知道臺灣的大學有一些科系,例如資工啊,統計啊,資工好像比較多一點。想要問一下大概學歷的標準啊,還有科系的選項大概是什麼?
Vincent: 我自己的觀察應該還蠻多是資管,資管是資訊管理嘛,中國大陸好像叫信息管理吧。
Stella: information systems嗎?
Vincent: 對information systems,這個可能會是做DS的大宗,我感覺。就是很多這個背景的人,那資管的人有的人後來走了資有的後來走了管,那走資的呢比較容易走到DS這條路上。走管的有可能就不一定了就去別地方去了。對這個行業比較多那再來呢,如果是做分析跟DS的話,我感覺統計也會有一些。反而資工在臺灣,就臺灣學計算機,其實有很多人其實跑到硬件公司去寫那些firmware, middleware。寫這些firmware,那只有比較少的,因為臺灣的這個軟體行業相對的比較沒有什麼發達吧,跟其他,比如說跟美國,跟中國大陸相比的話,所以這些學資工的人他們可能更多還是往。。。
Amy: 工程師。
Vincent: 對 software engineer 的這個角度。
Amy: 數據類的 title, 這些 position,他的薪資在臺灣,軟體跟硬體公司裡面他會比較高還是比較低,跟工程師比起來?
Vincent: 硬體。我不是非常確定,但就比較偏零售或者是比較偏電商。這塊我的理解是大概入行大概兩三年的這樣子的一個 DS 的話,以新臺幣來說可能大概也就是80到100之間。
Amy: Stella在想80到100萬臺幣一年。
Vincent: 要換成USD嗎?
Amy: 不用不用。
Stella: 那在臺灣的這個data行業 data scientist或者是data analyst的這個job market上 supply是大概怎麼樣?是有很多人進入這個行業嗎?
Vincent: 我覺得self taught的人進入這個行業蠻多的。其實廣義來說,我當年也算self taught,自己編寫程式,之後再去讀個書,那我覺得現在這個趨勢還是很明顯,就是希望能夠通過上一些tutorials,然後就能夠入行,轉職到數據分析。然後在最近這個AI的這個熱度,再一熱起來,那就更多人會想要做這件事情。
Stella: 現在是已經進入了供大於求的階段嗎?
Vincent: 感覺這個供給應該是比較多一些。
Amy: 可是美國有一個還蠻明顯的趨勢,就是junior的人非常非常多。但是大部分的公司只想要senior的人,臺灣有這個現象嗎?
Vincent: 我覺得這個部分好像也是。我覺得LLM開始出現之後好像更加是這樣。
Stella: 你在工作有使用LLM嗎?
Vincent: 有,其實當時有試用,我自己用的這個經驗,比如說像在做有些這個marketing方面的文案,那能不能夠把它跟推薦系統結合在一起,因為推薦系統我們了解每一個人自己個人的偏好,那在這個偏好的基礎上面,能不能對它形成個人化的marketing案那這個結果你可能還是要人工,像在特力屋。比如,我不確定在美國或在其他地方怎麼叫,在臺灣叫壁癌,壁癌就是好像是牆壁裡面漏水,都一直很難修,修不好的一種屋況。有一些商品的title,它可能就直接寫了這個,那你把它寫進去到GPT裡,如果它發現這個人跟這個商品有比較大的關聯,那給你出一個文案說,我們這個商品就特別適合避癌患者可以有效的提高他的五年存活率等等。所以就特別的牛頭不對馬嘴。那這個問題呢,我覺得好像還沒有真的找到一個比較好的解決方案。
Stella: 這個其實又牽扯到有時候在中文地區或者是亞洲地區討論到AI霸權,quote unquote 霸權這個概念。如果大家用的都是美國生產的這一些AI工具的話,它其實會不太適用於我們的中文的場景,就像你剛才說的這個,他根本就訓練 training data 裡面很少有關於壁癌這件事情,所以他不太能理解其實。
Stella: Vincent,現在還在特力屋工作嗎?還是處於between jobs的狀態?
Vincent: 我現在between jobs的狀態。
Stella: 下一份工作打算找什麼樣類型的呢?
Vincent: 我覺得稍微還在有點探索自我,我覺得現在這個 LLM來之後真的會讓人蠻多的這個思考,如果今天沒有LLM的話,我肯定還是在現在這個領域裡面繼續把這口井挖深了。就是數據分析可以再往更深的地方,更多了解Domain,Machine learning的部分的話就是在繼續找到更多的應用場景。
Vincent: 但是現在LLM來之後,我覺得可能有很多工作真的會被它給automatic掉。在未來的我個人感覺是2 ,3年之內,我自己反而現在是內在出發,就比較不是往外看,我先去看看說回頭,盤點一下這10年的一些積累,我大概還可以在做什麼東西,或者我還適合哪些東西,就變得說過去的這段時間,DS或者是數據分析的累積,變成是一個skill的一個角度存在,而它不見得會是一個role,這也是我覺得可能未來的一個大勢所趨,因為當這些工具變得更加的lowcode,nocode,也不是只有LLM而已,lowcode,nocode的工具還在進步當中。在那個時間點,可能很多業務單位的人他們可以自己使用這些工具去實踐分析跟建模的話,對他們來說,他們只需要一個禮拜的training session,可能他們就能上手,這個role,本身是不是一個full time方式的存在就會是一個question mark。
Vincent: 但我自己的思考,可能還是想辦法跟人與人連結的這個程度比較深的工作,可能AI還是將來比較難take。for example,你的工作中當大量需要通過跟人溝通。那人有一些情緒價值必須依附在你身上。我覺得這個部分可能會比較難被取代。
Stella: 你說到這個,讓我想到,因為我們有一個聽眾群,有人在裡面開玩笑說只要stakeholder還是人, data scientist應該也必須是人,因為需要給stakeholders提供情緒價值。
Vincent: 我這也有點參考那個李開復先生他的分享吧,我覺得他也蠻有這樣子一個想法,就是AI會取代很多未來的工作,還不是我們今天討論DS的範疇,那最後人剩下的價值可能就是人跟人之間的連結,信任,這件事情會比較sustainable吧,但也不知道啊,這個未來還會怎麼變也很難說。
Stella: 嗯,還會是和科技相關的行業嗎?
Vincent: 我想應該還是,就有點摸著石頭過河吧,就是前面累積了一些探頭寶,可能將來就是按圖索計,那可能再加哪一個東西進來,會有些綜效。
Vincent: 我可能只是用這樣的角度去往前,再去推進吧。但雖然現在這樣講啊,那搞不好還是去找老本行。
Stella: 那對於工作的地點呢,還是會繼續在臺灣找工作嗎?還是去嘗試一下其他的地方?
Vincent: 這個問題問得我有點糾結。如果其他地方相對臺灣有更好的一個機會的話,我覺得我還是會考慮。畢竟LLM留下來給我們的選項不是很多了。
Amy: 不會,我覺得Vincent的Domain Knowledge,今天聊了這麼多,其實我們已經聊了兩三個部分。Domain Knowledge還蠻深的人,不用太擔心。深耕一個Domain的話,還是有很多機會的。那Vincent,最後有什麼問題想問我們嗎?
Vincent: 你們覺得..當初你們走上DS這條路的時候,有沒有是這個工作可能跟你們內在的哪些特質比較契合?所以這個工作對你們來說特別有共鳴。它是一個有意識的,一個思考的結果,還是說也就是某種程度也是隨著大流就走上了這條路。
Amy: 如果要純做engineer,我覺得DS對我來說比較有吸引力就是它有creativity的部分在裡面,因為它不但是分析嘛,它有理性的層面,但是很多時候你要去get buy in或者去design一個data science solution的話,還是有很多好玩的地方,have room for creativity,就是很多工程類的role,我覺得沒有那麼多的flexibility.但是Data science對我來說就是這麼樣一個存在。所以我覺得還蠻好玩的。
Amy: 第二,就是說一個project走到每個人的手上有不一樣的。第一,有不同的interpretation,第二,你可能去設計你整個solution啊,你怎麼做這個model啊會還蠻不一樣的。我覺得這個就蠻好玩的,因為我不太喜歡一件事情只有一個playbook的感覺。所以就算現在有LLM,但我覺得還是沒有什麼影響我對這個行業的熱情,因為LLM進來以後還是一個東西不是只有一個solution.
Stella: 就對於Vincent這個問題就說當時進入Data Science是不是一個有意識的決定我覺得,對於我來說,yes and no,我當然是因為喜歡做比如說modeling或者是analysis,這一塊才會去考慮data science這個行業,但是,另外一方面來講,因為我進入這個行業的時候,確實屬於data science非常新興,然後非常shining的時間,所以你說回頭來看我有沒有受到這個行業上升期的這種影響呢?我覺得肯定是有的,這種行業周期的影響,包括我們有時候說在我們podcast裡面經常討論的職業中年危機,mid career crisis-這個問題,其實也是受到行業周期的影響,也還是很大的。
Stella: 我對於現在的這個data science行業的思考呢,是我覺得就像你前面說,你工作當中遇到的挑戰也是機遇吧。
Stella: 我是一直覺得data science之前一直處於一種hype的狀態,其實不光data science行業,包括整個tech行業,我都覺得是有點被hype了。
Stella: 我以前經常想說,因為我在tech之外的行業工作過幾年,我有時候就會下意識地去比較說tech行業的同事和我之前在非tech行業的同事是為什麼收入差距這麼巨大。
Stella: 包括我認識的一些在其他行業,比如說生物啊,或者是化工啊之類的,就是我們所認為的傳統行業工作的朋友。是我們特別聰明,所以我們可以拿到這麼多的工資嗎?其實也並不是。
Stella: 某一個時機進入了某一個特別賺錢的領域。那現在我其實會覺得這個重新調整未必不是一件好的事情,或者說,從比較感性的角度來講,會讓我覺得這個是社會重新分配走向一個更加正常的狀態吧。
Stella: 一方面來講在這個行業當中,我當然覺得說這個下降的時期是非常的讓人不好受的,但是另外一方面來講,我還是相信它是一個整體上往更好的方向去走的一個階段。
Vincent: 我這個問題會不會太過嚴肅了?
Stella: 啊,不會不會。我們也偶爾要嚴肅一下嘛。
Amy: 我會覺得就像Stella講的,你如果把一個行業,最直接的利多拿掉了以後你還喜不喜歡做這件事情?那剩下留下來的人應該就是真的適合做這件事情的人。
Vincent: 但我自己在做一些LLM上面開發可能沒有兩位做那麼深入啊,但我有一個直觀的感受就是他其實leverage到之前的DS的skillset,我覺得好像都比較少。我感覺好像他們並不是一個光譜上對不對。好像有點是兩個有不同的知識體系,但是somehow他們會有些綜效。你們有這樣的感覺嗎,還是我們感覺不太一樣?
Stella: 我們說到做generative AI或者是就是我們講這個 large language model-這一塊的話。
Stella: 我是覺得這個東西剛開始起來的時候大家是比較集中在關於foundation model的討論和 large language model的一些直接的應用,比如說你做一個 wrapper,然後去做一個什麼簡單的應用,這些場景上,但其實它也還是會有一個巨大的生態,我是覺得還有除此之外的其他很多有需要你data science skills的這一些需求出現,所以我並不覺得說我們的data science skills在這個 domain就完全的不applicable了,而且,說到底,其實很多時候是你的 analytical sense,你的number sense和你的邏輯思考能力,就這些最底層的東西其實是不變的。
Amy: 我覺得是時間還沒到,build LLM application本身。我覺得跟software engineer是比較相近的,但是是因為這些方法還沒有落地,所以你還沒有辦法去準確的measure然後你還沒有辦法準確去measure的時候數據還沒有產生,所以analytics還沒有需要做的時候。
Amy: 因為像我們現在開始得要很多evaluation啊,我怎麼知道這是對的錯的啊這個quality怎麼去measure啊,當這些東西開始有一些方法能夠measure起來放到數據庫的時候,那analytics應該又要再次的 revive,就是說怎麼去把這個做好。
Stella: 因為我現在做的一個很大的項目就是在做evaluation system就evaluate large language models和chatbots.
Stella: 這一塊也是發展的很快。其實我剛開始做的時候也就是去年10月份。那個時候沒有什麼現成的software。有一些大家提出來的open source的framework,但並不是可以直接在industry應用的。
Stella: 但是現在你再去看,已經有很多options了,但是呢現在的這一些software它其實主要是集中在accuracy的evaluation上,accuracy和relevancy,但是你除此之外,還有很多很多的dimensions需要去evaluate,所以我是覺得這一塊的機遇還是挺大的。
Amy: 我覺得這個事情還是有一個cycle的,走到那一步的時候又發現,哇,舊方法都有用了。
Vincent: 所以現在咱們積極的往LLM,往下去學新的東西,新的開發,其實也是一條比較promising的一個路。
Stella: 擁抱新的技術嘛,就和過去的每一次技術變革都一樣。
Amy: 謝謝,今天Vincent跟我們聊天,我們今天就聊到這裡,大家拜拜。
Stella: 大家拜拜。