Ep4: 解密物流科技業,logistics 需要接地氣的 data scientist
「用聽的」
「用讀的」
Amy: Hello 大家好,歡迎大家收聽第四集的數據女孩的中年危機。我是Amy。
Stella:大家好,我是Stella。
Amy: 感謝朋友們的喜歡和支持。也歡迎新朋友們來聽我們聊天。大家直接搜「數據女孩的中年危機」就可以找到我們。朋友們也可以在各大podcast和社群平台直接關注我們。
Stella:如果大家覺得我們的內容不錯、有幫助,也請幫我們多多宣傳。我們也會更有動力持續創作。
Amy: Stella 為什麼今天還是只有我們2個人?
Stella: 今天本來是有一個 guest 嘉賓,我們甚至還在小紅書上發了預告,但是呢,這位嘉賓喝醉了。。。
Amy: 喝醉了?!
Stella: 她強撐著跟我一起 set up 設備之後就整個昏死過去了,所以,為了不要開空窗, Amy 和我又趕緊說,我們再錄一集,聊一聊我的工作經驗。
Amy: 早上收到Stella訊息的時候,還想說,「什麼?你是認真的?」。我本來還很興奮,想說「喝醉了?好啊,可以聊得很開心!」結果沒想到還是沒有辦法準時出席,我們就下次再說。
Stella: 這就是一個非常難讓人預料的嘉賓,等到時候她上了節目聊,大家就知道了。是一個非常非常 random,但是也很有趣的人!
Amy: 我覺得很期待。他這次喝醉了,我反而更期待他來上節目。那今天我們臨時改題目,決定來跟 Stella 聊一下他之前的工作,Stella 之前是做 logistics 的,那我對 logistic 真的是一竅不通,不太確定在 logistic 行業裡面data science 都在做什麼?
Amy: 其實 logistics,我想到的話,會是 ecommerce 或者做 uber lyft 這樣的 rideshare 的功能的data scientist,甚至是 fedex ups,它可能會需要很多去做 delivery 的預估,那 Stella 之前做的是大概什麼樣的 logistics 呢?
Stella: Logistics 確實是一個非常複雜的一個行業,它跟我們每個人當然也是非常相關的了,我們在網上買東西,這些 package寄到我們家也是通過了 logistics, 我們出門的時候,用 uber 用 lyft 這些也都是跟 logistics 相關,包括現在我們一些外賣的服務, doordash 或者是 ubereats 這些也都是跟 logistics 相關的。
Stella: 這是一個非常非常大的行業。Logistics 和其他 tech 行業有比較大的不同,主要來說的話還是集中在線上,但 logistics 是一個非常需要落地的行業,要說 players 的話,這個行業裡面的 players 實在是太多了,我也只能說只是瞭解其中一部分。
Stella: 我可能會從我做過的 ecommerce 的角度去給大家大概講一下這整個的流程是怎麼樣的,比如說我們在amazon 上買東西,或者是我們在一些獨立網站上買東西,在美國大多數這些獨立網站或者是 amazon 的商家他們的產品其實還是絕大多數是從中國來的,是中國的廠商生產的。
Stella: 那麼他們從中國生產了之後呢,就要先從廠家到港口,再從中國的港口到美國的港口。中間就涉及到可能是海運或者是空運,再從美國的港口,到美國當地的各個不同的 warehouse ,再從 warehouse 可能它還有一個所謂的 hub spoke 的這種某模型,那我們今天就不講那麼深,再到離你最近的一個 warehouse,再從 warehouse 寄到你們的家,所謂的 last mile delivery ,這整個過程非常的複雜。
Stella: 當中也有非常多不同崗位的人在其中工作,共同促成,整個從廠商一直送到你家門口,我們所謂 port to porch 這麼一個流程。就是從港口到你家門口。
Stella:我在其中做的工作呢,可能更多的還是從 warehouse 到 warehouse,就是 warehouse 之間的 logistics delivery 以及 last mile delivery 這一部分的工作。
Amy: 所以在 e-commerce 工作的話,一般會有什麼樣的職位?像 Stella 之前是做純 data scientists ?還是需要去現場調研,然後再做 research scientist 之類的工作呢?
Stella: 那一份工作呢,也是一個startup。我在非常早期的時候,我是頭幾個data scientist 進入公司,所以當時,並不可能有這麼細的劃分,比如說你是 product data scientist ,你是比如說 research data scientist ,或者你是 applied scientist。都是什麼都做,沒有這麼細的劃分。
Stella: 所以,我在這一家公司什麼都會做一點,尤其是早期的時候,比如說涉及到 operations data analyst 這種類型的工作,我們在整個 logistics operations 的過程當中會產生很多 data,但是,這裡的數據就不是像 ads 的數據那麼的乾淨,它需要很多很多的 preprocessing ,有很多的問題也需要去解決。
Stella: 你把這些數據彙總了之後,根據部門的要求,或者是根據 c-level 的一些側重點,去做一些 reporting。這個做就是繁雜並且可能不是那麼的有趣,但是也很重要,也是需要做的。還有和其他的 tech 公司一樣的 product data scientist,這個在 logistics 公司當中也還是存在的。還有更側重 modeling 和 algorithm 一些的 data scientist 包括一些我們現在可能覺得比較 traditional 的 machine learning 的 projects,也是在 logistics 公司當中有很多 data scientist 在做的。那麼,有一類的做 modeling 和 algorithm 的 data scientist,在其他公司可能稍微少見一點的是 OR, operations research engineer 這一類的 data scientist ,他們可能主要是在做 optimization 或者是 scheduling 這一類的工作。
Amy: 我其實常常看到大學或者是以前同事,他以前是念 operations research 的,我一直在想說他們到底是做什麼的,為什麼現在來跟我當同事?像唸這個專業的人,他去做 logistic 方面的 data science 跟 ml 的話,他們是 domain knowledge 比較多嗎?還是說他們比較知道一些比較 traditional 的 optimization methods。
Stella: 我對於 operations research 這個專業出來的人都是充滿了敬佩, respect。
Stella: 因為我覺得我自己本身並不是 OR 背景的,但是我以前的專業呢,跟 OR 是相關的,我們也會學很多 OR 的東西,會和 OR 的同學們一起上課,我是覺得他們學的東西真的很難啦。也不是每個學校在本科的時候,都有 OR 這個專業, OR也就是 Operations Research。很多的學校,它可能是叫 industrial engineering 這個專業。industrial engineering 和 operations research 是會有一些交叉的。
Stella: 我在 substack 上面有寫過一篇文章,說不同的 data scientist 的崗位,其中就有開玩笑說 OR engineers, 他們在 data science 非常火之前,他們是叫 OR engineers, 有了 data science 這個 term 之後,他們叫 data scientist。現在 data scientist 可能不是那麼的酷了,他們又重新 regain 他們的 title 現在又叫 OR engineers。他們做很多 optimization 可能是 heuristics ,或者是數學模型 、scheduling 還有很多很多,但是可能我剛剛說,這兩個是更為大家所知的。他們做data science 還是非常有先天優勢的,一個是他們的數學功底真的是非常的好,而且他們可能和比如說數學系這種專業的教學來比的話,他們又會更側重編程一些,所以我覺得還是非常非常的有優勢吧。
Amy: operations research 一般他們知道他們未來出來工作,他們會往 logistics 的 data science 的方向發展嗎?還是這是屬於一個比較新的概念?
Stella: operations research 發展也有幾十年了,它最早應該是軍方,比如說作戰的時候,你的後勤的所有的這些優化和協調。然後你讀 OR 的時候,尤其是美國人,讀 OR 的很多是當兵的,這個也是非常有意思的事情,包括我第一份在 logistics 的工作,當時和我合作非常緊密的 logistics ops 的頭兒,他就是西點軍校畢業,學的就是 operations research。
Amy: 哦,這些其實之前沒有想過,也沒有仔細跟做過 OR 的人聊過。這些不同的崗位,現在 logistics 跟 data science 發展這幾年,它的分工也越來越細,那一般是解決什麼問題?
Stella: 如果我們是從,比如說在 ecommerce 上買東西加上送貨的這麼一個流程來看的話呢, data scientist 其實是負責非常重要的部分,比如說路徑的優化,包括你在買東西的時候,現在我們看到很多買東西的網站上,他都會在你買的時候就告訴你一個 eta,就是大概你這個東西什麼時候會到,這個也是背後也是 data science 的支撐。
Stella: 包括整個在送貨的過程中。我們所謂的 first mile、middle mile、 last mile,這每一塊兒的優化,也都是 data science 在解決這些問題。
Amy: 做到 route optimization 的話,我就會想到其實跟地圖比較相關,就地圖的 routing 上面,其實跟一般的 data science 還是非常非常不一樣的。那這一塊是會有特別的人出來做嗎?還是他有很多已經有的工具可以幫助這些 data scientist 迅速地完成eta 跟 route ooptimization?
Stella: 對,做 eta 也有不同的做法,那我先回答剛才你問的問題,是不是已經有比較成熟的 route ooptimization 的工具?這個我覺得可能要具體看每個公司它的 business model 是怎麼樣的和它的具體的 operations 是怎麼樣的。
Stella: 比如說 OR 這一塊兒的 data scientist,他們常去的其實是航空公司各種 airlines,那如果是在這些 airlines 裡面的話呢,他們的很多這種 optimization scheduling 的問題它還是得自己寫的,也不是說就真的是 from scratch,但是,它還是有很多需要去自己去 build 的 components。但是對於很多中小型的 tech 公司,它如果涉及 route ooptimization 這一塊兒的話,它可能還是極大程度上是在用現成的 google maps 的api 的 servicce。或者是做得複雜一點的話,它可能會用一些 solver。solver這個詞可能如果是 OR 專業的人一聽到就會 click,但是我們其他專業的 data scientists 可能就會聽比較少。
Amy: 聽不懂,對對對。
Stella: 因為我也不是 OR 專業,所以我可能沒有辦法講的透徹。solver, 你就可以把它想象成是一個 black box,你有一些,比如說 mix integer proogramming 之類的這種,對,然後它會幫你求解。有一些中小型的企業做的稍微複雜一點,它會用到 solver,但是很多是直接用現成的各種 map 的 api。
Amy: 突然 Deja Vu 想到一些之前 master 上的optimization class 用的詞。老師就會在白板上寫,這個 np hard。
Stella: 屬於比較深的OR的問題,或是 optimization 問題,那我是不太能解答了,我也是只知道np hard 大概是個什麼東西。
Amy: 就知道,恩,很難。那我們聊一點接地氣一點的喔, logistic data scientist 一般要跟什麼樣的 teams 交流,甚至出了公司,需要跟什麼樣的 subject matter experts 做交流,因為這畢竟是要真的落地跑起來的東西。
Stella: 對, logistics 公司現在也有不同的類型,有的會可能更傳統一些,有一些呢,所謂的logistics tech,那我之前的 experience 都是在類似於 logistics tech 這一類公司,所以可以從這個角度跟大家講一下我的 day to day 工作大概是什麼樣的。
Stella: 在 logistics tech 公司當中,你還是會有 product manager,你還是要跟 software engineer 合作,所以這一部分其實是和一般的 tech 工作的 data scientist 都是比較相似的。那不同的地方可能是在於,前面說到了 logistics 的整個過程,它有非常多不同的角色去參與。
Stella: 所以要跟這些不同的角色去打交道。那剛才你提到說, SME(subject matter experts), 在 logistics 這個行業中,SME 真的很多,不同環節的 SME 都要打交道。我們剛開始的時候,講了大概這整個 logistics 的流程是什麼樣,但是還沒有更細的去說,你每一個節點, handoff 當中就涉及不同的角色。
Stella: 那作為data scienttist 因為我們是要設計,尤其是作為我們做algorithm 或者是 modeling 的 data scientist ,你要保證自己的東西能落地,要保證這些在一線的人他願意用你的東西,所以這個工作有時候會涉及到一些 trust building 和 persuasion。你要去說服他,你要讓他信服你。
Amy: 我想上一集我講了,我做 adtech。其實 adtech 就算落地了,它還是在雲上跑。不過,像logistics 如果 algorithm 要落地的話,確實是要直接在路上跑了。你有什麼有趣的故事可以跟我們分享一下嗎?
Stella: 有一段時間,我為了要做一個scheduling algorithm,要讓這些 truck drivers 去用這些 scheduling algorithms,我每天都往工廠跑,要跟這些 truck drivers 做朋友。
Stella: 但你能想象,做 truck drivers 的美國人他一般其實可能是不太會去接觸到科技行業的人,那更不用說是科技行業工作的一個外國女性,一個asian female,所以他們在看到我的時候,會有一點排斥。
Stella: 還會有一點,怎麼說呢。。。
Amy: 跟你沒話講。
Stella: 呵呵,對,就沒有什麼共同話題。對於我來說,因為我也不是一個會去看 football 的人,我跟他們也確實是沒有什麼共同語言,所以這種 trust 就完全只能建立在說,我要讓他們覺得我做出來的東西是有用的。
Stella: 並且呢,我要讓他們覺得, tech 並不是一個可怕的東西,因為你知道很多 truck drivers 或者是類似的這些職業的人,因為他們接觸的少,他們會有一種恐懼心理的,是真的會覺得 ai is gonna wipe us all ,是會有這種心理的人。所以要去讓他們知道說,哦,這個東西具體是怎麼運作的,你不太能給他們一個 blackbox 說,哦,那你就按這個來就好了。
Stella: 他很重視可解釋性,你要跟他們說,你為什麼要這樣做。在過程當中建立了一定的信任之後,你再去做比較偏 black box 一點兒的東西,他可能就會覺得說,哦, Stella built this. It’s okay. I’ll trust it。
Stella: 會有這種 trust building 的漫長的過程,那過程中我也是做不同的 project 也經歷過一些failures ,包括,比如說早上六點,被工廠的人打電話叫醒,對我大喊說,你的東西根本不 work。
Amy: 他直接打你手機?
Stella: 對,直接打我手機。我就看到一個陌生號碼,一接起來就是yelling,挺有意思的經歷。
Amy: 所以像你這樣連 customer support 也要一起做起來了。
Stella: 這也是一個很好的問題,很多時候, data scientist 如果是完全 hide behind the screens 的話,我覺得很難和這些在一線工作的人建立一些 connections。如果是在比較規範的 standardized 的一些工作流程當中,那可能我們會把東西就交給 product managers,讓 product managers 去做這些交流。
Stella: 但是以我的經驗來講,和 logistics ops,或者是所有 operations 這些的人交流的話,你作為做產品的人,你作為去寫這些 model,寫這些 logics 的人,我覺得還是要去直接 face to face 的,去跟這些人 interact。尤其是在早期的時候,我覺得會更加事半功倍一點,因為你如果通過 product managers 或者是通過這些 ops leads 去做這些事情的話,幫你傳話的人他並不完全瞭解你是怎麼做事情的。包括在使用的人,他也還是不知道說藏在 curtain 之後的data scientist,他到底是個什麼樣的人,他還是沒有辦法建立這種信任。
Amy: 我覺得還蠻感動的,因為其實很多時候就算我們做 data scientist 願意去 go in the field,跟大家做實際上的交流,可是你的 manager 或你上面的人可能會覺得,「哇,你不需要去做這件事情」,但常常你如果沒有真的去的話,你沒有 establish relationship 的話,你是沒有辦法瞭解真的問題出在哪裡的。
Stella: 而且還有一個問題,如果我們不去 boots on the field 去一線看的話,很多時候你直接通過數據,你並不知道數據是什麼意思,出了問題。比如說數據 data quality 出了問題,你也並不能看出來,尤其是做這種 operations 的,你數據非常容易出問題。。。哈哈。
Stella: 與其你拿著別人給的數據,花很長很長的時間去用不同的測試的方法,用不同的 models ,可能還不如你去一線看一看,到底是怎麼回事,建立一個直覺,這樣對做 model 和做 algorithm 我覺得也是很有幫助,但是過程很累,真的非常辛苦。
Amy: 是好幾個月嗎?
Stella: 可能和不同的崗位有關。我比較幸運的是,我的客戶,就是自己公司內部的其他部門,所以離得也不是很遠,基本上你想去就去,你問什麼人家也會說,不會覺得說「哦,你是一個 3rd party vendor 有些話我不敢跟你講」,所以這方面還是要順暢很多,有一些 logistics tech 的公司,是為客人服務的,為別人服務的,那種的話,我覺得可能就會更難一些。
Amy: 那就有更多 politics 跟複雜的關係吧。那既然投入了這麼多的時間,為什麼現在離開 logistics 行業呢?
Stella: 我覺得 logistics 行業還是一個非常有挑戰性的行業啦,我是很希望這個行業有大的突破,有 big breakthrough。因為現在,比如說 last mile 的問題,或者比如說國內外賣小哥的這種送貨的方式,我始終還是覺得,不是真正的解決問題的方法。
Stella: 我是覺得我現在自己沒有能力去解決這個問題,但是我非常希望有能力的人去解決這些帶來很多 inefficiency 和社會問題的,我們 data scientist 可以出一份力,去努力,但是從我自己的角度來講,我做的時間長了,我確實是沒有很多的新鮮感,我這個人就是,如果我工作,對於我來說,沒有新鮮感的話,我真的是每天上班,跟上墳一樣,就很難受。
Amy: 呵呵,那跟我有點像。
Stella: 對,我們都是需要新鮮刺激的人。還有就是現在,尤其是在美國 tech recession 的影響下, logistics tech 也是非常的艱難,因為 logistics 它本身就是一個 thin margin 的行業,你只有規模做到一定大了,你才有這種規模效應,你才可能去 profit。
Stella: 那這個就要求你前期要投入大量的 capital 大量的資金去做這件事情。現在大家都收緊的狀態下就很難拿到這麼多錢。前幾年的時候呢,當money was ccheap 時候做了 logistics tech,大概還是不錯的,現在越來越難,行業也是不斷的在收縮。近半年近一年看到很多初創公司,一些 logistics tech 的公司,都沒有活下來,也都是處於這個大背景下。
Amy: 做 logistics 的 data scientist 他們常遇到的困境是什麼?例如,有些事情卡住了?因為產業的一些 restriction 他就沒有辦法再 move on 了,還是很多東西可能做久了,其實都沒有辦法落地?大概會是什麼情況?
Stella: 我覺得做 logistics 的 data scientist 一般來說遇到的第一個問題,就是 data qualitty 的問題。它不像做 ads,你的數據都是在線上產生的,很多數據它是要經過人手的,你只要有human touch,那你就非常的 error prone,很多出問題的可能。 data quality 可能就是第一道難關吧。
Stella: 還有你剛才 hint 的,可能會有很多 regulation 方面的問題,包括你在 transport 的過程當中,美國的 truck drivers ,你開多長時間,你就要休息多長時間。他有這種非常嚴格的 regulations 。那麼,你可能就要在你做 scheduling 的時候,這些都是你需要 take into account 的。
Stella: 還有是我們前面討論的落地的問題,它確實是需要做 data scientist 或者是 dev 這些人去和一線的人多交流。這個還挺難的,其實我覺得 tech 就自然的吸引了很多的 introverts, 很多內向的人。self selected對吧,就我們可能性格原因讓我們更容易選擇這個行業,我每天對著電腦就好了,開會最好也少開一點,不要經常跟我講話。
Amy: 我們 Stella 已經算很外向了,但是 truck driver 還是很不喜歡跟他聊天。
Stella: 我的經驗就是,我得去克服自己的這些性格上的一些限制吧,去更多的去跟人交流,更多的去和人做這種 trust building exercise 並對一線的這些人,可能不是那麼瞭解科技的人,多去共請他們的處境,從他們的角度去看待,現在發生的很多事情。我覺得這可能是對我來說是一個挑戰,但是也是我做了 logistics 這些年很大的收穫。
Amy: 所以,你會不會覺得其實有一些行業功底的人,再轉行去做 logistics 的 data science 會比較容易上手或者是成功。因為他對這行業有一定的 empathy 跟瞭解,他再去學 data science 的東西去解決這個行業的問題,這樣的人會不會在這個行業,反而比較容易長久的待下來。
Stella: 我覺得是啦,他是 domain knowledge 要求比較高的一個行業。那如果你之前已經有類似的或者說就是這個行業的經驗的話,肯定是會有幫助。
Stella: 但如果,你是像我和 amy 一樣比較貪婪,比較貪圖新鮮感的人的話,我覺得,如果你以前沒有做過 logistics, 應該去嘗試一下。這個和 ads 行業可能是一個譜系,一個 spectrum 的兩端,我覺得去體驗一下是真的很好的,也會發現很多有意思的事情。比如說 ecommerce logistics 這種和我們每個人息息相關,你每天,或者說每週都在網上買東西,你並不知道後面發生的這些事情。做一做,會有一個新的 perspective,對世界是怎麼樣運作的,多一個角度吧。
Amy: 確實,我今天就學了很多,多瞭解了一下這世界怎麼運作的。每天都收很多快遞,也會在網上購物,當然每次拿到會想說,「喔,這個 package 能夠真的在2天內 deliver 到我手上,真的是過了很多人的手」,無論是 behind the scene 還是 on the ground 的人。
Stella: 我們今天沒有怎麼講 delivery eta 這個事情。這個也是一個非常有意思的研究的領域,有很多公司都做過這種 research,就是如果你顯示的 eta,提前幾個小時,或者是提前一天的話,它對 conversion 是有一個非常大的 boost,所以所有公司都在非常積極地想說,我們再把 eta 縮短一點,再縮短一點。
Stella: 那我們在 tach 行業對 eta 縮短,比如說1個小時2個小時,這個對於一線工作的人,對他們來說是巨大的挑戰,但是,我們作為用戶的時候,我以前可能在網上買一個包裹,它晚了一天到,就非常的生氣。
Stella: 做了這一行之後,我就覺得,我能理解,沒關係。
Amy: 多跟實際上on the ground天天工作的人有交流以後,你就會開始對他們的工作產生很多 empathy。其實有時候也沒有必要逼得這麼緊,因為你 top down 這樣下來的所謂的optimization,其實對底下人都是很大的壓力。
Amy: 那如果觀聽眾裡面有誰是特別做這一塊的比較 last mile 或者是 eta forecasting 的 data science 的同行,也可以直接給我們留言或者私信我們,我們也很想要聽聽從你的角度 logistic 行業是什麼樣。
Amy: actually 我覺得我們聽眾裡面如果有 truck driver 的話,應該 reach out 我們。給我們來吐槽一下像是 Stella 這樣的人,去他的 truck 那邊囉哩八唆的時候,他到底是什麼心情。
Stella: 歡迎私信來罵我,我都可以理解的。
Amy: 那我們這禮拜就這樣,今天算是有一個特殊的 episode ,本來可以聊聊作蛋糕的,最後,沒想到聊得這麼硬核的 logistics。
Amy: 希望我們下一期的嘉賓能夠趕快酒醒,我們趕快把下一期錄了,下一期跟大家聊怎麼做蛋糕。那今天就先這樣大家拜拜。
Stella: 大家拜拜。