EP10: ChatGPT成功背後的工蟻標注數據，取代自己？

Amy Chen and Stella Liu

Apr 05, 2024

「用聽的」

0:00

-52:18

追蹤訂閱，不錯過數據女孩最新資訊

YouTube, Spotify, 小宇宙, Apple Podcast, B站, 小紅書, Threads, Instagram

「用讀的」

Amy: 大家好，歡迎大家收聽第十集的「數據女孩的中年危機」。我是Amy.

Stella: 大家好，我是Stella.

Amy: 感謝朋友們的喜歡跟支持，也歡迎新朋友們來聽我們聊天。大家在網上直接搜「數據女孩的中年危機」就可以找到我們了。在YouTube.各大Podcast平台，Spotify、Bilibili、小紅書、小宇宙都可以直接關注我們。我們也會在上面發文給大家一些有趣的資訊。

Stella: 如果大家覺得我們的內容不錯，對你有幫助的話，也請幫我們多多宣傳，我們也會更有動力持續創作。

Amy: 今天來的是我的朋友，我大學的朋友，以前的室友小賀。

小賀: 哈囉嗨。

Amy: 小賀出現了。小賀現在在英國倫敦。大學畢業後，她就自己去那邊讀書，然後就留在那裡工作了。她也是一個Data Scientist.

小賀: 是的。我上一個工作就變Applied Scientist.都差不多，換湯，不換藥。

Stella: 那我們今天請小賀來是想聊一聊Data Labeling.要說起最新，這麼火的ChatGPT或是Generative AI大家肯定都聽過的。那ChatGPT當中最後這個字母 T,Transformers 其實也並不是一個很新的東西，或者說ChatGPT 所用的 model 可能對於關注這個領域的人來講，並不是一個什麼 big breakthrough。

Stella: 對於我來講，我可能更好奇的是他們的 data 是怎麼處理的，他們用來 train Transformers model 所用的 data 是如何收集來的。

Stella: 今天我是很期待小賀可以給我們介紹一下 data labeling 的這個過程以及他的工作是做什麼的。

Amy: ChatGPT的成功其實跟 data labeling 有非常大的關系。如果你看前幾代的 model, 他其實都大很多。但是ChatGPT既然體量上比較小，但卻能夠有這麼好的效果，跟他背後的數據特別乾淨，有經過很多的 pre processing data labeling,這整套流程都非常有關系。

Amy: 這也就是現在所說的 RLHF Reinforcement Learning with Human Feedback.那我們今天就用最接地氣的方式來了解這個RLHF是怎麼 put in action。

Amy: 先介紹一下小賀。其實之前跟我們一樣都是 data scientist.因為是我的好朋友，我也比較清楚他的歷程。

Amy: 他在前一年，他中間就辭職，就暫時沒有做 data scientist的工作。

Amy: 小賀，要不要先給大家先介紹一下在做data laborer之前，你是做什麼的？

小賀: 好，我來英國念研究生唸的是相當於GIS,就是地理信息系統，智能城市跟urban analytics.但其實就是GIS.我當時就是先做GIS，然後畢業的時候，也是大部分同學都去就算是比較傳統行業吧，就是什麼建築啊，或者是城市規劃，或者是這種civil engineering的事務所，然後當時就很想要找可以sponsor visa的工作，然後就發現好像好像data scientist,比較in demand。

小賀: 那是2016,17年的樣子嘛，可能在美國已經有那麼幾年，就已經有一些什麼bootcamp啊什麼的。

小賀: 英國就稍微要慢一點。然後當時就是我記得我去找Data Scientist工作的時候就是很多人都沒有聽過這個工作。

小賀: 然後我當時去的第一家公司是一家很小的公司。是一家初創企業吧。當時才六，七個人。

小賀: 那他們做的是 Consulting,就是Big Data Consulting就是相當於是Google Cloud的一個合作夥伴，就是相當於Google Cloud想要賣他們的那個雲嘛，想要跟AWS啊 Azure來競爭。

小賀: 然後Google Cloud就說那我們的亮點就是 AI on Cloud.然後他就要一些Partner去幫他們去給客戶就相當於表演一下！我覺得其實後來想想就是有一點是表演啦，就是給他們看說哦，你的Data我們給你就多麼簡單，對，就可以做一些Machine Learning, AI，然後客戶就很興奮。然後谷歌說那，你就先把你的數據都migrate到我們的雲上。

小賀: 我覺得還蠻有意思的那個時候。就是我們Data Science Machine Learning Team,我們做的都是很多POC嘛， Proof of Concept就是這都是我覺得後來仔細想，其實表演性質很強，然後真正公司就是Make Profit其實主要是靠Data Engineering，就是好幾個月的Big Migration來賺錢。然後我們這些Data Scientist就幫他們做一些Machine Learning。

小賀: 然後我就在那裡做四年，還蠻好玩，因為接觸到很多各行各業，不能說各行各業，就是不同的領域的Data Science的一些Projects，面比較廣。從什麼retail啊 media recommendation engine,然後還有一些很多telecommunication一些maintenance，一些IoT就是time series forecast,就是面很廣。

小賀: 所以我覺得還蠻好玩的。但是後來就是做了就覺得，好像真的是做的項目表演性質比較強，就是有的時候我們也有幫他們deploy啦，但是deploy完以後，我們也不知道，就是也不知道我們很有感情做出來的項目到底何去何從。

Stella: 就是你沒有辦法看得到反饋。你投入了很多時間去做POC或者去做deployment,但是就不會像，比如說，如果是in house的人去做的話，他可以看到最後的效果如何。

小賀: 對對對然後就包括我們到底做的東西。出現了什麼問題?也不知道。所以有的時候做的時候就有點心虛嘛，就覺得我都不知道人家怎麼maintain。

小賀: 然後我第二份工作就去產品公司去做一個叫Applied Scientist,就是大差不差，但是就是他有很多已經deployed一些Machine Learning啊，或者是一些algorithm然後要maintain,要on call,然後我相當於做了一些更偏MLE的一些工作吧，就是寫更多code。

小賀: 就幹了一年多以後，覺得好像主要都在寫unit test,寫了很多碼，就是都感覺挺repetitive，對吧，有一些framework然後你就抄啊，就是感覺有點無聊，然後就有點midlife crisis嘛，然後就先辭職了尋找一下人生，人生的樂趣和意義。

Stella: 那尋找人生的結果是去做了Data Labeler嗎?

小賀: 沒有啦。其實我覺得從上一次你們介紹的時候，我就想說，好像我做Data Labeling沒有那麼，沒有你們想的那麼有誠意啦！就是我沒有是真正是在轉行，就是屬於我。。。

Amy: 我來給大家介紹一下小賀是怎麼去做Data Labeling.

小賀: 因為Amy就是那個我的Pimp.

Amy: 對，我是她的Pimp.那個時候他辭職以後他就在找人生的方向。然後我說你這樣都不用繳房貸了嗎?然後我就看到一個Email來找我做Data Labeling.我Traceback，他其實應該是 Scale AI的一個Data Labeling的Job。那我自己是做不了。我就想到小賀！想說小賀可以賺一點零花錢，順便告訴我到底Data Labeling這整個產業是怎麼回事?

Amy: 然後我就把它Forward給小賀。結果小賀就順利的錄取，就去當Data Labeler.

小賀: Amy都Deploy我了。

Amy: 被deploy去做data labeller.

Stella: 但是當時你接到來自於Amy的這個request的時候，你就愉快的去做了？

小賀: 就是我也覺得蠻好奇的嘛。因為好奇的點有幾個啦。第一個是辭完職就是然後就想說想試試看freelance或者是contracting，就是打零工的工作。

小賀: 其實我剛辭職的時候我最想去幹的是送外賣就，因為我前幾年剛學會騎自行車，就很開心，就很想說那我就騎車就送外賣，就是我很想要體驗生活。

小賀: 但是後來發現了，送外賣就是大家，因為是食物嘛，就盯得很緊，就是要你要騎得很快。我覺得很危險就最後還是沒有去。

Stella: 對啊，倫敦送外賣是要騎自行車的。

小賀: 或者是騎摩託嘛，然後我是想騎自行車，但是速度拼不贏人家，就是就算了。

小賀: 然後就是我的心態是這樣，想要去打打零工，然後體驗不同的東西。然後我其實也是好奇啦，就是說嗯， gen ai裡面也是感覺，這個 data quality或者是 data collection就都是一個謎嘛，我覺得就是挺神秘的。我就覺得那就去看一看吧，對，就愉快的接受啊。

小賀: 反正就很簡單，你就把你的 cv 發過去。然後就是真的是感覺就幾秒鐘。就說 ok you are invited to the next stage of qualification.

小賀: 我想說哎，那，那就試試看。

Stella: 那做 data labeling 的?你的僱主是誰呢?是有一個公司嗎?

小賀: 這個就是一個有點也是不明不白的事情，哈哈哈。

Stella: 現在依然是不明不白嗎？

小賀: 對，就是我這個平台叫Remotetasks,對吧，然後它跟Scale AI關系就是其實應該我感覺是一家嘛，但是不知道它到底是有什麼樣的分工。

小賀: Remotetasks這個平台，就是它就是對各種各樣的Data Labeling，其實很多都是圖像。比如說什麼， Scene Understanding,就是一張照片然後要把每個Object的輪廓勾勒清清楚楚，包括 LiDAR Image,Satellite Image,這些很多image labeling，然後在整個Remotetasks裡面他有一個叫 expert community，我後來理解到就是說，他招一些所謂特長的人，就其中就包括像 data scientist，然後還有一些 programmer，各種 programming language還有各種語言嘛，什麼大語種小語種，還有一些什麼 biology 啊，什麼 physics呃，還有像一些關於美國，不同的州的一些當地的法律啊，法案什麼的。都有，就非常細化的不同的domain knowledge的人。

小賀: 說到僱主，為什麼我覺得有點不明不白，就是好像你也沒有真的在簽合同，就是你就只是click,他是有一個term & services，你click on it，就算是相當於簽合同了，然後我也不知道他們知不知道我名字叫什麼，然後你只要給他你的paypal的郵箱，他每週二就準時給你打錢，就好了。

Stella: ok哈哈。

小賀: 哈哈。

Stella: 對這個才是最重要的事情。

小賀: 哈哈哈哈，對，就是第一個星期到週二的時候，我就覺得這個錢真的會到嗎？然後，就真的就到了。然後覺得，哦，ok i guess we're on哈哈哈哈。

Stella: 他給你的工作就是這種task based是嗎?就比如說我給你一個包，然後這個包裡面的就是 data要怎麼label跟你說清楚，然後你就在規定時間內做完，再返還給我就可以了。

小賀: 呃，他是這樣子的，是一個他們的平台，他是計時的。是計算到分鍾。然後他一般一個task就是一個browser,你點進去，然後，他時間一般來說是45分鍾到90分鍾之間，但他那個platform很多，很多bug,所以經常出故障。

小賀: 也不知道他到底是想要時間是多久。應該一般來說，最長時間是90分鍾，然後他就會計時嘛，然後他就是按時收費，跳表，跟打出租一樣。

Stella: 哈哈哈。那每個人的收費標準是完全一樣嗎?還是會有不同啊?

小賀: 他都不一樣，根據不同的職位嘛，而且根據他招人的地點。這個是我在看他們的那個job description裡面，反正我可以講，就data scientist他當時招就是在像美國，英國，加拿大，澳大利亞，什麼這幾個國家，然後他招就是45到1小時，但同樣的工，就是同工，不同酬，同樣的工作。如果你在其他幾個地點，比如說他有很多在拉丁美洲或者是印度或者是菲律賓啊，我記得當時的那個時薪就不一樣，我不記得具體多少，但是就是差蠻多。

Amy: 我想補充一下。就是當初我傳給呃小賀的那個 job description.他就是在找一個專業的data scientist。就是，你不是data scientist,你還沒有辦法去做這個data labeler的工作。

Stella: 對。

Amy: 對，然後時薪也蠻好的，就像他剛才說的。美金四十幾塊是job description直接寫的，那我當時看到覺得說這個零工很高級啊，所以才會把它再轉給小賀。

小賀: 賺賺外快，我覺得還是還不錯。

Amy: 你sign up以後他的qualification process大概是什麼樣子的？他怎麼qualify你真的懂data science，可以做expert labeling.

小賀: 嗯，這個就是當時讓我覺得非常震撼的一個過程。第一個部分，很簡單，就是英語。他考你的英語能力嘛。然後就有點像咱們當時考什麼SAT啊，就是問一些很精細的，比如說什麼逗號，比如說A, B and C逗號，這個地方要不要放逗號，這種很細的語法。就有幾個 multiple choice。

Stella: 我覺得我會fail.

小賀: 你可以試試看。

Amy: 美國人會fail.

小賀: 我可以refer你。對，反正我當時覺得這就是很龜毛的點，我看這些就是讓我想到考SAT的時候，這些知識點 anyway.

小賀: 那個就很短，就是考幾道選擇題，然後完了以後。就考你的data science相關知識了。我記得印象很深刻，他有一個prompt然後底下有兩個answers，然後他讓你來選擇說哪一個answer更好，哪個answer更concise,哪個answer更truthful。他就是有幾個這個打分的標準讓你去選。

小賀: 我記得有一個prompt。假如你是一個data scientist,然後你跟一些e commerce的一些stakeholders們一起開會，然後他們問你k means到底是什麼？他們問你 k means對他們的business來說到底能夠產生什麼樣的價值，你會怎麼回答?

小賀: 然後有兩個answer就是我覺得十之八九啦，應該就是LLM生成的，但是都講得非常好。就是兩個答案都非常好，又詳盡又清晰，然後兩個都有舉例子，use case有哪些，customer segmentation什麼的。還生成一個 Jupyter Notebook，就是展示如何用K Means來解決這個用途。我當時覺得omg，那不就是我之前在那家公司做的表演性質的公司data scientists嗎？

小賀: 讓我覺得當時有點震撼。我就覺得LLM真的要來取代我之前那些寫unit text那些工作，那是肯定應該要取代的，非常簡單重複的工作。

小賀: 但我原來以為說在consulting.你要跟人打交道，你要跟人家，講故事。

Amy: 表演要表演的好。

小賀: 對，我就覺得這部分好像沒有那麼好取代吧？結果LLM那個答案，雖然不是說完美，但是我就覺得比我當時第一家公司，我們面試的很多candidate的回答都好很多，我危機感就衝上頭了。所以那個qualification就是有連續五六道這樣的題，然後還有比如說code,就是讓你選哪一個generate的code更好啊，什麼的。對，就是做題。

Amy: 這其實是RLHF的一個很重要的點，就是你data modeling, data labeling做得好。它是有層次的，就是它不是yes or no。你常常label就會，這兩個其實都不錯，但是你覺得哪一個比較好，然後那個就會變它的data label進去train這個large language models.

Amy: 當兩個東西都相對好的情況下，它能夠判別出哪一個更好，然後用那個去生成更多的文字。它的Label是精細到這個程度的。

小賀: 對，我覺得那個Label的那個信息量就很大嘛，因為它還讓你精確的比較說這兩個各種打分標準，哪一個更好?

Amy: 它是有一個Rubric是不是?

小賀: 對對對就是什麼 Conciseness Truthfulness Relevance Completeness之類的，就有四五項。然後每一項你都要給這兩個打分。它經常換，後來我做的有些Task也有這個嘛，它經常會換它的那個UI。有的時候就讓你給兩個分別打分，就是0到5，有的時候還讓你比較，說哪一個更好。有時候還要你寫Justification,就是說為什麼你覺得 Answer A比Answer B更Relevant.

Stella: 我覺得，對於我來說，這種打分真的很難。我有一個有點搞笑的事要講。

小賀: 你講講。

Stella: 對於這種什麼0-5， 0-10 scale的事情說起來是有點慘了。就是我生小孩的時候，我是就是water broke,就破水了。之後呢就衝去醫院了，然後在醫院就當晚就要入住醫院了。醫院的護士就跟我說這個，你的疼痛級別到4了，你再告訴我。然後我想說4是什麼？他說4是between 0 and 10,就是從0到10.我說我還是不知道4是什麼。他說0就是不疼，10就是非常非常疼，然後我就很崩潰。我還是不知道四是什麼，我就趕緊，趕緊掏出手機google 0-10到底是什麼。就看到有寫網上寫說四是很疼，但是你還是可以有清醒的意識的。但我這個人就是pain tolerance特別高，我算是比較不怕疼的人。所以最後，等我叫護士來的時候，我其實已經到七和八了，就是你知道，如果到太後面你是來不及打epidural的，就是來不及打那個麻藥。有的產婦，她真的錯過這個打麻藥的時間，她就真的得。

Amy: 忍痛。

Stella: 硬生。所以我還好是趕上了。但是就從此以後在工作當中每次別人跟我講，說 from zero to five,然後from zero to ten 你覺得是幾？我都要拿這個故事出來跟他們講。

小賀: 我有一個類似的經驗。我是相反，我的pain tolerance非常低，就是有點drama queen,就是會有點痛，都會覺得很痛。有一次我是肚子很疼，然後就打不是那種急救，算是不是那麼嚴重的急救。他就問我的pain level是多少?

小賀: 然後我也是0到10,我就不會回答。他就說那你現在疼痛程度，你覺得你還可以看電視，就是還可以enjoy watch tv嗎？我說不行啊，然後他們就覺得很嚴重，就直接叫了一輛救護車來，然後我其實就沒有那麼嚴重。救護車來了。我去下樓開門，救護車問我說「病人在哪裡？」，我說「我就是病人」。然後他們就「啊，你怎麼站在這裡?」然後我就說「對不起，我也沒有想要叫這個救護車。可是他問我能不能就是享受看電視的過程?我當時真的覺得不可以。」

Stella: 對啊。我覺得這種打分都非常的subjective。那你在做這個data labeling的時候，他會給你一個reference嗎?我很努力的在把話題扯回。

小賀: 對，我覺得這個打分要簡單一些，因為確實是打分，因為它會有一些description,就是說它有很多training material。給你一些例子，就是0分長什麼樣，5分長什麼樣。你看例子，就覺得打了兩個以後就覺得大差不差，有點感覺。

Stella: 那他再給你就是不同的任務。他會都有這種不同的 training material嗎？

小賀: 有。他經常時不時的給你推送一下新的training material。我覺得他的platform不是做的非常好，然後就是他就是，怎麼講，就是整個這個labeling讓我感受到這個產業和這個公司的作風，就是非常move fast，他們會一直不停的release新的那個 version of the platform。我覺得好像都沒有怎麼經過test，就是經常很buggy.

小賀: 他就release出來，就讓我們這些platform user用。用後你覺得，哎，怎麼出問題了。你就上slack就tag那個project lead，反饋，然後他再改。如果他覺得有夠嚴重或者他非常需要，你趕緊生成很多label的話，他就會很及時的去改，一天他可能會改好幾次。

小賀: 真的非常scrappy。反正我記得蠻清楚有一次我用了那個 platform,那個url裡面都有canary,就是canary deployment,怎麼我就已經在用了？！然後很多很多非常明顯的bug啊。但是他就是move very fast。我label了兩三個月吧，就是感覺日新月異的變化。

Amy: 哈哈哈。

Stella: 嗯，小賀，你可以給我們介紹一下就是具體data labeler的day to day是什麼樣？你每天都是做一些什麼樣的tasks呢？

小賀: 就是沒有day to day啊。 freelance嘛就是哈哈哈。

Amy: 是說你早上起來想說，我今天來label兩下好了，然後你就打開，然後label一兩個小時，就自己clock out,下班了。是這樣嗎?

小賀: 啊，對啊，就很閒散啊。就是我每天醒來以後就就打開label，然後就開始喝咖啡，吃早飯，然後label一下，然後如果天氣不錯，就是一邊吃早餐一邊label，然後如果天氣不錯的時候，那我就出去走一走或者出去騎機車，我就出門了。

小賀: 如果天氣不太好，又沒什麼事，然後就在家label一下，也沒什麼事幹。

小賀: 哈哈哈，就是很閒散，哈哈哈。

Stella: 勉為其難來賺一下錢好了。

小賀: 就是有一點那種感覺，但是我發現其實有的時候也有點上癮。因為就像出租車打表一樣，你就知道每分鐘的時間，然後就是我覺得我有的時候會進入到那種就是，如果我的label比較多啊，一兩天，我就會突然進入到那種停不下來。

小賀: 然後如果，要是，如果要是有事，比如說跟朋友約好出去玩，或者是看電影，然後就要離開我的電腦，不能label,我就覺得非常grumpy,就不想離開這個電腦。

小賀: 這時候我就會覺得ok,這就很像addiction。

Amy: 所以有點gamify這個job.

Stella: 對。

Amy: 讓你有點想要打怪通關的感覺。

小賀: 對對對講到這個。他們真的很認真在搞gamify,但是我一次都沒有趕上這個福利，他有一個mission，會給你什麼一個星期，如果label了三個或者是十個task或者是怎樣，然後他就給你bonus，但是他這個很buggy這個website.所以我一次也沒趕上。

Stella: 哇，聽起來跟小紅書一樣。我好煩這種。

Amy: 拿勳章。

Stella: 對，就各種badge.

小賀: 然後各種。

Stella: 升級。

小賀: 對他就是有升級的。有級別，然後還有什麼global ranking.我不知道global ranking我的ranking是怎樣。反正我當時有跟Amy分享就是，我第一次發現有這個feature的時候是400多名，然後過了一會200多名，就不知道這個到底是怎麼來的。

Stella: global裡大概有多少人，你知道嗎，在用這個平臺的我

小賀: 剛才上了一下他們的網站。我來看一下哈。

Amy: real time在check data。

Stella: 非常真實的聊天。

小賀: Remotasks這個整個網站。他上面寫，他有240k total taskers在90多個國家。

小賀: 但是Remotasks它整個真的是Global Operation，就面很廣。它分出來就是這個Expert Community，叫Outlier,就是小一些。

小賀: 我記得我當時做有一個Projects，我被加到是一個SQL，就是你自己想一個Prompt然後自己再寫SQL Code，自己給自己出題然後自己再做題。你要Come up with this pair.然後當時這個項目我記得是在Slack Channel裡面看到是三四十個人吧。

小賀: 就是比較難一點的Task,

Amy: 其實沒有幾個人全世界。

Stella: 你剛才講的這個Task,它都不是。這還算Data Labeling嗎?我覺得像是在Generate Training Data,是嗎?

小賀: 對對對，我覺得其實就是在Generate Training Data。都叫labeler,他有分級別，就是有attempter,就是你是這種generate的。然後就比如說像SQL,就是你要generate這個text和code.

小賀: 我當時那個項目裡面就attempter做了一會兒，然後就莫名其妙被promote,被promote。這個還是很好笑。就是我當時還以為系統出了bug,因為我平時用的那些button都不見了。然後我就還去slack channel裡面報告。我說哎，因為那段時間platform經常出bug,我就說是不是又出bug了？我那些button都不見了，換了新的button.然後那個人就說「哦，那是因為你，你昨天被promoted,變成reviewer了」。我說「what,哈哈」然後就也沒有人會告訴你這到底是意味著什麼，你到底要幹嘛。你就在platform裡面自己看，「哦，review的意思就是，我現在變成就是別人寫的這個 Question answer」

小賀: 我來打分還蠻明顯的，大部分都是別的用戶，就是別的Labeler,是自己寫的。

小賀: 偶爾會參一些我覺得看上去像AI寫的，但是我不知道是別的Labeler用ChatGPT寫的，還是他們混雜的真的是就是AI寫的，對，就是有各種不同的Task。我覺得他們就是這個 Human Feedback的這個Data Set，他Curate得還蠻仔細的。

小賀: 好像就有Attempter，然後Level 1 Reviewer你可以Accept,你可以Edit it或者是Reject it,然後打分，然後好像還有另外一層的那個Reviewer，我不知道是Peer Review還是怎樣，反正它就有好多層Redundancy吧，來提升他們一些數據的質量。

Stella: 我現在稍微有一點confused.就是說這個平台的一些user，像小賀你們這樣的 data labeler，就是去review或者是去generate data的人，是有公司或者有clients他們有這個需求，然後放到平台上再去distribute給你們？還是說這個平台收集很多這些data然後拿來賣給別人？

小賀: 這個東西，我不知道他們是怎樣，但是因為這個平台背後的，背後。。。說得好像很神秘，哈哈哈哈。好像他這個公司是scale AI嘛。這scale AI他不是跟很多就像open AI啊 anthropic cohere,他們都有合作嘛。我的猜想是，像我知道open AI跟scale AI的那個初期合作是很緊密的嘛，所以我覺得從看新聞，我完全沒有任何inside information.

小賀: 看看新聞感覺是可能是open AI有 requirements for these datasets然後scale AI去收集，然後之後可能scale AI會有些跟別的客戶有合作，至於他是 who came up with the task?這個我就不知道。

Amy: 如果公司去找Scale AI來做這些 task的話，Scale AI它的expertise反而不只是crowd sourcing labeler，它其實也要去設計整個數據標記的operation。

小賀: 對。

Amy: 那在最下層的labeler，這一層可能完全不知道自己在label的這些數據到底會去哪裡做什麼。跟 Amazon Mechanical Turks 也蠻像的。你只是做這些tasks，那他們怎麼去使用，就不幹你的事了。他給你錢的同時你已經sign away你知道這些的權利了。

小賀: 就是這個process。我記得我是去看Scale AI的網站的 blog post.

小賀: 他們的 blog post 寫的還蠻好。他就好有幾篇寫的非常詳細。就他們怎麼樣用各種 peer review, 各種 mechanism 來保證這個數據的human labeling的quality啊，他有很多ranking之類的系統。

小賀: 但是這些東西就是你作為labeler吧，我覺得對我來說，是個文化衝擊吧。就是沒有人跟你有那個閒工夫或者是even bother to explain anything to you。

小賀: 你每天打開那個網站都不一定跟你昨天看到一樣，然後你也不知道發生了什麼，就是這個跟我們原來工作，就是做data scientists or engineers，你在公司受到那種待遇是很不一樣的。在公司大家都會覺得哦，我要跟你解釋context.然後還問你這個幹的開不開心?你知不知道你到底有什麼impact，就哄你開心嘛，對吧。然後這個地方，我覺得讓我看到了，我覺得有點寒心的一點，就是覺得可能世界上很多人的工作都是這樣，他們在工作中都是這樣被對待的吧。

Stella: 會是一個特別容易被 replace或者說完全replaceable的狀態是嗎？

小賀: 對。而且就是我覺得被replace,我覺得倒是大家的工作，大部分人工作都是可以被replace的。

Stella: 就是replace的cost很低是不是?

小賀: 嗯，就是我覺得有點人與人之間的尊重就沒有，因為就是很anonymize嘛，沒有人知道你是誰，你也不知道別人是誰。是一個 distributed global force,哈哈哈，就是很anonymize，那種工作的感覺真的是很不一樣。

Stella: 我還想問小賀，你們label的data,除了剛才你講的，有這種就是自己generate SQL或者是去review SQL，然後有一些text的data，還有什麼不同類型的數據嗎?

小賀: 嗯，有，還有一個Google Cloud Platform的Python SDK。我在那裡面是generate data,它的prompt其實很簡單。你去看那個 Python SDK的documentation,你要生成一些Jupyter Notebook as tutorial to showcase different parts of the documentation或者是API.

小賀: 所以就是相當於你要自己想一個prompt，然後自己寫一個Jupyter Notebook tutorial,然後就是要可以run的，然後就是讓我當時有種感覺哎，這個不就是？

Amy: 不就是你第一個job嗎?

小賀: 對啊，就是，就是要給客戶或者是給人家培訓寫的。就是一樣啊，就是跟本來data scientist的工作本質上是差不多，只不過因為anonymize了，然後就變很trivial.

小賀: 但是原來，會給你可能好幾天或者是好幾個小時，慢慢做的活。現在就是，你自己打表了。

Stella: 這個想想還挺有意思。的就是你以前做雖然說是同類型的活，但你以前做的那個東西其實是一個output，是最終呈現的結果，但是你現在做的，它是一個input，然後要把它變成一個更generic的black box去再生成可以。。。

小賀: 取代我們大家工作的東西。我真的是這種感覺，自己取代自己。

Amy: 就自己給自己出題，自己給自己寫完題，然後還去掉你可以開心的去外面表演的成分，就直接喂到model裡面去做training了。

小賀: 對。對我來說，就是這個打工經驗讓我這種危機感，就是上了一個新台階。

Amy: 那，你有認識別的data labeler嗎?就是你有交到朋友嗎?有什麼其他背景的人在做labeler?

小賀: 我沒有真的認識人，就說說趣事吧。因為Slack Channel裡面就一般沒有人講話，唯一有人講話，就說，我的payment又delay了，就是氣勢洶洶在那裡 Tag ＠product lead, Where is my pay?一般就是這種信息。我當時就覺得「喔，原來是這樣的dynamic」。

小賀: 當時platform經常壞，我就是一個好員工，雖然我都不是人家的員工。我就是在那天天就report bugs.就天天說platform這裏出bug，那裏出bug，描述那個bug。其他label就會底下回復呃，用emoji回復一個「same」，就很多人回覆same,但是沒有別人在report.

小賀: 當時那個project lead，每個slack channel有一個project lead。他們叫task successful manager, TSM。

Stella: 這個tsm也是。就是這個平台上的用戶是嗎?他是怎麼選出來的?

小賀: 這個就很好玩了。他們一般就是都在回答問題。然後當時有一個tsm,就因為我經常反應問題，他就會直接dm我，「are you there, can you huddle?」然後就直接打過來說，你可以給我看看，你可以share screen給我?或者是給我描述一下你說的那個問題到底是什麼?然後他就做筆記，做筆記，做完筆記，他就說ok,我會report給team.

小賀: 有一次我們就用huddle嘛。然後他打過來，我們就聊了一會兒，我就說你是怎麼樣，就是how did you end up here?我說你的employer到底是誰?他說我也不知道。哈哈哈哈。

Amy: 你講how did you end up here?聽起來也太奇怪了吧。

小賀: 哈哈哈哈。

Stella: 感覺是在監獄裡面大家會互相問這個

Amy: 在監獄或在妓院聽到的對話。

小賀: 哈哈，我就是被我的pimp Amy拉過來的。

小賀: 我就想說，你怎麼開始做這個的?好啦，不說end up here,可能沒有問的那麼難聽。

小賀: 然後那個女生是個西班牙女生。她就給我rant了很久，打過來說 oh my god I don't know what's going on。她說就是每天開會，也不知道是誰，就是感覺好像大家都不知道在幹嘛。她說她是先開始做，就是好像是做 Spanish language的那個 labeling.她說打打零工。結果打著，打著，就有人問她，妳要不要做那個 community manager什麼的。她就說那行吧，就開始做。

小賀: 然後我就說那妳的employer是scale還是Remotasks。她說我也沒有什麼employer也就是每個星期paypal拿錢就是了，反正就是一個這樣子的糊裡糊塗的組織，我覺得。

Stella: 那小賀，你覺得就是做 data labeling的人。他需要的核心競爭力是什麼？就，他有核心競爭力這個說法嗎？對於這一行?

小賀: 我覺得這個有點大詞，哈哈哈，我也說不清楚，可能是我對這個行業還沒有那麼了解。

小賀: 然後我覺得你叫這個為一個行業，我覺得也有一點點，嗯，不能說誇張吧，就是有點。。

Amy: 有點像是你可以去當送外賣的 delivery man，可是你又沒有辦法去變成設計整套 delivery system的人，就很難嘛。你再怎麼升，你可能升到operation manager就像那個西班牙女生一樣，但是你不會再上去了。所以你的競爭力就到那裡的天花板了。

小賀: 我不知道欸。因為我覺得大家去幹那個都不是為了career progression，我也看到很多，就是看起來挺心酸的故事，就是在那個channel裡面很多人都會說哎呀，怎麼沒有我的task?或者是說我的pay delay了，我還等著這個pay bill呢什麼的。就是說的挺心酸，就很焦急，讓我也是意識到這個gig economy就是順風順水的時候是蠻爽的，你就喝著咖啡，反正寫寫code或者看一看code,你就賺點零花錢，好像很方便，他項目task很多的時候，你就覺得你想什麼時候幹，就什麼時候幹，想幹多少，幹多少，就很爽。

小賀: 但是它完全不predictable啊。根本上來說，你跟這個公司之間沒有任何的 promise,沒有任何的那個期待嘛。就是它有project給你，你就可以幹，有收入。或者像我今年其實都沒有在做，因為我那個platform出了一個bug,我的earning rate變成了1 dollar per hour,然後我就一直在raise ticket或者是tag那個task success manager說這個出bug。他就說哦，出bug,我幫你看一下。然後就一直也沒什麼解決。反正一直在出問題。

小賀: 所以就是說你不能靠這個嘛。所以我覺得，如果把它當career就是在這個setup下，我覺得應該不會有多少人在想怎麼樣在這裡爬梯子。這沒什麼梯子可以爬。

Amy: 那我知道小賀Label的很認真。那怎樣會被Fire?

小賀: 欸對！我自己Label的時候沒有意識到我Label有多認真，直到我被Promote當Reviewer，我看到別人寫了。我想說天啊，你寫的這是什麼鬼。就是很多人會，寫的SQL Code根本就不Run,他就Submit。我覺得真的是比較沒有底線。或者重複率很高，或者就是不夠Creative。

Amy: 寫SQL,還要Creative？

小賀: 哇，我覺得，唉，我現在覺得平心而論，我當時寫的真的蠻Creative, 因為你要它那個data set,然後你要編一個use case嘛。我要研究這個跟這個之間的區別，然後它會給你complexity level的requirement，如果是hard的話，那它給的例子其實是很複雜的，就是那個SQL code寫，就很複雜那個logic，你要make sense,然後就很多人很偷懶嘛，就總是寫那個what's the name of the football player with number x，然後這種就reject.

小賀: 哈哈哈，太偷懶。

Stella: labeler寫出來的東西，或者說labeler generate的data被reject的很多的話，會相應的adjust。。？

小賀: 他們會被kick out of the platform。

Stella: 哦，我還以為說是會，就是比如說把他的rate調低一點，是會直接被踢出這樣。

小賀: 沒有啦，就沒有人有時間跟你adjust這個東西或者是給你pip什麼的，就直接把你踢掉就好了。就不認真幹活。

Amy: 你create dirty data，不如create no data,不是嗎?

小賀: 對啊，所以我覺得如果你consistently 經常被 reject 的話，就是說明這個人做事不認真或者是不行，然後就不要你了，哈哈哈哈。

小賀: 然後關鍵，他都不會給你 feedback的。因為他很多東西有 delay 嘛，如果 reviewer 不夠多的話，你可能一開始就半天你就寫了很多 attempt, 你都不知道錯在哪裡。然後突然，有個 reviewer，比如說像我，聖誕節的時候就很無聊，然後就 review 了很多，就 bulk review 了很多，然後就有很多又是 reject。現在想想，可能第二天那個人突然發現他的 acceptance rate 很低，然後可能低於哪個 threshold以後，反正他也不會有 warning,你就打不開那個 browser,因為很多人在 slack channel 裡面 moan 說我不知道為什麼突然就說我的質量太低，然後就不讓我做 task.

Stella: 是因為小賀 bulk review 了。

小賀: 哈哈哈哈，哎呦，我應該也不是唯一一個啦，不能全怪我。

Amy: 哇，讓你們自己去對自己負責。好可怕。

小賀: 對，就是很 brutal 嘛。

Amy: 確實對。那這樣收入其實也不會穩定欸，因為像小賀 label 的 task 可能是還比較 expert level 的，人沒有那麼多。如果你 label 的東西像是普通的 language task,是不是收入不會穩定，因為可能會 run out of task to label。時薪大概多少啊？你知道嗎?

小賀: 別的工作啊，我不知道，但是我們可以看，要在線看嗎?我有個印象啦，就是上次我有看一張 job description.就是很多，就是二三十刀一個小時吧大概。

Amy: 那也不錯也。

Stella: 不差啊。

小賀: 我覺得不差，但是就像你說的，就是很不穩定嘛，就包括SQL那個項目就已經結束。他可能目前不需要更多data.然後我覺得其實主要是，你每個人有你會的skills,對吧?但是他要把你move on to another project，他就需要一個operation cost.

小賀: 他會在channel問，誰會幹這個？他就一般效率都很低。所以每天都看到那個TSM在channel裡面。「哦，今天我們沒有SQL了。今天需要mongodb的，誰會你就DM我」。可能不知道過幾天可以把你move on to that project.

小賀: 完全沒有穩定性了。有的時候他platform down或者是他就在更新系統什麼，就幾天都沒有，所以你不能指望他。

Stella: 你剛才說的時候我腦袋裡面有畫面。我以前看過一個紀錄片還是什麼的，就是關於橫店的臨時演員。

小賀: 嗯，對對對。

Stella: 對。每天早上很早的時候去等著看有沒有工作，然後就有那種選角導演來說我今天要找什麼什麼樣的，然後你們滿足要求的舉手。然後沒有舉手的人都走掉。

小賀: 其他人都回去了。對對，完全就是這樣感覺。就是群眾演員嘛，真的是這種感覺。

Stella: 那小賀，你覺得，如果以後你找到了一份穩定的full time job,你還會把data labeling當做一個side hustle來做嗎?

小賀: 我覺得時不時的我會去看一看啦，我覺得第一個是說，如果他platform穩定，他把我的時薪調回，45刀的話，有的時候做做還是不錯啊，賺點零花錢。

小賀: 我覺得主要是feedback loop很快，那種爽的感覺。就是你每天做計時，然後你就可以看得到他會告訴你這個是多少錢，然後第二週週二，你就準時收到。

小賀: 這個feedback loop快，比原來收工資還要爽哈哈哈，就是對，這是第一個。

小賀: 第二個我覺得我也好奇這個field,到底這個日新月異的變化會發展到什麼程度。他們在需要收集什麼樣的數據？發展到什麼程度？我覺得就是好奇。我也會時不時去看一看。

Amy: 我覺得在裡面應該可以看到很多苗頭。

小賀: 對，我覺得會啊，因為就可以看得到他包括那個LLM生產的東西的quality什麼的。還有包括就是他那些topic,他的scale AI的客戶們在想要fine tune的是什麼。還蠻有意思的。

Stella: 或是小賀又開始label某一種data，跟data science相關的，就說明data science的這一塊可能又要被automate了。

小賀: 我覺得反正。。。

Amy: 她不是說已經差不多了嗎?

小賀: 已經知道了我覺得。所以這個讓我現在去找工作，就是有一種，你知道嗎。就是感覺好像有點像去date,但是你覺得看不到長遠的未來的那種感覺。

Stella: 哦。 ok，以你自己data science的背景，你覺得還有什麼樣的工作是可能會有稍微長遠一點的未來的嗎?

小賀: 嗯，這是我的危機，因為我原來做data scientist就算就是做modeling偏多的嘛，就是machine learning什麼的。

小賀: 然後我覺得就在LLM開始之前，就已經有很多AutoML的一些工具嘛，就已經讓我覺得，那我之前熟悉的那些code就都不用了，就直接塞AutoML就好。

小賀: 所以我的感覺是，可以做的ML好像越來越少，因為現在真的AI，大家都去做，可是我的印象哈，是感覺，嗯，除了在OpenAI的那些精英們，其他大部分人，你可能需要就是Plug in API，對吧，都做integration。那很多公司就直接去找software engineer.

小賀: 如果他們只招一個人，他就招software engineer,就integrate API就好了。那你能做的機會是越來越少嘛。所以，對，就是感覺不知道新的skillset到底在哪裡。

Amy: 那現在英國的Data scientist的就業市場怎麼樣？跟美國一樣，比較差嗎?

小賀: 嗯，我也沒有看那些新聞或者是數據回答你的問題。我只能從我這個小的data point傾向進來，因為我今年就有去面試一些full time job嘛。我覺得聽起來就是沒有像美國那麼嚴峻。因為我還有很多open positions，然後從linkedin上看到，我不知道這個數據可不可靠啊，就是已經申請的人數來說，也就還好，一般就幾十個，最多有名一點的公司，上百就不錯了，就好像沒有像聽到的美國那些公司那麼嚴峻。

小賀: 但是我覺得從我自己為數不多的，就是跳槽找工作經驗來說，確實不像可能兩，三年前或者是四五年前，就感覺自己可以當princess。現在要平和心態，大家來互相挑一挑。之前真的是感覺，好像大家都覺得你promising，可以趕緊來我們公司。可能我原來也很幸運，就好像怎麼面大家都覺得你來你來，現在就覺得，我們還有別人。可能還是有些落差。

小賀: 但是從數據和周圍朋友找工作的感覺，也還好，沒有那麼人人自危的感覺。

小賀: 然後我也沒有真的認識人，就在英國，data scientist被layoff的，也沒有聽過。

Stella: 是不是也因為英國或者是歐洲的公司， mass layoff沒有那麼容易啊。

小賀: 我覺得法律上肯定有差，但是還有一點。嗯，我覺得在英國或者歐洲啦，我們工程師， Data scientist,你也知道，就是工資比跟美國完全不能比嘛。

小賀: 所以我第二個公司是美國公司，就是蠻明顯的就是同工不同酬啊，我看到一個趨勢，可能不少美國公司為了降低成本吧，就可能一些工程師會去加拿大歐洲招嘛。感覺自己在王婆賣瓜，自賣自誇，但是我有點物美價廉的工程師的感覺。

Amy: 我想給聽眾朋友一點perspective，你從你的角度來講，美國的Data scientist同工不同酬，他的薪水大概會是英國的幾倍。

Amy: 不要講倍，就是，多多少？

小賀: 對對對就會幾倍。

Amy: 啊，會幾倍？

小賀: 幾倍對。具體看看情況，但是從我anecdotal和一些就是偶爾看到的data point是兩三倍的差不多。

Amy: 那在英國請一個組，一個data science team.當然非常的合算啊。他可能兩三倍的薪水可以省掉，然後也都講英文，那時差，因為我之前去英國待過，然後時差也都可以work around，還蠻簡單的。那對美國公司來說算是一個蠻好的選擇。

Stella: 嗯，但是我也是有聽過另外一面的看法是覺得歐洲和英國的employees他的福利會比較好。所以其實公司的成本在福利這方面的成本會很大。最近美國公司的這個tech layoffs他如果是要lay off歐洲的員工的話會難很多。

Stella: 所以也是有看到有一些美國的Tech公司，他可能接下來會不太敢在歐洲再招那麼多員工了。

小賀: 對對對。我覺得在歐洲其實主要就是lay off比較難。我們notice period什麼都是兩三個月嘛，就是你辭完職以後，你還要幹兩三個月。或者是公司要開你，你也可以要兩三個月，一般都是這樣。所以開除會難一些。

Stella: 要麼是高福利，要麼就是高風險，是吧?

小賀: 但是美國的Tech公司前幾年為了增強Talent，福利都捲得很厲害嘛。我覺得在歐洲的公司除了假期多一些嘛，法定假期多一些和難被開以外，其實別的福利競爭力也是沒有美國那些Tech公司給的那麼大方的。

Amy: 我個人認識的人。我覺得歐洲的人，他打工的心態也比較好。比較是比較好的員工。

Stella: 哦，是嗎。

Amy: 他工作會比較就是當作工作來做吧。因為engineer data science,類似工作在美國，他可能有點被捧的比較高。大家可能覺得自己的選擇會比較多，因為前幾年的關係嘛。但是歐洲這個氣氛就比較還好。大家就覺得，這就是我的一份工作，那待遇就是這樣，差不多，心態會比較平常一點。

Stella: 不太會像，比如說典型的傳說中灣區很多人，他可能會就是會有這種焦慮感，說我要去待遇更好的公司，會一直要想跳槽的這種狀態是嗎?

小賀: 我覺得歐洲，因為我覺得跟稅高啊，還有大家可能工作就覺得就是一份工作嘛，反正就好好幹就好。然後比如說像這個side hustle啊，或者是gig economy,這個概念，我覺得大家心態就不一樣。

小賀: 比如說我做這個 Labeling,做這些Hustle嘛。我跟我這邊的朋友們講，他們都覺得哇好新鮮，就想聽八卦，可是沒有一個人會覺得，也不叫沒有一個人啦，就是好像沒有人說「哎，那，我也想去賺這個外快」。就是大家都覺得哇，還挺好玩的，那種Hustle的心態就不是很明顯吧，不管是哪個方面。

Stella: 我要問你一個跟data labeling沒有關系的問題。

小賀: 哦 ok。

Stella: 小賀，你是Amy很多年的朋友嘛，在你眼中Amy是一個什麼樣的人呢?

小賀: Amy是個很會hustle的人。哈哈哈，好啦，沒有，就是Amy是一個非常神奇的人。

Stella: 怎麼說?

小賀: 我不知道怎麼講，就是她是個非常original的人。我覺得就是我們認識10年了吧，Amy，大概有超過10年。

Amy: 有差不多10年。

小賀: 超過了10年，就是很了解。但是Amy的很多點子就是每次我跟她打電話就覺得你怎麼會來幹這個？就是個非常有趣好奇心非常強，然後執行力非常強，然後很愛工作，很愛創作的人。她有很多hobby,聽眾朋友們。

小賀: 我們讀大學的時候她就開始收集那個 Starbucks的那個 You are here, version 2是吧？那個V2的，那個 V2的那個Mugs,就是城市杯嘛。

Stella: 嗯。

小賀: 她超認真。我們當時大學的時候，我們是室友嘛。我們share一個房間。

小賀: 她有一個床，我有一個很小的床墊擺在地上，然後旁邊一整面牆都是Amy收集的杯子，哈哈哈。

小賀: 她還會就是跟世界各地的杯友們trade，就是那些不同的杯子。然後還會炒作就是因為每個杯子的那個，因為supply and demand不一樣，就是價格不一樣。

小賀: 然後我記得當時就覺得印象很深。她會因為台灣的杯子好像在世界市場上流通就是還蠻稀缺的吧。就是他就會從台灣還recruit他媽媽去坐火車，不同城市收杯子，收杯子以後都寄過來。

小賀: 他還給他媽拍視頻說，怎樣包那些杯子寄到美國。然後他就在網上賣什麼，拿兩個，換一個什麼非常稀缺的加拿大某個地方的杯子啊。

小賀: 當時我就覺得欸，你真的好厲害。現在還依然覺得。

Amy: 我媽的櫃子裡還有幾百個杯子。

小賀: 哇，你超多杯子，真的。所以，聽眾朋友們，如果你們當地有什麼， You are here那個Starbucks的杯子，你要表達對這個節目的喜愛，可以寄。

Amy: 我老公跟我媽聽到這個會很惶恐。不要再寄更多杯子了，不要再寄了。

小賀: Amy有很多很多趣事和feature。很難概括的一個人。我覺得非常 infinite.

Amy: 我那時候愛蒐集這個杯子，喜歡到我那時候去第一個工作上班，我們聖誕節交換禮物。我們公司的CTO去eBay上標了一個兩百多塊的杯子送給我。因為那個杯子一出，一發行以後，他印錯了，production error，所以就賣兩天就不賣了。然後全世界的杯友就瘋了一樣。我就要那個印錯的！然後我的CTO就去eBay上標過來送給我。

Amy: 我一開始打開，我還沒有發現。我就想這就是那個三十塊的那一個。結果他說再看清楚一點，原來我CTO去爬forum發現就是這一個最貴，他去標了那個v1的給我。他說你看，這個是有mistake的那一個。

小賀: 好感人。

Amy: 我們今天很開心，小賀來跟我們聊天，給大家介紹Data Labeling,這個神秘的產業。大家要是有興趣也可以去報名。賺一點外快。我覺得還不錯。

小賀: 嗯。

Amy: 去體驗一下。算是體驗一下LLM背後的生活。

小賀: 廚房小妹的生活。

Amy: 廚房小妹的生活。對，要怎樣願意從本來是主廚到，我想去做做看廚房小妹的工作。其實心態要非常好的人才能做到這樣的事情。

小賀: 但是我覺得他也是一個 Humbling experience。我覺得是挺有意義的事情。我們這些工程師Data Scientist平時，我覺得是在整個社會中比較，我們是被寵壞的人啦。所以我覺得要去接接地氣啦。

Amy: 那今天我們就聊到這裡，大家拜拜。

小賀: 拜拜。

StellaxAmy·自定義 (原「數據女孩的中年危機」)

Discussion about this post

Ready for more?