資料科學家大維、辰禧:「資料科學最吸引我們的,是它的商業影響力。」

全文

大數據(Big data)、人工智慧(Artificial Intelligence)、機器學習(Machine Learning)等名詞你一定聽過,這些資料科學的技術正如火如荼地改變各個行業的運作模式。除了資料科學家(Data Scientist)或資料分析師(Data Analyst)需要資料分析的能力外,愈來愈多的產業將資料分析的能力列入職位需求,比如說:產品經理、行銷分析師、甚至是負責制定商業目標的經理人等。

也因為看到資料分析人才的供不應求,繼《R語言和商業分析-洞悉商業世界中的資料科學》及 《R語言和文字探勘 - 洞悉巨量文字的商業價值》兩門課後,大維與辰禧又攜手帶來兼具策略性思考的《產品數據分析 - 打造網路產品的決策引擎》。

資料科學:透過分析數據創造商業影響力

大維,又稱大鼻,大學主修計量金融,研究所主修統計,曾任職於全球知名的數據分析顧問公司 APT(Applied Predictive Technologies,於 2015 被 Mastercard 併購)及在新創 Migo.tv 擔任 Data Lead,現於哈佛商學院攻讀量化行銷博士。

而辰禧畢業於企管系,在研究所時因其對資料分析濃烈的興趣開始大量自學關於資料分析的一切,目前於 PayPal 擔任資料分析師。

IMG_4445

資料科學吸引兩位的地方有異曲同工之妙。對大維來說,在大四那年接觸到資料探勘,實際與企業有連結後,他才意識到原來自己喜歡的數學與統計除了學術以外,是可以幫助企業解決問題並發揮影響力的。對辰禧來說,資料科學最吸引人的地方也同樣是那份商業影響力,辰禧提到:「如果今天你在數據導向的公司工作,那麼資料科學團隊在公司裡面往往相當有份量,而且公司做決策時也非常重視資料分析人員的意見。」

除此之外,隨著擔任資料科學家的經歷漸長,大維發現資料科學家不僅需具備專業上的深度,接觸問題的廣度也會越來越廣,除了專注在技術層面外,釐清商業目標、將目標轉換成資料科學問題、然後排序出優先順序,變得越來越重要。當業務端開需求時,經常會直接說出他們認定的問題與期待的解決方案,但其實這都需要仔細討論、觀察,才有辦法判斷真正重要的問題是什麼。

大維舉例,有的企業會想要進行敏捷改革 (Agile Transformation),來更快速的推行行銷活動並進行優化,但深度討論後發現:問題其實不在流程設計,而是需要一個決策系統或衡量方式,幫助行銷團隊更有效與快速低分析活動成效。這時候需要交付的解決方案,就不會是進行敏捷開發的訓練,而是做出一個分析產品,使行銷團隊能更快速地分析活動成效,並辨認出可以優化的機會點。

定義完分析問題後,辰禧更進一步討論到了專案的執行面,並將分別討論短期小型、長期大型專案的相關經驗。小型專案通常是是根據現在執行活動,或特定事件的現況,進行的一次性數據分析。在進行分析前要確認好商業目標,分析完成後的報告和郵件也要特別注意結論是否有回答到需求方提出的商業問題,並提出行動清單與可行性分析

如果今天專案的範疇更大,且有不同的需求方與開發團隊參與其中時,除了分析,更需要一定程度的演算法開發與自動化流程設計。這也代表著,除了分析方法外,更需要將「商業流程」轉換成「資料產品」(Data Products),因此事前需要更謹慎地評估效益及風險,同時也要估算專案需要的資源,包括:資料內容與品質、模型和演算法設計、研究和開發時程等。最後在上線之前,也得先以不同規模的資料量進行測試,確認成效與品管分析後,才會將資料產品上線。

「許多人可能以為資料科學家就是埋頭分析資料而已,但一遇到大型專案時,團隊溝通及合作的能力也是十分重要的。」

利用資料學解決重要商業問題的標竿企業

對於辰禧來說, PayPal 及 Airbnb 是利用「數據分析」解決重大問題的典範企業。

「我認為這兩家公司最有價值的地方,是在於他們都運用科技幫助人們解決持續存在問題,所謂的『信任』問題。」

PayPal 作為一個支付平台,讓素昧平生的買賣家願意互相信任,進行商品服務與金錢的交易,並解決中間可能產生的問題。Airbnb 則是要住進陌生人家裡,或是要接受陌生人來家裡住。這兩家公司皆運用數據分析讓使用者更願意提供回饋及分享自身的經驗,最後讓「信任」變成產品發展的核心,各自成為了該領域中產品體驗最好的公司。

「除了實現商業目標外,又能實際解決人們的問題,這對我來說是最兩全其美的事情,而資料科學現在已經成為達成這種境界不可或缺的技術了!」

談及數據導向公司獲得商業成功案例,大維與我們分享在這件事情上做得很好的 Netflix。

「他們解決了一個很重要的問題,就是『內容』跟『使用者』之間的媒合。像我連自己想要看什麼電影都不知道,但 Netflix 總是可以推薦我沒有想過自己會愛看的——他們投入非常大的資源在做個人化推薦的演算法。」

同時,Netflix 也有龐大的使用者觀看紀錄,透過分析這些資料,將能分析出更多使用者偏好的重要資訊,比如說:什麼情節會吸引最多人來看,哪位導演與演員的組合會更吸引某個市場的人,到場景該如何設定等等。此外,Netflix 也常常可以很精細的預測它的受歡迎程度,並從成本預測、流程控管到全球化製片,Netflix 都是用資料科學的方法在解決許多商業問題。

「我可以想見像他們能夠做到這種程度,一定投入了大量的資源與成本,能做到這一步,真的要佩服他們領導人的遠見,以及資料科學團隊的規劃與執行能力。」

具備策略規劃與執行能力,並快速學習成長的職業

IMG_4562

當一名優秀的資料科學家,最困難的地方是什麼?大維提到:「我認為比較困難的地方是,資料科學家需要具備策略思維,但也要非常注重執行上的細節。」辰禧也接著談到:「資料科學專案的整個流程比較複雜,所以需要有綜觀全局的視角,同時也要具備規劃執行的能力。」

策略思維與綜觀全局指的是:在執行一個專案時,需要不斷思考「這個專案對公司有什麼幫助 」—— 我們在解決的問題對公司來說重要嗎?今天 C-level 的老闆來問你,你能夠短時間讓他了解這個專案的策略價值嗎?而細節與規劃執行指的是:提出可行的解決辦法,並能夠規劃執行細節,包含:資料搜集與處理、模型建立與測試、上線營運與品質控管等,都需要有通盤考量。

此外,在專案執行的過程中,也會需要與不同職責的同事合作,包括:資料工程師、軟體工程師、產品經理、業務部門分析師等,因為合作對象廣,所以需要練習不同溝通方式及了解各領域的語言,以他們的語言來傳遞出你的想法。此外,如果有機會做到不同領域的專案,快速掌握該領域的專業知識也是非常重要的能力。

因此,大維與辰禧認為成功的資料專業人員,通常得具備很強的學習動機與能力,在自己的領域深耕,建立資料科學的執行力,並持續學習專業領域的新技術,才能更好地完成任務。同時,因為專案需求,也要保持開放的心態,學習不同領域的專業知識與溝通方法,才能更好的與不同類型的人合作,真正創造商業影響力。

先意識到要解決什麼問題,再決定要學習使用什麼工具

因為資料科學是個快速發展、不斷進步的領域,而且同時資料科學家也需要根據專案學習不同領域的知識,因此「自學與進修」是資料科學從業人員發展上非常重要的議題。在這裡,大維針對學習給予了建議:審慎且誠實的評估你有多少時間可以學習、找到有經驗的前輩詢問學習路徑、以及先釐清學習想達成的目標,再去想要學什麼內容。

大部分的人一開始會訂立比較積極的目標,譬如說半個月內要上完《R語言和商業分析-洞悉商業世界中的資料科學》課程,有時會忽略了自己陪伴家人與朋友的時間,或是突然其來的加班等因素,最後因為沒有達成目標感到挫折,反而放棄了上完課的初衷。所以,客觀衡量自己擁有的時間再去安排學習計畫,可以幫助你更容易達成學習目表。

另外一個達成學習目標很重要的影響因素,就是學習的效率。當我對一個領域沒經驗又有興趣的時候,大維建議先去諮詢那個領域比較有經驗的人,了解他們的學習歷程與推薦的學習資源等,這樣可以大幅減少胡亂探索的時間,找出更有效率的學習方法。

最後也是最重要的議題,就是「學完了要用在哪裡」。透過自學轉職到資料科學領域的辰禧分享,剛開始學習時,自己也時常一股腦衝去學一些程式語言或技術,但回頭過來反思會有點扼腕,當初為何不多花點時間想清楚為什麼而學,這樣會能夠更有效地學習。辰禧老師提到:

目標明確還是最重要的,學習方法不好頂多花的時間比別人長,那你終究會走完,目標不明確的話,很容易就半途而廢。」

此外,「做線上課程」也是一個自我學習的好方法。開課通常會有很明確的目標與時間,同時在把知識轉化成課程的過程中,會強迫自己不斷反思過的累積,如果有些不夠清楚的地方,也會有機會重新思考與釐清,真正內化這些主動或被動吸收的知識。

產品數據分析:一門告訴你「問題是什麼」的思考課

對於想想學資料科學的人,兩位老師特別想提醒:不要掉入「工欲善其事,必些利其器」的誤區。大維比喻,這就像有個人突然想學攝影,但卻連攝影的基本概念、構圖與光影的原則、以及拍攝的主體是什麼都不清楚,就衝去買了一台最高級的相機,最後很可能變成:拍的照片還沒有用 iPhone 拍的好看、或是相機買了就放在櫃子裡再也沒有用。

IMG_4531-1

「與其一開始就跳進學很厲害的工具,知道這個工具能拿來解決什麼問題比較重要。因此我們才會開設《產品數據分析 - 打造網路產品的決策引擎》這門吃力但不一定很討好的課程。」

有感於目前資料科學的課程大多偏重在程式教學,能夠同時具備「廣度」與「深度」、清楚定義問題並討論數據分析解決方法的課程少之又少。大維與辰禧花了半年以上的時間規劃、設計這門課程,希望這門課程能夠幫助同學了解產品領域的重要問題以及可以使用的工具,除了學習知識,也更能夠幫助同學規劃下一步的學習目標。因此,特別推薦對於網路產品跟數據分析有興趣的朋友來上這門「見樹也見林」的產品數據分析課,了解資料科學如何幫助產品公司解決重大的商業問題。

想更暸解為何擁有億級使用者的跨國企業,到成長強勁的新創團隊,都需要透過使用者資料分析,來改善產品與商業決策的品質,這堂《產品數據分析 - 打造網路產品的決策引擎》總結了兩位老師過去協助跨國企業進行數據分析的經驗,結合「假說思考」、「產品策略」與「數據分析技巧」,幫助你釐清與定義產品問題,辨認有策略意義的相關數據,快來 Hahow 上課吧!

採訪、撰稿編輯:Lika

--

延伸閱讀:

留言