Sitemap

Business Analyst 職能要具備什麼?

10 min readApr 25, 2020

--

最近收到潛在客戶需求,需要協助組建數據分析團隊,由於團隊要處理的項目夠大,可支配足夠人數,職能要包含 Business Analyst (商業分析師)、Data Scientist (資料科學家)、Data Engineer(資料工程師)。

我開始思考哪裡有這樣的人才,這樣的人才需具備怎樣的經歷?

我自己是從社群分析起家,試圖獨當一面可解決客戶問題,拆解客戶問題,變成一個個數據分析的小題目,整合內外數據,洞察需求。

剛好這次面對的客戶有龐大的交易資料庫,如銀行、支付與電商都是有類似條件,他們希望開拓新業務、新異業合作、強化行銷的執行效率。如果要投入於銀行、支付與電商的 Business Analyst,需要有一定程度的:

(1) Domain Knowledge:

一個在外頭看熱鬧的 Business Analyst,要想像出一個企業在營運的過程中會收集到哪些資料(簡單來說是逆向工程),以及在有限的時間內”自主”從外部(包含自行Google)找到參考數據。從參考數據報告推測該企業的資料庫有哪些資料欄位才有辦法達到此報告內容。在研讀報告的過程中,對於不熟的產業關鍵詞必須馬上大概1–2週內熟記。

根據我的經驗,如果全部透過 Wikipedia 來學習,一天至少要看10–15個 Wikipedia 頁面,清楚這個詞的來龍去脈與使用契機,也就是說2週大概能惡補 100 — 150個關鍵字。平常沒有養成自己從網路上搜尋知識的習慣,幾乎無法勝任此職務。如果只光靠惡補關鍵字,只能變成騙子,還不夠成為專家,因此實務上還是得看個人人格是否有自我學習的習慣。

實務上能信手捻來各種分析方法的人,是對方法的熟悉;能夠把每一個關鍵字講出好故事的,是內化 Domain Knowledge 的成果。因為體悟夠深,才更能體會出這個產業的機會,當隨著個人接觸的領域夠廣泛,加上對於這個世界充滿好奇心,才能找到更多有意義的產業結合機會。當一個人經驗累積夠深,才能夠抓出每一個結合點的優勢,用個人執行經驗作為背書,提分析案時不會在會議桌上被打槍。

呈現 Domain Knowledge 除了學歷,剩下就是靠過往撰寫的文章與投影片持續寫作對於個人知識累積是有幫助的。

何謂個人接觸的領域夠廣泛呢?

在單位時間,能快速抓到文章重點,推測這個作者欲表達的目的;以及平日有固定獲得大量新知的方式,像是專業媒體、各種平台的 Newsletter。當然個人的記憶要夠好,否則書到用時方恨少,推測是個人專注力不夠,以至於專業內容記不起來。坦白說,專注力與環境、基因有關,受限於個體上的生理限制。

(2) 數感:

a.對量體的敏銳度:

以數學來說偏向於估算能力,舉例,

現在您的皮包內有多少現金?

如要明確說明「會收集到哪些資料」,除了對於資料欄位要有明確認知,包含數據規模要有明確的想像,舉例來說:交易數量共 200億筆,假設每筆資料包含 交易ID、交易時間、交易金額、執行交易的買賣雙方資訊共 100Bytes,因此資料庫至少需要 20,000,000,000 * 100 = 2,000,000,000,000 Bytes = 2,000,000,000 KB,約等於 2,000,000 MB,約等於 2,000 GB,約小於 2TB。

如果您平常要接觸大數據,看位數要快一點喔。

b. 對執行時間長度的敏銳度高:

現在做數據分析越來越難擺脫大數據的挑戰,先不論資料源源不絕收集,光是在有效的時間處理完數據就是一個門檻,主管或客戶在詢問:

您這個專案預估要花多久時間完成?

雖然每一個專案可能是獨一無二,然而在聆聽專案的描述時,是否有辦法結合過去的執行經驗,將專案在腦海中拆解,將每一個小執行項目拿過去執行經驗做比較,可以大幅收斂不確定性。因此一個有經驗的分析師,是對於案子所需要的執行時間掌握度高,對客戶能回報精準的執行時間範圍。舉例來說,一開始執行時間需要 7–14 個工作天,隨著經驗累積,以及導入高效率的工具,變成 5–6 個工作天。

透過一次次經驗累積,客戶對於您的執行力會更放心。

(3) 對於過往執行順序關係暸若指掌:

自己曾經做過哪些事,已經彼此因果關係與先後順序是清楚的。有兩個層面,當在提案時,能夠把過往執行經驗滔滔不絕像是講故事般,把其背後脈絡有效串聯,讓分析成果更有解釋性,看見智慧在您身上的疊加。

另外是執行新專案的過程中,記得自己踩過什麼雷,能夠快速繞過一些小地雷,讓執行時得心應手。

透過上述圖片說明,心目中 Business Analyst 有 Data 變成 Information 的實戰能力,具備吸收特定 Knowledge 的能力,最後主要的職責是把 Insight 呈現出來。

(4) 執行能力:

學習能力:

數據分析要會統計學嗎?什麼叫做合格的學習者?以我在研究所被訓練的經驗分享,當你遇到相關領域的期刊論文時,文章不懂的字是要有辦法很快理解,後續要用的時候可以以相關關鍵字找到應用方法。

同理,數據分析要會 ___ 嗎?什麼叫做合格的學習者?以我在研究所的學習經驗分享,當你接觸相關領域的期刊論文時,文章中不懂的詞彙要有辦法理解,後續懂的應用。

一個戰場有多少時間等候您學習呢?

運氣留給準備好得人,那樣的人才本來就懂基礎OO學,而上戰場時有能力接觸到進階OO學,因此在解決問題時,有好的條件以機會成本較低的執行方案完成目標。

基礎能力:

(a) 視覺化資訊的能力:非常熟悉 Excel 基礎圖表運用方式與運用情境,更進階來說對於 Financial Times 的 Visual Vocabulary 圖表選擇能力,再者當有需求需要繪製圖表時,以有能力在有限時間內針對上述所有圖種找到產生器。以目前常聽到的 Excel、Data Studio、Tableau、Microsoft Power BI、plotdb、flourish.studio,大概可以滿足大部分的呈現,真不行都要隨時學會 HTML 用 D3.js 硬幹的能力。

相關課程

(b) 資料處理能力: 熟悉各種常見的資料格式 AVRO、CSV、JSON、XML、Table 類資料格式,並熟悉運用對應的解析器(Parser) 。Excel 通常只支援 CSV,如果要處理100GB 的CSV檔案,還有辦法辦法用 Excel 嗎?

能用 Excel 開起來的資料處理算是基礎功,各種函式熟悉度與 資料型別 要有基本認知,若擔心有漏,去書店買本 Excel 函式大全讀過一次,看一下目前支援的境界已經到哪種程度,適用在哪些案例。除了樞紐分析,字串分析的語法不要忽視。

資料處理不得不提到 SQL,一個近 40 年歷史的語言。基本的 SQL 連線方式,市場上常聽到的 SQL 資料庫名稱都要略知一二。有些資料庫如 MySQL ,有視覺化介面 MySQLWorkBench 可以用滑鼠操作。

具備處理大規模數據經驗的人才非常吃香,而這種數據都需要更專業的資料處理工具甚至是寫程式的能力。若你有 SQL 處理資料能力,你可以銜接使用 BigQuery ,讓你在處理資料的等級達到 TB 級以上的規模,多數語法與 Standard SQL 相似。

有餘裕回顧 MapReduce 發展史,實作 MapReduce 資料處理演算法是需要訓練平行化處理的思維,也要對能執行 MapReduce 的工具有些常識。MapReduce 畢竟以發展近 15年,從 Hadoop 進化到 Spark 甚至是各種相似的雲端處理架構 MPP 。(例:有人用 GPU,強化 MPP 來強化數位貨幣採礦的效能)

小結:熟悉操作由資料庫工程師架設好的系統,套用各種基本資料分析函式,是這個職務的能力,並建議要略懂甚至是學習要自己架設一個簡易的資料庫。

額外分享1:由於我近期開發需求,多接觸 Python 與 Javascript ,相關線上課程如雨後春筍般出現。而大部分 Excel 能實現的函示,在 SQL 與 Python 多有相似的表達方式,從一個好好熟悉,要轉職到其他語言上會容易許多。

額外分享2:會寫程式還是很吃香,當你接觸的工具可用一點點程式碼客製化資料串流時,可以讓你呈現資料的深度比其他競爭者更豐富。像是 Google Analytics 一個常見的網站流量分析工具,單純埋個程式碼跟懂的運用 Custom Dimension 甚至是運用 Google Tag Manager 做管理就可以多收集到一些更細緻的資料。而那些資料可能攸關分析品質。

線上課程:

(c) 資料收集能力:

一個 Business Analyst 的經驗煉成非一促可及,想成為 Business Analyst 需要經驗,需要資料,而沒有經驗的 Business Analyst 可能很難獲得資料。因此有幾個外部資源是可以加速您累積處理經驗,甚至是變成您個人可公開的 Profile 。

  • 寫網頁爬蟲,基於個人練習用途,串接 Google Map API、Youtube API,並把成果分享至 Github 上
  • 運用政府公開資料,參與 g0v 專案
  • 參與 Kaggle 資料分析線上競賽,分享其成果。

學習課程:

(d) 數學:線性代數、統計與機率:

資料檢查需要一些敏銳度,而最基本可以從資料分布,不管是看 density 還是 zipf distribution ,這些高中數學與大一數學有機會學習,大家課本還在嗎?當數據越大時,為了提速勢必都要平行化處理,線性代數的思維有助於思考每一個資料列的相關性。

有時候 Business Analyst 面臨的課題跟風險評估有關,或者是勝率,因此再怎樣的條件能提升勝率,是機率問題。若 Business Analyst 有打算強化機器學習 (Machine Learning)這一塊,不妨多考慮深入機率這塊。

(e) 時間序列分析

在做分析不外乎就是看趨勢,那不然就是做比較。根據先前提到的能力總和,針對一些資料列找因果關係與時間上的相關性,

相關課程:

用 Python 理財:打造小資族選股策略 (學習時間:10個小時以上)(https://hahow.in/courses/5a2170d5a6d4a5001ec3148d)

根據我的經驗,實作時間至少是學習時間的10倍以上,特別是程式,除錯可能就要花上3–4個小時。因此有耐心突破撞牆期是競爭力的體現。

一個 Business Analyst 過往可能是資料工程師,也可能是從行銷職務、業務轉職甚至是 PM,各站在一方專業。重要的是,當您要更投入到 Business Analyst,這篇文章希望能給予一些建議,幫助更多人在職務上有些成長。

--

--

Shih-En Chou
Shih-En Chou

Written by Shih-En Chou

從技術出發,熱愛數據分析,偶爾輕鬆的談話場合,總是不小心把一些形容詞用數字來表達。目前在 QSearch 幫助更多客戶透過社群數據了解世界的脈動

Responses (1)