首頁 書報攤 報告內文
以大數據分析為決策基礎

2023/09/11 提供機構:台灣銀行家
字級設定:

整理、撰文:陳雅莉

金融業更能洞察未來趨勢

台灣金融業面臨的最大難題,當是人才不足。未來金融業應多吸納資訊、統計人才,並建置數據分析專責部門,利用大數據仔細分析業務、財務數據,洞察未來趨勢,提供客戶更優質的服務。

金融業應用大數據分析,已是不可逆的時代趨勢。為協助金融業從業者認識此趨勢,台灣金融研訓院芬恩特創新聚落特邀安侯建業(KPMG)聯合會計師事務所顧問部資深協理張惠欣,以「金融大數據分析」為題,解析台灣金融業應用大數據分析的現況與展望。

「大數據分析後的洞察,可作為企業進行決策的基礎。」張惠欣直言,企業進行決策,與其倚賴企業主或高階經理人的直覺,不如仔細分析業務、財務數據,更能洞察未來趨勢,而大數據分析的主要步驟,包括資料蒐集、整理、排序、分類、分析,「完成資料分析後,就可依此進行預測,再依預測進行決策。」

觀察不同數據的關聯性

在資料分析階段,分析者可能會發現,看似不相關的數據竟會相互連動;此連動關係,正是制定決策的重要依據。張惠欣以「啤酒、尿布銷售量高度相關」案例為例,指出美國某家大賣場進行數據分析後,發現當新手爸爸被太太要求採買嬰兒尿布時,會順手購買啤酒,以自我獎勵,之後該大賣場將尿布、啤酒放在鄰近區域,銷售量果然雙雙上漲。

「數據與時間的關聯性,也是不可或缺的觀察面向。」張惠欣再舉例,她有位學姊在零售業任職,有次從銷售數字中察覺,該企業在台北市小巨蛋的分店,每逢星期四,女裝銷售成績特別好,「原因無他,因為每個星期四,小巨蛋都會舉辦球賽,球迷多為男性,其女伴大多選擇到附近的商店購物。」

透過分析與比對客戶屬性、造訪時間及購買數量,該零售業者將小巨蛋分店的女裝新貨上架時間,調整為星期四;一如預期,女裝銷售成績再上層樓。目前,金融業已普遍導入大數據分析,並將從中獲得的洞察,主要應用於企業決策、客戶體驗與產品行銷,及企業管理、營運等領域。

「在企業決策上,金融業常以大數據分析為基礎,制定市場策略、投資策略。」張惠欣解釋,金融業在制定決策前,大多會先進行總體經濟分析、產品市場分析,其數據也將被納入大數據分析的參考資料。

強化並優化風險管理利器

「在客戶體驗與產品行銷上,金融業更倚重大數據分析。」張惠欣說明,金融業業務繁多,銀行主要業務包括存款、放款、信用卡、財富管理等,唯有強化、優化客戶體驗與產品行銷,才能在眾多競爭者中脫穎而出,「藉由大數據分析所得到的洞察,銀行更能提供客戶較佳的體驗,且可將有限的行銷費用花在刀口上,達到精準行銷的目的。」

而在企業管理、營運上,大數據分析亦是金融業強化與優化風險管理、資產負債管理、人資與採購管理的利器,還有若干金融企業將之應用於法律遵循、稽核。張惠欣觀察,在金融業的每一個環節、面向,幾乎都會用到大數據分析,「徵聘新員工時,亦會分析應徵者的相關資料,除了學經歷,還有其在社群網站的留言。」

進行大數據分析,數據品質良莠直接影響分析品質。張惠欣表示,今日金融業的大數據分析,非常重視數據整理、數據建模,通常還得將結論圖像化、影像化,故數據品質至關重要,最害怕垃圾數據的干擾,「因此,在處理數據時,得先修補或刪除有缺失、離群值(outlier,或稱異常值)較高的數據。」

「篩選數據時,企業應先訂定標準,缺失量、離群值超過標準的數據,就應該捨棄。」張惠欣強調,將大數據分析應用於不同業務,因其性質不同,可訂定不同的標準,或採不同的分析途徑,而以平均數、中位數為計算離群值的基點,便可刪除在特殊情況下產生的數據。

例如,銀行在檢視客戶信用卡消費數據,以衡量其消費力時,得特別留意5月份的刷卡數據。原因是,5月是國人繳納綜合所得稅的月份,許多民眾選擇刷卡繳稅,帳面上刷卡金額雖高,卻非消費,其數據不具分析價值,自應汰除。

資料品質決定分析品質

「其實,在全球金融業共同遵守的《巴塞爾協定》(BaselAccord)中,便已明文規範,金融業應如何界定資料品質。」張惠欣引用《巴塞爾協定》,說明品質優良的資料,應符合攸關性高、完整性高、正確性高等3個條件。

攸關性,指資料內容與大數據分析目的的關聯性;若目的是為評估信用風險,資料內容與信用風險攸關性越高,其分析價值越高。

長期資料的完整性,必定高於短期資料。但張惠欣提醒,若金融業大數據分析的目的,屬性偏穩定、保守,就需要完整性較高的資料,「如用於評估信用風險,金融業必定期待建立不易波動的模型,不要一直變來變去,難以追蹤、掌控」;若目的是為發想行銷方案,僅需短期資料即可,完整性不必太高。

資料正確性高低,決定大數據分析預測的價值。張惠欣建議,因為資料可能來自多個源頭,紀錄格式不一,金融業應先建立統一的標準、規格,並以此標準、規格,重新整理資料,否則很可能誤刪諸多寶貴、甚至關鍵的資料,「最常見的情況是,有些機構習慣以西元紀年,有些機構堅持以民國紀年,有些紀錄以月為單位,有些紀錄則以季為單位,若不統一,分析便易失焦、失真。」

社群網路留言亦是資料

與其他產業的數據相較,金融業的數據精準甚多。張惠欣說,人們在買衣服、辦手機時,所填寫的客戶資料,或不甚精確,或故意造假,「金融業會嚴格查核客戶填寫的資料,有時還要求客戶提供證明、檢附證件,不同業者還會互通資料,故其資料價值較高。」

因為數據較準確,金融業經常進行數據分析。張惠欣認為,業者應先確定分析目的,分析時側重哪些面向,再蒐集與之相關的資料,如此更能提高資料的攸關性、完整性、正確性,節省篩選資料的時間。

若銀行某部門欲對客戶進行信用評等,其應蒐集的資料,包括自家銀行其他部門與之往來的資料,與該客戶與其他銀行的往來資料,還得徵集聯合徵信中心、政府資料開放平台(OpenData)、個人化資料自主運用平台(My Data)上的資料,才不會有所疏漏。

「銀行蒐集的資料,包括結構化資料(可以透過表單系統呈現的資料)與非結構化資料(如文字、聲音、圖片、影像、網址)。」張惠欣透露,非結構化資料通常還得經過重整、加工,才能耙梳出隱含其中的數據,並找出風險因子,「若是企業授信,金融業必須考量諸多面向,透過大數據分析,可評估其獲利能力、償債能力,與其業務有無前瞻性,再決定是否貸款。」

若是個人金融業務,總有年輕客戶是第一次與金融業「打交道」,幾乎無資料可查。張惠欣重申,年輕客戶在社群網站的留言,便成為最重要的參考資料,「在網路上,青年世代應謹慎發言,因為『凡走過必留下痕跡』,不要因為一次輕率的發言,就留下終身無法磨滅的汙點,影響信用與前程。」

運用資料時應嚴守法規

發現風險因子後,金融業應有所作為,以免影響客戶權益;當客戶刷卡消費時,若金額較高,有時會接到銀行的確認電話,目的即為避免盜刷。當銀行發現異常的數據,如平日甚少消費的客戶,突然有高額的消費,或客戶過於頻繁刷卡,如在1天刷卡數次,或在同一日,分別在日本、美國刷卡,便會主動出擊。

「當然,銀行會檢視客戶的信用評等,評估是否可提供貸款,未來應調升或調降信用額度。」張惠欣強調,不同金融業者的風險門檻不一,有些業者較寬鬆,有些業者則較保守,對大數據分析的解讀,也不盡相同,「但運用資料時,金融業務必嚴守法規,如不可因知悉客戶信用良好,就對他猛力推銷產品。」

「數據分析不是萬靈丹,進行決策前,還得考量其他因素,否則也容易失之偏頗。」張惠欣觀察,發展、應用大數據分析,台灣金融業面臨的最大難題,當是人才不足,建議未來金融業應多吸納資訊、統計人才,並建置數據分析專責部門,負責累積、統整資料,方能讓大數據分析發揮最大效益,帶領金融業轉型、升級,提供客戶更優質的服務。

本文由台灣銀行家提供