2021 年的「資料工程師」有哪些常見的技能需求?

前言

近期因為轉換工作面試了不少公司的資料工程師

面試流程不外乎就是「自介」+「考試」+「問問題」

在問問題的環節經常被問到會不會使用某些工具

以下大概整理一下我面試 Data Engineer 最常被問到的幾項技術

閱讀更多»

淺談異常值在資料分析中的重要性

網路上資料分析的課程,遇到像是空值都會教如何去補,用平均值、眾數或往前往後補等等,但遇到異常值 (outlier) 的時候,通常都是教如何判斷並刪除,像是超過三倍標準差就踢除掉之類的方法,但在真實世界中,出現這些異常值都是有原因的,好好思考異常值背後的原因和意義,甚至比一般值的分析還要來得重要。

異常值帶給我的反思

以我個人在數位媒體做資料分析的經驗,有一次在分析 Facebook 粉絲專頁洞察報告時,就發現某個月有 2 篇貼文觸及人數異常地高,是其他貼文的 10 倍以上,不禁讓我反思,在這茫茫數據中出現如此明顯的異常值,真的該按照 SOP 把他們刪掉嗎?

閱讀更多»

3 分鐘理解 Google Analytics 工作階段逾時

「工作階段」的意義算是好理解,但 GA 設定中「工作階段逾時」到底是什麼?

在使用 Google Analytics(GA)分析網站流量時,「工作階段」是很常出現的指標。

一個工作階段包含了某使用者進入網站後的所有互動紀錄,只要沒有閒置超過設定的時間,互動都會被算在同一個工作階段,關於工作階段詳細解釋,可以參考 Harris 先生的這篇文章 或是 awoo 的這篇介紹

「工作階段」的意義算是好理解,但「工作階段逾時」到底是什麼?以下用簡單的圖象化分享我對「工作階段逾時」的理解。

閱讀更多»