每年底 Kaggle 都會在網站上做問卷調查,去年底的調查總共收集了 23,997 份來自 173 個不同國家的回覆,我這次用圖文整理翻譯了一些重點。
- 1. Kaggle 數據競賽平台現況
- 2. 性別趨勢
- 3. 居住地
- 4. 程式語言熱門度
- 5. IDE 工具熱門度
- 6. 雲端筆記本
- 7. 機器學習框架
- 8. Transformer
- 9. 雲端服務
- 10. Tensor Processing Unit (TPU)
- 參考資料
1. Kaggle 數據競賽平台現況
- 資料科學家 > 1000 萬名
- ML 競賽 300+ 場
- 公開資料集數量 > 17 萬
- 公開程式碼數量 > 75 萬

2. 性別趨勢
資料科學產業依然維持著性別高度不平衡的狀況

3. 居住地
住在日本和印度的資料科學工作者明顯增加

4. 程式語言熱門度
- Python 和 SQL 依然是最熱門最常見的技能
- R 語言則連年衰退

5. IDE 工具熱門度
除了資料科學慣用的 Jupyter Notebook 之外,VSCode 越來越熱門,已超過 50% 的 資料科學工作者有在使用 VSCode

6. 雲端筆記本
Colab notebooks 是最受歡迎的雲端筆記本
Kaggle 在這裡只顯示了 Google 自家的雲端筆記本,我個人覺得還有很多好用的也值得推薦,之後有機會我會再出一篇關於雲端筆記本的比較,包含 Deepnote, Hex, Einblick 等等

7. 機器學習框架
- Scikit-learn 是最受歡迎的機器學習框架
- PyTorch 熱門程度每年都在增長

8. Transformer
Transformer 架構在深度學習模型中越來越受歡迎

9. 雲端服務
三大雲端服務 AWS, GCP, Azure 的使用者在 2022 年都有成長

10. Tensor Processing Unit (TPU)
TPU 的使用漸漸開始受到重視

參考資料
歡迎追蹤我的 Facebook 和 Instagram
👉 Facebook: JumpingCode 資料科學手記
👉 Instagram: jumping.data