2022 年 Kaggle 資料科學 & 機器學習現況調查

每年底 Kaggle 都會在網站上做問卷調查,去年底的調查總共收集了 23,997 份來自 173 個不同國家的回覆,我這次用圖文整理翻譯了一些重點。

  1. 1. Kaggle 數據競賽平台現況
  2. 2. 性別趨勢
  3. 3. 居住地
  4. 4. 程式語言熱門度
  5. 5. IDE 工具熱門度
  6. 6. 雲端筆記本
  7. 7. 機器學習框架
  8. 8. Transformer
  9. 9. 雲端服務
  10. 10. Tensor Processing Unit (TPU) 
  11. 參考資料

1. Kaggle 數據競賽平台現況

  • 資料科學家 > 1000 萬名
  • ML 競賽 300+ 場
  • 公開資料集數量 > 17 萬
  • 公開程式碼數量 > 75 萬

2. 性別趨勢

資料科學產業依然維持著性別高度不平衡的狀況

3. 居住地

住在日本和印度的資料科學工作者明顯增加

4. 程式語言熱門度

  • Python 和 SQL 依然是最熱門最常見的技能
  • R 語言則連年衰退

5. IDE 工具熱門度

除了資料科學慣用的 Jupyter Notebook 之外,VSCode 越來越熱門,已超過 50% 的 資料科學工作者有在使用 VSCode

6. 雲端筆記本

Colab notebooks 是最受歡迎的雲端筆記本

Kaggle 在這裡只顯示了 Google 自家的雲端筆記本,我個人覺得還有很多好用的也值得推薦,之後有機會我會再出一篇關於雲端筆記本的比較,包含 Deepnote, Hex, Einblick 等等

7. 機器學習框架

  • Scikit-learn 是最受歡迎的機器學習框架
  • PyTorch 熱門程度每年都在增長

8. Transformer

Transformer 架構在深度學習模型中越來越受歡迎

9. 雲端服務

三大雲端服務 AWS, GCP, Azure 的使用者在 2022 年都有成長

10. Tensor Processing Unit (TPU) 

TPU 的使用漸漸開始受到重視

參考資料


歡迎追蹤我的 Facebook 和 Instagram
👉 Facebook: JumpingCode 資料科學手記
👉 Instagram: jumping.data

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s