2022 年 Kaggle 資料科學 & 機器學習現況調查

每年底 Kaggle 都會在網站上做問卷調查,去年底的調查總共收集了 23,997 份來自 173 個不同國家的回覆,我這次用圖文整理翻譯了一些重點。

  1. 1. Kaggle 數據競賽平台現況
  2. 2. 性別趨勢
  3. 3. 居住地
  4. 4. 程式語言熱門度
  5. 5. IDE 工具熱門度
  6. 6. 雲端筆記本
  7. 7. 機器學習框架
  8. 8. Transformer
  9. 9. 雲端服務
  10. 10. Tensor Processing Unit (TPU) 
  11. 參考資料

1. Kaggle 數據競賽平台現況

  • 資料科學家 > 1000 萬名
  • ML 競賽 300+ 場
  • 公開資料集數量 > 17 萬
  • 公開程式碼數量 > 75 萬

2. 性別趨勢

資料科學產業依然維持著性別高度不平衡的狀況

閱讀更多»

把數據變吸睛的動畫!用 Flourish 製作全球疫情數據的 Bar chart race

這篇文章記錄了什麼是 Flourish如何取得全球各國的疫情數據透過 Python 進行數據清理、並使用 Flourish 來呈現一個吸睛的資料賽跑圖(Bar chart race)!

如果不會寫程式也沒關係!
只要準備好適當的數據,也能直接到 Flourish 上面進行資料視覺化喔!

話不多說,點擊左下方的播放鍵,讓我們先來看看成果長什麼樣子吧!


  1. 關於資料視覺化工具 Flourish
    1. Flourish 是什麼?
    2. Flourish 是免費的嗎?
  2. 關於全球疫情數據
    1. 數據是從哪來的?
    2. 如何清理數據?
  3. 進入 Flourish 資料視覺化的世界
    1. 1. 前往 Flourish 免費註冊會員
    2. 2. 創建 Bar chart race 圖表
    3. 3. 匯入資料
    4. 4. 預覽 Bar chart race 並調整設定
      1. Setup
      2. Color
      3. 最重要的 Timeline & animation
      4. Header
    5. 5. 為你的故事畫龍點睛:Captions
  4. 作品成果展示
  5. 參考資料

關於資料視覺化工具 Flourish

Flourish 是什麼?

Flourish 是一個提供資料視覺化服務的平台,類似 Tableau 那樣,完全不需要寫任何程式碼,只要準備好資料,任何人都可以輕鬆創建很酷、很生動的圖表。

因為它的方便性,使用者人數也快速成長,截至 2022 年 2 月已經有將近 103 萬使用者,產出的圖表也已創造了超過 218 億的瀏覽次數,目前也已經被知名的視覺設計工具 Canva 收購

Flourish 是免費的嗎?

免費註冊!免費製作數量無上限的圖表!

這方面真的是很吸引人,不論是要製作作品集,或是數據分析師想要製作很吸睛的圖表給老闆主管看,免費方案就已經非常足夠。


閱讀更多»

【轉職心路歷程】能走直線何必選擇彎路?大人學 Podcast EP295 聽後心得

不敢跨出舒適圈

很多想要轉換跑道跨領域轉職的人裹足不前,都有各種不同的理由

「我想進大型外商公司,但擔心我外語能力不夠好」

「我想轉職當工程師,但我覺得我數學不好」

我自己在 2019 年從食品業轉職成工程師之前也是如此,給了自己很多理由待在原地

關於我:

最近聽了一集大人學 podcast「EP295 能走直線何必選擇彎路?」之後感觸很多,決定來分享一些重點和心得

閱讀更多»

勞動市場也受戰爭影響?烏克蘭職缺數據分析與視覺化

國外有人使用 Tableau 分析了烏克蘭 190 萬筆的職缺數據,自從 2022 年 2 月俄羅斯入侵烏克蘭,整個勞動市場的職缺結構有明顯的變化

🔗 [Tableau] Big Data and Labour Market in Ukraine


大概整理了一下我從圖表上所看到的

🇺🇦 職缺數量

  • 整體明顯下降,今年 3 月相較於去年同期下降了 47%
Big Data and Labour Market in Ukraine
閱讀更多»

資料科學電子報推薦!2022 最新最完整的 Data Science Newsletter 清單

  1. 前言
  2. 為什麼要看電子報?
  3. 該怎麼活用這篇文章?
  4. 精選電子報 Top 10
    1. Data Science Simplified
    2. Data Elixir
    3. 知勢 – 提供 AI 新知與觀點
    4. Super Data Science
    5. The Variable
    6. Synced Global AI Weekly
    7. TLDR
    8. MIT Technology Review (麻省理工科技評論)
    9. Deep Learning Weekly
    10. Last Week in AI
  5. 其他電子報

前言

有多久沒有吸收新知了呢?又或是充滿求知慾想要獲取新知,卻不知從何開始嗎?

身處在科技業,最令人擔心的就是變化太快,導致自己很多技術和知識都還停留在 3、5 年前,隨時都有可能被後浪給超越,因此 溫故知新 就是一個很重要的能力!😎

為什麼要看電子報?

我認為最快取得新知的方式就是透過 訂閱電子報,每天或是每週都能知道世界各地正在發生什麼事、有什麼樣的新技術發表、產業有什麼新的趨勢 🤖

我自己在經營部落格和粉專這段時間,有時候覺得苦無素材,直到有一天我打開訂閱已久但都沒看的電子報們,發現其實每天都有很多 有趣的工具實用的技術 誕生,簡直是讓我發現了一片新天地!於是就培養起瀏覽電子報的習慣,最近覺得這些真的很值得分享給大家,因此就誕生了這一篇文章 💪

該怎麼活用這篇文章?

這篇文章所提到的都是我有訂閱過的電子報,花了數個月的時間一個一個閱讀過從將近 40 個不同的電子報中做比較之後整理出的推薦名單

我除了有寫一些介紹之外,也都有放我的電子報截圖,讓大家了解實際收到的電子報會長什麼樣,可以依照個人喜好來做挑選,想要訂閱的話我連結都放在標題上,點進去就會進到訂閱頁面

個人建議可以挑選 5 個左右來訂閱看看,不喜歡就換一個,畢竟電子報的好處就是訂閱方便又可以隨時取消訂閱 👍


精選電子報 Top 10

Data Science Simplified

這是我每天最期待也是優先打開來拜讀的電子報!

閱讀更多»