Kaggle 發布最新的 Kaggle Models 讓模型的使用變得更方便

Introducing Kaggle Models

Kaggle has released a newest addition: Kaggle Models.

Kaggle Models is where we can discover and use pretrained models and is collaborated with TensorFlow Hub (tfhub.dev) to make a curated set of nearly 2,000 public Google, DeepMind and other models.

Models has a new entry in the left navigation alongside Datasets and Code.

In the Model page, it is organized by the machine learning task they perform (e.g., image classification, Object Detection or Text Classification), but can also apply filters for things like language, license or framework.

Using Models

To Use the models, we can either click “New Notebook” from the model page or use the “Add Model” UI in the notebook editor (similar to datasets).


Kaggle 新功能 Kaggle Models

Kaggle 最近發佈了最新的功能:Kaggle Models!

Kaggle Models 是 Kaggle 跟 TensorFlow Hub 合作,整合了將近 2,000 個 Google、DeepMind 等等的預訓練模型。

現在只要在 Kaggle 左側欄中,就可以看到多了 Models 這個選項(在 Datasets 和 Code 的中間),裡面預設是按照不同的機器學習用途 (Task) 來分類(像是 Image Classification、Object Detection, Text Classification),但也可以用過濾器篩選,像是語言、框架或 Licence。

Kaggle 左側欄中,就可以看到多了 Models 這個選項

Kaggle Models 的使用方法

如果想要使用這些模型,可以從 Models 頁面上點擊 “New Notebook”,或者點擊 notebook editor 中的 “Add Model”(跟使用資料集時差不多)。

裡面預設是按照不同的機器學習用途 (Task) 來分類

參考資料


歡迎追蹤我的 IG 和 Facebook

廣告

2022 年 Kaggle 資料科學 & 機器學習現況調查

每年底 Kaggle 都會在網站上做問卷調查,去年底的調查總共收集了 23,997 份來自 173 個不同國家的回覆,我這次用圖文整理翻譯了一些重點。

  1. 1. Kaggle 數據競賽平台現況
  2. 2. 性別趨勢
  3. 3. 居住地
  4. 4. 程式語言熱門度
  5. 5. IDE 工具熱門度
  6. 6. 雲端筆記本
  7. 7. 機器學習框架
  8. 8. Transformer
  9. 9. 雲端服務
  10. 10. Tensor Processing Unit (TPU) 
  11. 參考資料

1. Kaggle 數據競賽平台現況

  • 資料科學家 > 1000 萬名
  • ML 競賽 300+ 場
  • 公開資料集數量 > 17 萬
  • 公開程式碼數量 > 75 萬

2. 性別趨勢

資料科學產業依然維持著性別高度不平衡的狀況

閱讀更多»

把數據變吸睛的動畫!用 Flourish 製作全球疫情數據的 Bar chart race

這篇文章記錄了什麼是 Flourish如何取得全球各國的疫情數據透過 Python 進行數據清理、並使用 Flourish 來呈現一個吸睛的資料賽跑圖(Bar chart race)!

如果不會寫程式也沒關係!
只要準備好適當的數據,也能直接到 Flourish 上面進行資料視覺化喔!

話不多說,點擊左下方的播放鍵,讓我們先來看看成果長什麼樣子吧!


  1. 關於資料視覺化工具 Flourish
    1. Flourish 是什麼?
    2. Flourish 是免費的嗎?
  2. 關於全球疫情數據
    1. 數據是從哪來的?
    2. 如何清理數據?
  3. 進入 Flourish 資料視覺化的世界
    1. 1. 前往 Flourish 免費註冊會員
    2. 2. 創建 Bar chart race 圖表
    3. 3. 匯入資料
    4. 4. 預覽 Bar chart race 並調整設定
      1. Setup
      2. Color
      3. 最重要的 Timeline & animation
      4. Header
    5. 5. 為你的故事畫龍點睛:Captions
  4. 作品成果展示
  5. 參考資料

關於資料視覺化工具 Flourish

Flourish 是什麼?

Flourish 是一個提供資料視覺化服務的平台,類似 Tableau 那樣,完全不需要寫任何程式碼,只要準備好資料,任何人都可以輕鬆創建很酷、很生動的圖表。

因為它的方便性,使用者人數也快速成長,截至 2022 年 2 月已經有將近 103 萬使用者,產出的圖表也已創造了超過 218 億的瀏覽次數,目前也已經被知名的視覺設計工具 Canva 收購

Flourish 是免費的嗎?

免費註冊!免費製作數量無上限的圖表!

這方面真的是很吸引人,不論是要製作作品集,或是數據分析師想要製作很吸睛的圖表給老闆主管看,免費方案就已經非常足夠。


閱讀更多»

資料科學電子報推薦!2022 最新最完整的 Data Science Newsletter 清單

  1. 前言
  2. 為什麼要看電子報?
  3. 該怎麼活用這篇文章?
  4. 精選電子報 Top 10
    1. Data Science Simplified
    2. Data Elixir
    3. 知勢 – 提供 AI 新知與觀點
    4. Super Data Science
    5. The Variable
    6. Synced Global AI Weekly
    7. TLDR
    8. MIT Technology Review (麻省理工科技評論)
    9. Deep Learning Weekly
    10. Last Week in AI
  5. 其他電子報

前言

有多久沒有吸收新知了呢?又或是充滿求知慾想要獲取新知,卻不知從何開始嗎?

身處在科技業,最令人擔心的就是變化太快,導致自己很多技術和知識都還停留在 3、5 年前,隨時都有可能被後浪給超越,因此 溫故知新 就是一個很重要的能力!😎

為什麼要看電子報?

我認為最快取得新知的方式就是透過 訂閱電子報,每天或是每週都能知道世界各地正在發生什麼事、有什麼樣的新技術發表、產業有什麼新的趨勢 🤖

我自己在經營部落格和粉專這段時間,有時候覺得苦無素材,直到有一天我打開訂閱已久但都沒看的電子報們,發現其實每天都有很多 有趣的工具實用的技術 誕生,簡直是讓我發現了一片新天地!於是就培養起瀏覽電子報的習慣,最近覺得這些真的很值得分享給大家,因此就誕生了這一篇文章 💪

該怎麼活用這篇文章?

這篇文章所提到的都是我有訂閱過的電子報,花了數個月的時間一個一個閱讀過從將近 40 個不同的電子報中做比較之後整理出的推薦名單

我除了有寫一些介紹之外,也都有放我的電子報截圖,讓大家了解實際收到的電子報會長什麼樣,可以依照個人喜好來做挑選,想要訂閱的話我連結都放在標題上,點進去就會進到訂閱頁面

個人建議可以挑選 5 個左右來訂閱看看,不喜歡就換一個,畢竟電子報的好處就是訂閱方便又可以隨時取消訂閱 👍


精選電子報 Top 10

Data Science Simplified

這是我每天最期待也是優先打開來拜讀的電子報!

閱讀更多»

AI 到底是如何將文字變影片?解析 Meta 最新 Make-A-Video 架構和技術突破

Meta (原 Facebook) 在 2022/09/29 發佈了最新的文字轉影片 AI,名稱叫做 Make-A-Video,我覺得算是一個滿值得研究的技術突破,也很好奇背後運作的原理,於是這次拜讀了他們發表的 Paper,大概了解一下整個 Text-to-Video (T2V) AI 的架構。

雖然說是文字轉影片,但其實主要的基底還是透過文字轉圖片的模型來實現,因為既然已經有模型可以將文字轉成圖片了,那就不用再造一個輪子去做文字轉影片的模型,畢竟影片也是建築在圖片之上,是由多個圖片所組成的。

由 Make-A-Video 產出的影片範例 (source: Make-A-Video)

過去技術上的瓶頸

研究中有提到,過去文字轉影片的技術一直遲遲無法有進展,有兩個主要原因

閱讀更多»