數據分析救星!3 個實用但常被忽略的 Google Colab 功能

相信很多人在做數據分析或資料清理的時候,都會使用 Google Colab、Jupyter Notebook 這些工具,其中 Colab 因為免安裝、易分享、可以跑 GPU 等等的特性,最近越來越多人在使用,老師們在線上課程教學上也很方便,但其實很多人不知道 Colab 有一些比較隱藏容易被忽略的實用功能,學會的話可以讓數據分析更加事半功倍唷!

Interactive Table (互動式表格)

原本的 Colab 表格就跟 Jupyter 表格是一樣的,如果要篩選或排序就要另外利用 Pandas 寫 sort_values、filter 或是 query 的語法,而我最近做爬蟲整理資料時發現,有個功能可以將原本的表格轉為互動式的,直接透過點按來做篩選、排序、分頁等等的效果。

這個功能預設是關閉的,有兩種方式可以轉換成互動式

  • 執行下列程式碼開啟/關閉功能(建議)
from google.colab import data_table
# 開啟功能
data_table.enable_dataframe_formatter()
# 關閉功能
data_table.disable_dataframe_formatter()
  • 在表格輸出後,點擊表格右上方的按鈕

轉換按鈕如下圖的紅框處,但這方法需要每次表格產出時都按一次,如果想要每個表格都直接產出互動式表格的話,還是建議執行上面的程式碼來一次搞定~

轉換後的互動式表格會長下方這樣

閱讀更多»
廣告

網頁輕量級 Jupyter!JupyterLite 介紹與使用心得

JupyterLite 是什麼?

JupyterLite 是可以直接使用瀏覽器開啟的輕量級 JupyterLab,主要是依靠一個稱為 Pyolite 的核心 (建立在 Pyodide 之上的 CPython 3.8 直譯器),目前也有支援類似 Jupyter notebook 的 RetroLab 版本。

Pyodide — Version 0.17.0

主要是由 Jupyter 的核心開發者所開發出來的,因此目前還算是非官方專案,他們之後預計會慢慢將各種平常會使用到的功能實現在 JupyterLite 上。

JupyterLite 的使用範例

點選連結進去後,會看到左側已經有一系列的示範代碼可以使用,例如開啟 pyolite - plotly.ipynb 檔案,即可測試在 JupyterLite 上 Plotly 的資料視覺化功能。

範例 1:[Plotly] 散佈圖、長條圖

[Plotly] scatter、bar chart (散佈圖、長條圖)
閱讀更多»

使用 Python Pandas 轉換 Excel 時間格式

在 Excel 看到的時間格式是正常的,用 Pandas 讀取後卻變成一串奇怪的數字?

問題

  • 在 Excel 看到的時間是「2020/9/29 08:30:36 下午」,使用 Python 的 Pandas 讀取進來的資料卻顯示「44103.8545833333」?
    – 這到底是什麼時間格式?
    – 該怎麼轉換呢?

為什麼會有這個狀況?

  • 由於 Excel 有自己計算時間格式的方式,因此使用 Python 的 Pandas pd.read_excel('file.xlsx') 讀取時會將原始的時間格式給讀取進來。
  • 若嘗試著把 Excel 時間資料改為「通用格式」,就會發現真的變成那串奇妙的數字了!

該如何解決?

  • 只要加上一行程式碼就可以轉換完成囉!
    – 記得要另外匯入 datetime
    – df[‘date’] 為原始時間欄位
閱讀更多»

2021-01-16 Python 筆記

  1. What does |= (ior) do in Python?
  2. UnicodeDecodeError, invalid continuation byte (encoding="latin-1")
  3. 使用 Python typing 模組對你的同事好一點 (from typing import List)
  4. 淺述 python 中 numpy.argsort() 函式的例項用法
  5. What does the “at” (@) symbol do in Python?
  6. pandas.DataFrame concat 後記得 reset_index