資料科學的 OSEMN 模式

Mason & Wiggins (2010) 定義了資料科學的五個步驟: 🧩

  1. Obtaining data 抓取

  2. Scrubbing data 清理

  3. Exploring data 探索

  4. Modeling data 建模

  5. iNterpreting data 詮解

簡稱 OSEMN model (發音 awesome)。

抓取資料涉及到確認資料的來源,取得的方式。

  • 現成數據

  • 透過 API

  • 網路爬蟲

要考慮到的有

  • 取樣 (sampling) 的方法

  • 資料取得的法律與倫理議題

Last updated