文本分析是什麼

text analytics, text mining

是資料科學的核心重點。

文本分析 (Text analytics) 或稱 文本挖掘/探勘 (Text mining)

  • OSEMM 模式

  • Beyond OSEMM : 文本語意世界

一般流程

  • 先拆解文本成為較小的語詞單位。

  • 進行文本的(語意)表徵。

  • 利用表徵來結合機器學習與自然語言處理技術,施行在不同的應用上。

應用

  • 法律文本(法規條文、判決判例、司法解釋、專利語意):

  • 學術文本:知識軌跡與趨勢 (research stream) 探索

  • 金融文本:法定報表、CFO 聲明

  • 行銷文本:廣告文案、客戶評價與偏好萃取、客服紀錄

  • 醫學文本:病歷、憂鬱語言分析

Last updated