本書規劃

用意是為了實驗室的培訓,以及作為台大基本能力課課程講義。寫作的風格:TL; DR

謝舒凱 & 台大語言學研究所語言處理與人文計算 (LOPE) 實驗室

這個書希望以一種永續協作經營的方式存活。內容貢獻者包括了:曾昱翔、廖永賦、連大成、陳蓓怡、洪漢唐、..............

背景知識

駕馭文本數據的需要

大數據 (Big Data) 的時代,數位資料累積與增長的速度已經遠遠倍增於人類史上的任何階段。搭配著 AI 技術發展的加速,這樣一種鉅量資料風潮,不僅改變了人文社會與自然科學研究的面貌,在各項產業也產生了分析資料輔佐決策的迫切需求。在此背景下,數位素養 (digital literacy) 已經成為現代公 民必須具備的基本素養之一,近年來新興的資料科學家 (data scientist) 更成為當前最為熱門的行業之一。

然而由於數據資料的發展,隨著社交媒體與社會網路的發展,非結構性的文本資料所佔比例已經遠超過結構性的表格性資料,使得文本的語言分析在資料科學發展中的角色顯得愈來愈重要,特別對於人文與社會科學的學生而言,更是開啟了一個結合數位科技與人文關懷的新的發展方向。

本教程的設計,就是在這個動機之下,透過介紹語言學與文本分析知識結合統計計算,希望能夠刺激人文、社會、傳播與其他財務管理、醫學等各領域學生之間的互動協作與學習,培養跨領域的興趣與分析能力。

課程相關訊息

Last updated