【107-1】語料分析工具與數位人文概論

Digital Humanities Techniques for Chinese Studies

曾若涵 (國立中正大學)

      本計畫立基於數位人文的發展趨勢以及申請人本身的漢語語言學專業,擬於此次課程計畫中,將數位人文結合語言學,提供學生基礎的數位知識,以理解自然語言處理的相關問題,拓展未來職涯發展的可能...

Ch 1. 數位人文導論、課程介紹 /  曾若涵
Ch 2. 語言學家失業的故事、數位資源 /  曾若涵
Ch 3. 可怕的AI菜單、斷詞工具 /  曾若涵
Ch 4. 漢語詞組到句子、斷詞與語言分析嘗試 /  曾若涵
Ch 5. 老是有例外的漢語語法、庫博中文語料庫分析工具(Corpro) /  曾若涵
Ch 6. 數位人文與Python學習(1):程式語言基礎 /  曾若涵、林哲維
Ch 7. 數位人文與Python學習(2):文本視覺化 /  曾若涵、林哲維
Ch 8. 數位人文與Python學習(3):Jieba斷詞 /  曾若涵、林哲維
Ch 9. 從白雪公主之魔鏡認識機器學習 /  江振國、曾若涵
Ch 10. 數位人文專題寫作討論、各組第1次專題報告 /  曾若涵
Ch 11. 數位人文專題寫作討論、各組第2次專題報告 /  曾若涵
Ch 12. 數位人文論文導讀、各組第3次專題報告 /  曾若涵
Ch 13. 期末進度規劃、各組第4次專題報告 /  曾若涵
Ch 14. 從人文到資訊科技、標記的概念 /  曾若涵
Ch 15. 2.3.4組期末正式專題發表 /  曾若涵
Ch 16. 1.5.6組期末正式專題發表 /  曾若涵
Ch 17. 7.8.9組期末正式專題發表 /  曾若涵
Ch 18. 期末總結及回饋 /  曾若涵

計畫主持人資訊

姓 名 曾若涵
電子信箱 hannahegg@gmail.com
電 話 (05)2720411轉分機31103
服務學校 中正大學
系所單位 中國文學系
職 稱 助理教授

教師簡介 (更多資訊)

姓 名 曾若涵(主持人)
現 職 助理教授
E-Mail hannahegg@gmail.com
連絡電話 (05)2720411轉分機31103

最高學歷

國立中山大學文學博士

研究專長

聲韻學、語言學概論、華語語音學、日本江戶韻學

近年研究主題

聲韻學、語言學概論、華語語音學、日本江戶韻學

中文課程名稱: 【107-1】語料分析工具與數位人文概論
英文課程名稱: Digital Humanities Techniques for Chinese Studies
教師姓名: 曾若涵
江振國(共同主持人)
開課學校/系所: 國立中正大學
開課學期: 1071
學分數: 3 學分
課程關鍵字: 數位人文
語料分析工具
漢語語言學
中文文本解析
文本量化分析
課程領域: 人文學
課程階層: 基礎
應用數位技術/工具:

 中研院斷詞系統
哈工大斷詞系統
python
jieba斷詞系統
庫博斷詞系統

先備課程: 語言學概論、華語語法學,或詞彙學
延伸及相關課程: 語料分析與數位人文應用、Python程式語言
參考網站: 語料分析與數位人文應用、Python程式語言、數位工具及漢語語言學研究方法

課程概述

      本計畫立基於數位人文的發展趨勢以及申請人本身的漢語語言學專業,擬於此次課程計畫中,將數位人文結合語言學,提供學生基礎的數位知識,以理解自然語言處理的相關問題,拓展未來職涯發展的可能。
      對中文系而言,進行各領域文本研究時,文本分析或語料處理乃是必備能力,然而整理文本往往成為最耗費心力的過程。若學生具備數位語料應用的知識與技能,必有助於往後學習,且能爭取更多深入思考的時間。在此理念上,本課程擬分三個部分執行:第一部分為中文斷詞系統與中文語料分析工具選介及探索。第二部分,試將文本投入幾個數位工具進行斷詞(分詞),帶領學生探討結果所呈現的詞彙、語法、語意等相關問題,並思考可能的問題解決或優化方案。第三部分著重於文本斷詞結果的進一步應用,如詞頻分析、語境分析、人工智能應用等面向。以上各部分之比例與難度將依實際情形進行調整,以提供適切的條件供學生實際應用。課程最後將綜合上述三部分,讓學生進行分組專題實作,並於期末發表成果。

教學目標

 1. 接觸數位語料分析工具,並有基礎的了解及應用能力。
2. 能夠利用語料分析工具來處理各種文本材料。
3. 對Python語言程式或者數位人文相關議題有基礎認識。

修課條件

 1.有語言學概論之基礎為宜,或者修習過任何一門語言學相關課程。
2.願意挑戰語料庫、語料處理系統,有解決跨語言問題的信心與勇氣。

授課方式

課堂教學

成績評量方式

■上課態度及互動20%:包含出席、課堂提問、小組討論、團體活動成績
■小考及實作練習30% ■期中考20%
■期末小組專題報告30% ■加分機制(研擬中)

教學進度

1 數位人文導論、課程介紹
2 語言學家失業的故事、數位資源
3 可怕的AI菜單、斷詞工具
4 漢語詞組到句子、斷詞與語言分析嘗試
5 老是有例外的漢語語法、庫博中文語料庫分析工具(Corpro)
6 數位人文與Python學習(1):程式語言基礎
7 數位人文與Python學習(2):文本視覺化
8 數位人文與Python學習(3):Jieba斷詞
9 從白雪公主之魔鏡認識機器學習
10 數位人文專題寫作討論、各組第1次專題報告
11 數位人文專題寫作討論、各組第2次專題報告
12 數位人文論文導讀、各組第3次專題報告
13 期末進度規劃、各組第4次專題報告
14 從人文到資訊科技、標記的概念
15 2.3.4組期末正式專題發表
16 1.5.6組期末正式專題發表
17 7.8.9組期末正式專題發表
18 期末總結及回饋

授課對象

107-1_27人/107-2_24人

無資料