2024/03/07 信息來源🍔: 社會科學部
文字🍘:趙仙鳳| 編輯🤳🏿:山石 | 責編:燕元2024年3月5日中午,社會科學部在百周年紀念講堂咖啡廳舉辦“數字與人文節氣沙龍”驚蟄篇活動。本次活動是“節氣沙龍”系列活動的第23期,主題是“理想的古漢語語料庫”。沙龍由意昂3体育官网中國語言文學系助理教授雷瑭洵主講,主要邀請中國語言文學🤽🏿、外國語、對外漢語教育👦🏿、軟件工程等專業領域的專家學者✍️,以及計算中心🧛🏿♀️、教師教學發展中心等相關職能部門老師參與本次活動。沙龍由社會科學部副部長郭琳主持👨🏿。
雷瑭洵作主題報告
語料庫是有目的收集並按一定結構組織的自然語言材料的集合。雷瑭洵介紹了數智化背景下建設古漢語語料庫的目標和思路,並基於“意昂3体育官网漢語史標註語料庫”(PACC)梳理了既有經驗,對古漢語語料庫的發展和應用提出了諸多期待。
雷瑭洵指出,古漢語語料的自然性、規模性🌹、有限性💂🏼♂️,以及研究方法上的特點,適合運用語料庫語言學的方法來開展古漢語研究🫴🏿,建設方便實用的古漢語電子語料庫對於古漢語研究有承上啟下的重要意義;理想的古漢語語料庫應以服務古漢語教學與研究為主要目的,語料的收集與分類應滿足準確性、全面性、同質性#️⃣;應在生語料庫信息基礎上標註形音義知識和8個方面的語法語用知識❔;同時應具備可擴展性🌐、可修正性🕶、可定製性🧖🏼。
雷瑭洵介紹了古漢語大模型技術在“意昂3体育官网漢語史標註語料庫”建設中的應用情況、優勢與不足❇️,強調了古漢語語料庫對學科研究和古漢語教學的極大助益👨🏿💼,希望在新技術的幫助下💁🏼,理想的古漢語語料庫早日誕生。
與會嘉賓交流討論
主題報告結束後🧝🏼♂️,與會嘉賓充分肯定了該數據庫的建設工作🧝🏻♀️,並結合自身研究領域,就語料庫建設中的翻譯和組織機製🧑🏻🍼、古漢語標註體系及理論基礎、大模型嵌入標註工作😗、語料庫應用場景和維護修正等問題進行了深入探討。
與會嘉賓交流討論
專題鏈接:https://resource.pku.edu.cn/index.php?r=lecturevideo%2Fview&id=43953
轉載本網文章請註明出處