2024 年 11 月 14 日,“大模型與語言資源學術研討會暨粵語語料庫建設與大模型評測重點實驗室啟動會” 在廣州大學(黃埔校區(qū))舉行。該重點實驗室由廣州大學和廣州市社會科學界聯(lián)合會聯(lián)合共建。其相關情況如下:
- 研究方向:
- 粵語文化精神標識體系研究:深入探究粵語文化的核心精神、獨特標識,為粵語文化的精準定位和深度理解提供理論支持,以便更好地在大模型應用中體現(xiàn)粵語文化的特色。
- 通用粵語語料庫建設:收集、整理、標注大量的粵語語料,建立起全面、準確、通用的粵語語料庫,為大模型的訓練和優(yōu)化提供基礎數(shù)據(jù)支持。
- 大模型粵語言語交互質(zhì)量評測:制定科學的評測標準和方法,對大模型在粵語語言交互方面的質(zhì)量進行評估,包括語言理解的準確性、語言生成的自然度、語義表達的完整性等方面。
- 大模型粵語言語交互質(zhì)量提升研究:基于評測結果,研究如何改進大模型的算法和技術,提高其在粵語語言交互方面的質(zhì)量和效果,以滿足用戶的需求。
- 運行機制與合作模式:
- 運行機制:采取 “1+1+n” 的運行機制,即由廣州大學和廣州市社會科學界聯(lián)合會聯(lián)合共建,同時聯(lián)合廣東、香港、澳門的學術團體以及互聯(lián)網(wǎng)企業(yè)等多方面力量共同參與。
- 合作模式:采取政產(chǎn)學研用一體化的模式,形成圍繞粵語語料庫建設與智能化服務的合作生態(tài)。以廣州大學為主體,依托學校的網(wǎng)絡空間安全學院、人文學院、新聞與傳播學院等多個學院的學科優(yōu)勢和專業(yè)資源,打造跨學科協(xié)同創(chuàng)新科研平臺。
- 重要意義:
- 文化傳承方面:粵語作為中華文化的瑰寶,承載著粵港澳大灣區(qū)深厚的歷史文化底蘊。該實驗室的成立有助于推動粵語文化的數(shù)字化傳承,保護和傳承這一寶貴的文化遺產(chǎn)。
- 學術研究方面:為多學科交叉融合創(chuàng)新研究提供了平臺,探索具有中國特色、嶺南風格的城市文化傳承、保護與發(fā)展之路,將成為廣州大學跨學科發(fā)展中的重要學術平臺。
- 區(qū)域發(fā)展方面:能在粵港澳大灣區(qū)乃至全球的文化交流與合作中發(fā)揮積極作用,對于推動大灣區(qū)的文化融合和發(fā)展具有重要意義。
- 專家團隊:設立 “雙首席科學家”。由中國工程院院士、廣州大學網(wǎng)絡空間安全學院名譽院長方濱興,香港科技大學(廣州)黨委書記、國家語委科研機構國家語言服務與粵港澳大灣區(qū)語言研究中心主任屈哨兵教授分別擔任重點實驗室技術首席專家與語言首席專家,承擔學術指導和咨詢工作,保障重點實驗室學術發(fā)展方向。
該實驗室第一期建設周期為五年,長遠目標是成為立足粵港澳大灣區(qū)、面向國家語言服務戰(zhàn)略、通用粵語語料庫及大模型粵語服務評測的國內(nèi)乃至全球首屈一指的科研與對外服務專業(yè)學術性機構。 |