在线播放亚洲精品,小说专区亚洲春色校园,欧美在线观看网址综合,国产亚洲综合色就色

      在线播放亚洲精品,小说专区亚洲春色校园,欧美在线观看网址综合,国产亚洲综合色就色

      舊版網(wǎng)站入口

      站內搜索

      漢語(yǔ)方言自然口語(yǔ)有聲基礎語(yǔ)料庫建設中期檢測報告

      2016年12月05日15:07來(lái)源:全國哲學(xué)社會(huì )科學(xué)工作辦公室

      一、研究進(jìn)展情況

      一、研究計劃總體執行情況

      本項目2012年10月中標。2013年1月13日舉行開(kāi)題論證會(huì ),開(kāi)題至今(2016年7月)已有三年半。項目按計劃推進(jìn),總體順利。

      本項目分前期(2013)、中期(2014-2016)、后期(2017)三個(gè)階段。前期的理論研究與語(yǔ)料庫設計已如期完成,2014年至今(2016)為中期,有兩項主要任務(wù):(1)語(yǔ)料采制;(2)軟件研究(語(yǔ)料轉寫(xiě)核對軟件與語(yǔ)料庫管理軟件)。這兩項是本項目的中心工作。以下逐項匯報。

      1.1 語(yǔ)料采制(2014年7月-2016年7月)

      語(yǔ)料采制分采錄(調查錄制)與轉寫(xiě)(研究標注)兩項工作。兩年來(lái),分屬三個(gè)方言子課題的20個(gè)方言子項目按照《漢語(yǔ)方言語(yǔ)料采制手冊》的規范與要求工作,現有17方言點(diǎn)已完成語(yǔ)料采錄,開(kāi)始轉寫(xiě);另3方言因故略延,正在籌備語(yǔ)料采錄。以下就方言布點(diǎn)、語(yǔ)料內容、研究進(jìn)展與項目管理逐一匯報。

      1.1.1 方言布點(diǎn):兼顧方言與文化選擇20方言點(diǎn)

      依據投標書(shū)設定的“兼顧方言與文化”的布點(diǎn)原則,選了20個(gè)方言點(diǎn),覆蓋全國九個(gè)一級方言區和官話(huà)的八個(gè)二級分區(《中國語(yǔ)言地圖集》)。這20方言點(diǎn)均為當地經(jīng)濟文化中心(或為古城),具有方言與地域文化的雙重代表。

      1.1.2 語(yǔ)料內容:基礎語(yǔ)料與語(yǔ)篇語(yǔ)料數量大

      每方言點(diǎn)有4位發(fā)音人:老年男女、青年男女,分別錄制基礎語(yǔ)料字、詞、句和語(yǔ)篇語(yǔ)料;A語(yǔ)料以老男為主,同時(shí)錄制另三人音系基礎字。語(yǔ)篇語(yǔ)料4人均錄。為方便多人對話(huà),專(zhuān)設一引話(huà)人(方言地道、清楚本項目任務(wù))參與雙口語(yǔ)篇與三口語(yǔ)篇錄制。語(yǔ)篇分話(huà)本語(yǔ)篇、話(huà)題語(yǔ)篇與自話(huà)語(yǔ)篇,三類(lèi)語(yǔ)篇的口語(yǔ)自然度依序遞增。每方言點(diǎn)共錄制6105字,約5600詞(核心詞200、基礎詞5260、特征詞100-200),100語(yǔ)法例句,900分鐘語(yǔ)篇(見(jiàn)下頁(yè)表1)。語(yǔ)料數量大于一般方言調查和一些在研方言數據庫。

      表1 本項目單方言點(diǎn)語(yǔ)料結構表

      注:6105字含老男4002同音字和1092雙字調式字,老女、青男、青女各337音系例字。

      1.1.3 研究進(jìn)展:已完成17方言點(diǎn)的語(yǔ)料采錄

      2014年上半年完成南京語(yǔ)料的試點(diǎn)采錄、修訂完善了語(yǔ)料采制大綱《漢語(yǔ)方言語(yǔ)料采制手冊》后,即籌備路途最遠的新疆哈密方言的采錄。7月,新疆大學(xué)哈密方言子項目完成采錄的前期準備:擬定當地獨有方言文化采錄底本(特征詞、熟語(yǔ)、傳說(shuō)、故事、軼事、歌謠、非遺曲藝),為4位發(fā)音人分擬獨用的語(yǔ)料底本,選定合適的發(fā)音人,擬定采錄工作日程,勘查預定錄音錄像場(chǎng)地等。8月,5人團隊赴哈密,全天調查并錄制。首席專(zhuān)家劉俐李教授率隊,哈密方言研究專(zhuān)家新疆大學(xué)張洋教授同步監聽(tīng)發(fā)音質(zhì)量,發(fā)現問(wèn)題隨即質(zhì)疑、討論、重錄,子項目負責人新疆大學(xué)楊洪建副教授與研究生卜元彬負責檢查、復核、剪輯與整理音檔,發(fā)現不合格的音檔隨即補錄,項目組侯超實(shí)驗師負責錄音與錄像,確保各技術(shù)參數達標。5人團隊白天錄制,晚上總結整理,各司其職、相互配合,緊張而有序地按計劃完成了哈密語(yǔ)料采錄。

      2014年10月上旬,經(jīng)費撥至各方言,各子項目陸續開(kāi)始語(yǔ)料采錄。10月,北京官話(huà)首先啟動(dòng),12月,蘭州、銀川兩方言啟動(dòng)。2015年1月,徽語(yǔ)、東北官話(huà)、晉語(yǔ)、粵語(yǔ)、溫州吳語(yǔ)啟動(dòng)。2015年暑假前后,閩語(yǔ)、常熟吳語(yǔ)、湘語(yǔ)、膠遼官話(huà)啟動(dòng)。目前這12方言點(diǎn)均已完成語(yǔ)料采錄,開(kāi)始語(yǔ)料轉寫(xiě)。2016年上半年完成客家話(huà)、西南官話(huà)、黃岡江淮官話(huà)的語(yǔ)料采錄。截止2016年7月,共有17個(gè)方言點(diǎn)完成語(yǔ)料采錄。

      首席專(zhuān)家參與了5個(gè)方言點(diǎn)的語(yǔ)料采錄,其余由各方言責任人負責:蘭州城市學(xué)院莫超、張建軍兩教授,暨南大學(xué)陳曉錦、浙江師范大學(xué)王洪鐘、山西大學(xué)史秀菊、山東女子學(xué)院王淑霞教授,哈爾濱師范大學(xué)梁曉玲、新疆大學(xué)楊洪建、安徽大學(xué)栗華益、常熟理工學(xué)院顧勁松、鹽城師范學(xué)院馮青青等副教授,南京師范大學(xué)侯超實(shí)驗師。博士研究生唐志強、付康,碩士研究生施小梅、漆盈、郭文娟、張敏怡、卜元彬等參加調查采錄。

      1.1.4 項目管理

      依據開(kāi)題研討會(huì )專(zhuān)家的意見(jiàn),各方言語(yǔ)料的采制聘請當地有造詣的方言學(xué)者承擔!爱數胤窖詫W(xué)者”一指本籍方言學(xué)者,二指雖非本籍但工作于當地并于當地方言有造詣?wù)摺?0個(gè)方言點(diǎn)有20位責任人,人多力大,但需要規范與統一,這是保質(zhì)、如期完成語(yǔ)料研制的前提。

      項目組以《漢語(yǔ)方言語(yǔ)料采制手冊》為法規,規約并統一20方言點(diǎn)的語(yǔ)料研究,采用兩級責任制管束并推進(jìn)各方言點(diǎn)的工作。啟用法規手冊與兩級責任制的實(shí)質(zhì)是協(xié)助與推動(dòng)各子項目的工作,以保證任務(wù)的完成。

      (1)用《漢語(yǔ)方言語(yǔ)料采制手冊》規約并統一研究

      該手冊由首席專(zhuān)家牽頭、項目組核心成員集體研究(2013),經(jīng)南京方言試點(diǎn)檢驗后修訂完善(2014上半年)。手冊有上下兩編。上編是“語(yǔ)料采制規范”,規范并約定各方言點(diǎn)的采錄內容、采錄對象以及錄音、錄像、攝像等技術(shù)指標,規范音頻與視頻的剪輯整理、語(yǔ)料標注、漢字與國際音標的使用、語(yǔ)料入庫路徑,提供快捷轉寫(xiě)語(yǔ)料的方法與相應軟件,提供語(yǔ)料庫結構模型,提供音頻、視頻、標注、文本等入庫語(yǔ)料的電子安放模板“××方言語(yǔ)料包”。下編是“語(yǔ)料采制底本”,提供各方言通用的字、詞、句、語(yǔ)篇的采錄底本。

      (2)用兩級責任制管束并推進(jìn)研究

      項目組下設子課題,子課題下設子項目,子項目對子課題負責、子課題對項目組負責。每一方言為一子項目,20方言點(diǎn)隸屬三個(gè)子課題:西部北部方言組(北京、東北、中原、蘭銀、膠遼、西南、冀魯官話(huà),晉語(yǔ)),由蘭州城市學(xué)院、華東師范大學(xué)博導莫超教授主持;中部東部方言組(吳語(yǔ)、江淮官話(huà)、徽語(yǔ)、湘語(yǔ)),由浙江師范大學(xué)王洪鐘教授主持;南部方言組(粵語(yǔ)、閩語(yǔ)、客家話(huà)、贛語(yǔ)),由暨南大學(xué)陳曉錦教授主持。子項目承擔各方言點(diǎn)語(yǔ)料的研制,包括人員組織、經(jīng)費使用、研究進(jìn)度、結項成果等,與項目組簽有協(xié)議書(shū)。

      (3)用協(xié)助與監管來(lái)保證各子項目完成任務(wù)

      項目組采用通訊(電子郵件、QQ群、電話(huà))、視頻課件、會(huì )議、派員等方式,在各方言語(yǔ)料研究的不同階段實(shí)施協(xié)助與監管,以保證各子項目按設計要求不走彎路順利完成任務(wù)。

      ◇語(yǔ)料采錄前:審核采錄底本與發(fā)音人選,提供語(yǔ)料包與語(yǔ)料研究軟件包。

      采錄底本與發(fā)音人選是采錄語(yǔ)料的關(guān)鍵,各方言在錄制前要報首席專(zhuān)家審核批準。

      各方言的采錄底本分全國通用與本地特有兩類(lèi)。通用語(yǔ)料集中于字、詞、句等基礎語(yǔ)料,特有語(yǔ)料集中于語(yǔ)篇。通用語(yǔ)料取自《漢語(yǔ)方言語(yǔ)料采制手冊》,各方言相同,但要將每條語(yǔ)料的編碼改為本方言的唯一碼。特有語(yǔ)料由各方言自擬,有方言特征詞、當地熟語(yǔ)、傳說(shuō)、故事、軼事、歌謠、非遺曲藝、名產(chǎn)、名物等。特有語(yǔ)料底本由各子項目自擬、報首席專(zhuān)家審批,然后將通用底本與特有底本合成本方言采錄底本。再拆分成4位發(fā)音人專(zhuān)用的分角色底本,經(jīng)首席專(zhuān)家審批后再使用。

      2015年1月,在語(yǔ)料采錄普遍啟動(dòng)時(shí),項目組將語(yǔ)料包與軟件包下發(fā)各子項目。語(yǔ)料包是語(yǔ)料研究與語(yǔ)料入庫的電子模板,可使各方言在研究伊始就清楚結項要求,避免走彎路,同時(shí)也規約并統一各方言的語(yǔ)料采制。軟件包提供6種語(yǔ)料研究軟件,以方便并統一各方言語(yǔ)料采錄。有(1)音頻處理軟件、(2)文件更名軟件、(3)國際音標軟件、(4)語(yǔ)篇處理軟件、(5)語(yǔ)音分析軟件、(6)同音類(lèi)記法與文件更名操作視頻。(6)是培訓視頻,講授字表快速記音的“同音類(lèi)記法”與批量更換文件名的“拖把更名器”的使用方法。

      ◇語(yǔ)料采錄中

      有些方言點(diǎn)技術(shù)力量不足,項目組派員并攜帶設備協(xié)助,例如哈密、長(cháng)沙、北京。有些方言點(diǎn)在錄制中遇到問(wèn)題,項目組則通過(guò)電話(huà)、短信、電子郵件等協(xié)助解決,例如平遙、廣州、銀川、蘭州、北京、長(cháng)沙、黟縣、溫州等。

      ◇語(yǔ)料采錄后

      項目組逐一檢查各方言報送的原始語(yǔ)料,及時(shí)通告所發(fā)現的問(wèn)題。

      提供語(yǔ)料轉寫(xiě)軟件。語(yǔ)料轉寫(xiě)耗時(shí)費力,是語(yǔ)料研究的難點(diǎn)與重點(diǎn)。子課題“方言口語(yǔ)庫的數字化新技術(shù)研究”(簡(jiǎn)稱(chēng)軟件組)設兩個(gè)分組,專(zhuān)項研究開(kāi)發(fā)輔助4個(gè)子庫轉寫(xiě)語(yǔ)料的軟件與方法。在開(kāi)始語(yǔ)料轉寫(xiě)前,將這些軟件和方法提供給各方言。

      培訓專(zhuān)用語(yǔ)料轉寫(xiě)軟件的使用。

      2015年11月,軟件組完成了兩款專(zhuān)用軟件和兩種快速記音法的研制,部分方言點(diǎn)完成了語(yǔ)料采錄,即將開(kāi)始語(yǔ)料轉寫(xiě)。11月7日,項目組召開(kāi)中期研討會(huì ),邀請各方言負責人和骨干成員參加,議程之一是培訓以下4款軟件的使用:

      1)詞表標音軟件的使用與實(shí)習(鮑培明副教授講授)

      2)聲調分析軟件VoiceSort的使用與實(shí)習(宋益丹講師講授)

      3)字表同音類(lèi)記法的使用與實(shí)習(侯超實(shí)驗師講授)

      4)詞表快速標音法說(shuō)明與實(shí)習(劉俐李教授講授)

      1)和2)是自行研制的軟件,3)和4)是綜合已有軟件、excel表以及方言學(xué)知識研制的字表、詞表快捷標音方法。這4種軟件與方法以及后來(lái)研制的句表標音系統有效提高了語(yǔ)料的標音效率。

      下圖1是課題組成員學(xué)習詞表標音軟件的場(chǎng)景一角。

      圖1 學(xué)習詞表標音軟件

      下圖2是課題組成員學(xué)習聲調分析軟件VoiceSort的場(chǎng)景一角。后排三人是軟件組成員,彎腰站立者是軟件組的鮑培明副教授,她根據與會(huì )者提出的意見(jiàn)正指導團隊現場(chǎng)修改詞表標音軟件的程序。

      圖2 學(xué)習聲調分析軟件VoiceSort

      1.2 軟件研究

      2014年7月至今(2016年7月)的兩年里,軟件組研制了兩類(lèi)軟件。 一是語(yǔ)料庫管理軟件,二是語(yǔ)料轉寫(xiě)軟件。語(yǔ)料庫管理軟件體現語(yǔ)料庫的信息化構架并保障其運行,適用于本庫;語(yǔ)料轉寫(xiě)軟件針對語(yǔ)料個(gè)體,既可用于本庫語(yǔ)料也可用于其他語(yǔ)料,具有一定通用性。語(yǔ)料轉寫(xiě)軟件是方言研究的數字化工具。

      2014年7月3日,首席專(zhuān)家劉俐李教授召集計算機科學(xué)、地理信息系統、實(shí)驗方言學(xué)三領(lǐng)域的項目成員,專(zhuān)題研討語(yǔ)料庫管理軟件及語(yǔ)料轉寫(xiě)軟件的研制。9月中旬,劉俐李教授與軟件組負責人曲維光教授再次商討,確定了具體研究方案。

      1.2.1 字庫與詞庫管理軟件初步完成

      由熟悉方言語(yǔ)料庫的計算機學(xué)者鮑培明副教授具體執行語(yǔ)料庫管理軟件的研究。本項目所建語(yǔ)料庫有字、詞、句、篇4個(gè)子庫,各庫數據結構不同,4子庫每條數據分別為52、137、38、30字段,管理軟件需要分別設計與研制。

      2014年11月,完成語(yǔ)料庫整體設計。2015年5月,首先研制出字段最多的字庫與詞庫管理軟件。6月,首席專(zhuān)家與實(shí)驗方言學(xué)者查看字庫與詞庫的管理界面,提出修改意見(jiàn)。2015年10月完成修訂,11月7日,在項目中期研討會(huì )上演示,全體與會(huì )者審閱并提出修改意見(jiàn)。軟件組當即研究并修改。會(huì )后建立了項目組專(zhuān)用QQ群,交流討論問(wèn)題。目前已完成修訂,字庫與詞庫的界面已可使用。

      句庫與篇庫管理軟件在研制中。

      1.2.2 標音軟件“語(yǔ)料庫標音系統”初步完成

      2015年7月完成詞庫標音系統,經(jīng)方言組試用,提出修改意見(jiàn),修改后再試用,再修改。2015年 11月7日培訓骨干成員學(xué)習使用,聽(tīng)取意見(jiàn),現場(chǎng)修改。在詞庫標音系統的基礎上,11月中旬完成句庫自動(dòng)標音系統,并將詞庫與句庫標音系統合為語(yǔ)料庫標音系統。

      句庫標音系統也可用于語(yǔ)篇標音:將語(yǔ)篇拆分為句,即可應用從而實(shí)現篇庫的快速標音,而拆篇為句也是語(yǔ)篇標注的要求。由是,語(yǔ)料庫標音系統可實(shí)現詞、句、篇3個(gè)子庫的快速標音。

      1.2.3 初步完成聲調分析軟件VoiceSort的研究

      聲調是方言記音中的難題,本項目多采用聲學(xué)語(yǔ)音實(shí)驗來(lái)完成。聲調實(shí)驗

      數據的處理是語(yǔ)音學(xué)與方言音系學(xué)的接口,工作量大,處理尺度不易把握,是聲調實(shí)驗研究的難點(diǎn)。本項目研制的聲調分析軟件VoiceSort可緩解這一難題。

      1.2.4 創(chuàng )建字表快速標音的“同音類(lèi)記法”

      2015年1月,侯超實(shí)驗師與首席專(zhuān)家歸納整理出“同音類(lèi)記法”。其原理是同音聚類(lèi)與批量標音,作用是給字表快速標音。首先要完成方言音系聲韻調例字的標音,然后利用字表中的古音信息聚類(lèi),再應用EXCEL表的批量處理功能就可快速標音。

      二、各子課題進(jìn)展情況

      本項目有五個(gè)子課題。子課題一是軟件組,研制建庫系列軟件;子課題二、三、四是方言組,負責方言語(yǔ)料的研究;子課題五研究方言韻律。五個(gè)子課題基本依照計劃完成任務(wù)。

      2.1 子課題一:軟件組

      負責研究語(yǔ)料庫管理軟件和語(yǔ)料轉寫(xiě)軟件,使語(yǔ)料的處理軟件化或半軟件化。設兩個(gè)分組。第一組由南京師范大學(xué)計算機學(xué)院曲維光教授牽頭、鮑培明副教授負責。第二組由首席專(zhuān)家劉俐李教授負責,文學(xué)院宋益丹講師、侯超實(shí)驗師實(shí)施。

      第一分組已完成四項工作:

      (1)語(yǔ)料庫管理軟件的總體設計;

      (2)字庫和詞庫管理軟件的研制,界面已可使用;

      (3)詞庫與句庫標音軟件“語(yǔ)料庫標音系統”的編程,已提交各方言語(yǔ)料研究小組使用,普遍反映良好;

      (4)完成項目組前期成果“現代漢語(yǔ)有聲詞匯庫”的上網(wǎng)改造,并獲得國家專(zhuān)利。

      第二分組已完成兩項工作:

      (1) 聲調分析軟件VoiceSort;

      (2) 字表快速標音的“同音類(lèi)記法”。

      聲調分析軟件與同音類(lèi)記法各方言已使用,反映良好。

      該組成員同時(shí)進(jìn)行語(yǔ)言處理及計算語(yǔ)言學(xué)的相關(guān)研究,發(fā)表論文2篇,獲得專(zhuān)利1項。

      2.2 子課題二:西部北部方言語(yǔ)料研究

      負責北方官話(huà)二級分區及晉語(yǔ)的9個(gè)方言點(diǎn)的語(yǔ)料研究。負責人蘭州城市學(xué)院莫超教授。2014年7月至今(2016年7月),完成了7個(gè)方言點(diǎn)的語(yǔ)料采錄,開(kāi)始語(yǔ)料轉寫(xiě)。另2個(gè)方言點(diǎn)預計2016年12月前完成采錄。

      該組成員同時(shí)進(jìn)行本方言的相關(guān)研究,出版專(zhuān)著(zhù)2部,發(fā)表論文21篇,完成3.3萬(wàn)字的調研報告1份,該報告獲市社科聯(lián)科研二等獎。

      自2014年至今,該組成員獲得國家社科基金課題2項:語(yǔ)言接觸視閾下的河州方言形成與演變研究(2015),黑龍江省漢語(yǔ)方言地圖集(2016);獲得國家語(yǔ)委、教育部“中國語(yǔ)言資源保護工程專(zhuān)項任務(wù)”5項(山西平遙,黑龍江哈爾濱、肇東,甘肅蘭州、文縣);獲得教育部社科項目1項:絲綢之路經(jīng)濟帶甘肅段語(yǔ)言文字使用狀況研究(2015)。

      2.3 子課題三:中部東部方言語(yǔ)料研究

      負責吳語(yǔ)、徽語(yǔ)、湘語(yǔ)、江淮官話(huà)共6個(gè)方言點(diǎn)的語(yǔ)料研究。負責人浙江師范大學(xué)王洪鐘教授。

      2014年7月至今,6個(gè)方言點(diǎn)全部完成語(yǔ)料錄制,已開(kāi)始語(yǔ)料轉寫(xiě)。

      該組成員同時(shí)進(jìn)行本方言的相關(guān)研究,出版著(zhù)作1部,發(fā)表論文18篇。

      自2014年至今,該組成員獲得國家社科基金課題2項:蘇北江淮官話(huà)的地理語(yǔ)言學(xué)研究(2015)、南部吳語(yǔ)發(fā)聲類(lèi)型多維特征參數實(shí)驗研究(2015);教育部人文社科基金課題1項:吳語(yǔ)特殊發(fā)聲類(lèi)型研究(2014);國家語(yǔ)委、教育部“中國語(yǔ)言資源保護工程專(zhuān)項任務(wù)”3項(浙江江山方言、江山文化、衢州);中國博士后基金課題2項:蘇北方言語(yǔ)音的現狀及歷史演變研究(2014),石臼湖流域方言的地理語(yǔ)言學(xué)研究(2015);省教育廳課題2項:安徽宣州吳語(yǔ)語(yǔ)言資源調查(2014),湘語(yǔ)與贛語(yǔ)共同特征的歷史比較研究(2014)。

      2.4 子課題四:南部方言語(yǔ)料研究

      負責粵語(yǔ)、閩語(yǔ)、客家話(huà)、贛語(yǔ)4個(gè)方言點(diǎn)的語(yǔ)料研究,負責人暨南大學(xué)陳曉錦教授。2014年7月至今(2016年7月),該組完成3方言點(diǎn)語(yǔ)料的錄制,開(kāi)始語(yǔ)料轉寫(xiě)。剩余的1個(gè)方言點(diǎn)預計2016年12月前完成采錄。

      該組成員同時(shí)進(jìn)行本方言的相關(guān)研究,發(fā)表論文10篇。

      2014年該組成員獲得國家社科基金課題2項(重大與重點(diǎn)各一):海外華人社區漢語(yǔ)方言與文化研究(重大)、美國華人社區漢語(yǔ)方言與文化研究(重點(diǎn))。

      2.5 子課題五:方言口語(yǔ)韻律研究

      負責人南京師范大學(xué)顧文濤教授。根據開(kāi)題評審專(zhuān)家“收縮任務(wù)”“研究韻律詞變調”的意見(jiàn),本組研究任務(wù)有所調整。

      該組目前已完成的研究:

      (1) 南京、徐州、蘇州、常州方言句焦點(diǎn)重音的韻律編碼方法的對比研究;

      (2) 基于聲調格局的“邊緣吳語(yǔ)”概念研究;

      (3) 仙居話(huà)內爆音發(fā)聲態(tài)研究。

      正在進(jìn)行的研究:

      (1)江淮官話(huà)和吳語(yǔ)的發(fā)聲態(tài)研究;

      (2)方言區的情感語(yǔ)音特征研究。

      該組成員同時(shí)進(jìn)行韻律及方言的相關(guān)研究,發(fā)表論文6篇。

      三、調查研究

      有文獻調查和實(shí)地語(yǔ)料調查研究?jì)深?lèi)。

      3.1 文獻調查

      文獻調查的主要目的是擬制各方言語(yǔ)料采制底本,其次是梳理各方言音系的已有研究。已完成采錄的17方言在2014年7月前已完成文獻調查,F有3個(gè)方言點(diǎn)正在調查研究相關(guān)文獻。

      3方言之一的贛語(yǔ)已完成語(yǔ)料采制底本的擬制,正在查閱梳理音系研究文獻。冀魯官話(huà)與中原官話(huà)正在調查研究本方言特有文化與特征詞的相關(guān)文獻,查閱梳理本方言音系研究的相關(guān)文獻,然后撰寫(xiě)本方言特有語(yǔ)料采制底本與音系研究綜述,預計于8月底完成并提交審核。

      3.2 實(shí)地調研

      已完成的17方言點(diǎn)的語(yǔ)料均在方言當地調查與錄制。有些方言點(diǎn)調查與錄制分數次完成(多在上課期間),有的集中時(shí)間一次完成(多在假期)。另3個(gè)方言點(diǎn)將于2016年9月至12月赴當地調查。

      四、舉辦學(xué)術(shù)會(huì )議

      2015-2016年舉辦了三次學(xué)術(shù)會(huì )議:

      (1) 本項目中期研討會(huì )(項目組全體骨干成員會(huì )議,南京,2015)

      (2) 2015實(shí)驗方言學(xué)論壇(全國性學(xué)術(shù)會(huì )議,南京,2015)

      (3) 第五屆海外漢語(yǔ)方言國際學(xué)術(shù)研討會(huì )(國際學(xué)術(shù)會(huì )議,美國舊金山,2016)

      4.1本項目中期研討會(huì )2015年11月在南京召開(kāi)

      11月6日報到,11月7日召開(kāi)。項目組全體骨干成員從全國各地赴會(huì )(有兩人請假,派員參會(huì ))。下圖3為與會(huì )者合影。

        

      圖3 項目中期研討會(huì )合影

      會(huì )議有三項議程:(1)匯報課題進(jìn)展與問(wèn)題:(2)審議語(yǔ)料庫管理軟件;(3)培訓4款語(yǔ)料轉寫(xiě)軟件(方法)。

      表2 “漢語(yǔ)方言自然口語(yǔ)有聲基礎語(yǔ)料庫建設”中期研討會(huì )日程

      會(huì )議按照以上日程順利進(jìn)行。聚焦點(diǎn)是鮑培明副教授演示的語(yǔ)料庫網(wǎng)頁(yè)設計,與會(huì )者提出了各種建設性意見(jiàn)。其次是各方言點(diǎn)語(yǔ)料采制工作,全體成員具體探討了語(yǔ)料采錄、整理及語(yǔ)料轉寫(xiě)的各類(lèi)問(wèn)題。

      4款語(yǔ)料轉寫(xiě)軟件(方法)的培訓采用講解與現場(chǎng)實(shí)習模式,講解后隨即試用并提出修改意見(jiàn),講者與聽(tīng)者均有收益。

      4.2 舉辦“2015實(shí)驗方言學(xué)論壇”(南京,11月)

      這是第二屆實(shí)驗方言學(xué)論壇。由中國語(yǔ)言學(xué)會(huì )語(yǔ)音學(xué)分會(huì )主辦、本項目所屬南京師范大學(xué)文學(xué)院與南京師范大學(xué)綜合語(yǔ)音實(shí)驗室承辦。五十余名國內外著(zhù)名實(shí)驗語(yǔ)音學(xué)家、方言學(xué)家及青年學(xué)者出席會(huì )議,本項目中期會(huì )議與會(huì )者均出席。下圖是合影。會(huì )議的主旨之一是推動(dòng)方言研究數字化,這是本項目建設的兩項目標之一。項目組發(fā)布了前期電子成果“現代漢語(yǔ)方言有聲詞匯庫”。

      應《方言》雜志主編麥耘教授約稿,“2015實(shí)驗方言學(xué)論壇”的會(huì )訊發(fā)布于《方言》2016年第1期。

      圖4 項目組舉辦的全國性學(xué)術(shù)會(huì )議的

      4.3 舉辦“第五屆海外漢語(yǔ)方言國際研討會(huì )學(xué)術(shù)”(2016,美國舊金山)

      7月15-17日在美國舊金山召開(kāi)。由美國舊金山大學(xué)與中國暨南大學(xué)聯(lián)合主辦,本項目子課題負責人陳曉錦教授是中方主辦人,本項目首席專(zhuān)家與另一位方言子課題負責人出席。這是漢語(yǔ)方言學(xué)術(shù)會(huì )議第一次走出國門(mén),與陳曉錦教授2014年中標的國家社科基金重大項目“海外華人社區漢語(yǔ)方言與文化研究”(14ZDB107)相呼應。國際國內50余名方言學(xué)者出席會(huì )議,中心議題除海外漢語(yǔ)方言與文化的研究外,還包括方言研究的數字化。

      五、學(xué)術(shù)交流

      5.1 出席學(xué)術(shù)會(huì )議

      2014年7月至2016年7月,項目組成員出席國際、國內重要學(xué)術(shù)會(huì )議50人次。

      除由項目組舉辦的“第五屆海外漢語(yǔ)方言國際研討會(huì )學(xué)術(shù)”“(2016年7月,美國舊金山)和“2015實(shí)驗方言學(xué)論壇”(2015年11月,南京)外,其他重要會(huì )議還有:“第十二屆全國語(yǔ)音學(xué)學(xué)術(shù)會(huì )議”(2016年7月,通遼),“漢語(yǔ)方言國際學(xué)術(shù)高端論壇”(2015年9月,成都),“首屆亞太語(yǔ)言文化生態(tài)國際會(huì )議”(2015年6月,廣州),“中國語(yǔ)言學(xué)會(huì )第十七屆學(xué)術(shù)年會(huì )” ( 2014年9月,北京),“he 3rd CCF Conference on Natural Language Processing & Chinese Computing(NLPCC 2014)”(2014年12月,深圳),“‘動(dòng)態(tài)普通話(huà):變異與規范’首屆學(xué)術(shù)研討會(huì )”(2014年11月,澳門(mén)),“第47屆國際漢藏語(yǔ)言暨語(yǔ)言學(xué)會(huì )議”(2014年10月,昆明),“第十三屆全國計算語(yǔ)言學(xué)學(xué)術(shù)會(huì )議(CCL2014)”(2014年10月,武漢),“第十一屆中國語(yǔ)音學(xué)學(xué)術(shù)會(huì )議”(2014年8月,烏魯木齊),“Australian International Speech Science and Technology Conference 2014”(2014年12月,新西蘭Christchurch),等。

      5.2學(xué)術(shù)講座

      2014年7月至2016年7月,項目組成員應邀在國內外講座11人次。

      2016年4月,劉俐李教授應邀在南京曉莊學(xué)院做“漢語(yǔ)方言地理信息系統”講座。

      2016年4月,顧文濤教授應邀在日本東京大學(xué)做“Speech prosody of Chinese languages(漢語(yǔ)演講的韻律)”講座。

      2015年11月,顧文濤教授應邀在意大利那不勒斯東方大學(xué)做“Quantitative analysis of L1 and L2 Mandarin speech prosody(L1和L2普通話(huà)韻律的定量分析)”講座。

      2015年9月,顧文濤教授應邀在德國基爾大學(xué)做“From function to form in the study of Mandarin speech prosody(漢語(yǔ)韻律的功能與形式研究)”講座。

      2015年7月,劉俐李教授應全國漢語(yǔ)方言學(xué)會(huì )邀請在“漢語(yǔ)方言田野調查高級研修班”(上海交通大學(xué))做“方言研究數字化”講座。

      2015年4月,劉俐李教授應邀在湖南科技大學(xué)做“漢語(yǔ)方言地理信息系統”講座。

      2015年3月,莫超教授應邀在隴南市政府做“‘氐羌來(lái)賓’:遠古走來(lái)的白馬藏人”。

      2014年12月,顧文濤教授應邀在澳大利亞麥考瑞大學(xué)做“Stress, tone and intonation in L2 Mandarin speech by English and Cantonese learners”講座。

      2014年11月,劉俐李教授應邀在澳門(mén)大學(xué)講學(xué)一周,有兩個(gè)專(zhuān)題:(1)現代語(yǔ)音學(xué)研究與應用;(2)方言音系(聲韻調)的系列實(shí)驗研究。

      2014年8月,劉俐李教授應全國漢語(yǔ)方言學(xué)會(huì )邀請在“2014田野調查語(yǔ)音學(xué)研修班”(珠海)講授“方言音系實(shí)驗”。

      六、成果宣傳推介情況

      成果推介。項目組在“2015實(shí)驗方言學(xué)論壇”宣傳并推介前期電子成果“現代漢語(yǔ)方言有聲詞匯庫”。

      2014年7月至今(2016年7月),項目組在《中國社會(huì )科學(xué)報》發(fā)表4篇文章介紹本項目學(xué)術(shù)思想與研究成果:“數字化推動(dòng)特色方言口語(yǔ)庫建設”(2014/8/11),“漢語(yǔ)河州話(huà)的形成及其語(yǔ)言性質(zhì)”(2015/9/10),“從西北方言文獻角度考察文化變遷”(2016/2/25),“氐羌來(lái)賓”:遠古走來(lái)的白馬藏人”(2015/4/15)。

      本項目倡導并實(shí)踐的“方言研究數字化”已為國家社科規劃辦采納,列為2014年度國家社會(huì )科學(xué)基金項目語(yǔ)言學(xué)課題指南的第12號“方言研究數字化基礎建設研究”(首席專(zhuān)家劉俐李教授2011年將“方言研究數字化基礎建設”上報“國家哲學(xué)社會(huì )科學(xué)重大基礎理論研究選題建議”)。

      工作簡(jiǎn)報。2014年7月呈報中期評估報告(1.76萬(wàn)字),2015年7月撰寫(xiě)了中期評估報告(2.37萬(wàn)字,上報未收),12月呈報《工作簡(jiǎn)報》(0.8萬(wàn)字)。

      七、研究中存在的主要問(wèn)題和改進(jìn)措施

      因經(jīng)費少、工作量大而造成一些操作性困難。開(kāi)題時(shí)項目組根據下?lián)芙?jīng)費情況收縮了任務(wù),但方言布點(diǎn)與語(yǔ)料庫結構只能微調無(wú)法大減,否則會(huì )傷及項目的基礎設計。項目組想方設法應對這一困難,主管單位也盡力協(xié)助。

      7.1 因任務(wù)重經(jīng)費少有6方言負責人請辭

      方言子項目負責人先后有6人請辭(贛語(yǔ)、閩語(yǔ)(2)、客家話(huà)、冀魯官話(huà)與西南官話(huà))。

      不少方言點(diǎn)負責人同時(shí)承擔國家語(yǔ)委、教育部的“中國語(yǔ)言資源保護工程專(zhuān)項任務(wù)”。該項目每方言點(diǎn)撥經(jīng)費8萬(wàn)(方言語(yǔ)料)和15萬(wàn)(文化語(yǔ)料),本項目只有2萬(wàn)。以8萬(wàn)計,為本項目的4倍,而本項目工作量為其4倍多(見(jiàn)表3數據)。負責人請辭也是事出有因。

      表3 兩項目單方言點(diǎn)語(yǔ)料量及經(jīng)費對比

      解決辦法:改由項目組承擔此6方言的語(yǔ)料研制。

      項目組曾多方設法另找方言點(diǎn)負責人,但無(wú)合適者:或本人愿意但與課題要求不符,或雖符合課題要求而本人得知任務(wù)后又打退堂鼓。

      問(wèn)題雖已解決,但此6方言進(jìn)度后延,影響到項目的整體進(jìn)度。原計劃2016年12月完成全部語(yǔ)料研制,2017年試運行語(yǔ)料庫并完善語(yǔ)料庫管理軟件。但此6方言的語(yǔ)料研制預計分別于2017年與2018年完成,原定2017年的工作只得順延。

      二、研究成果情況

      一、代表性成果

      以下所列5項成果均與方言研究的革新和數字化有關(guān),方言研究數字化是本項目的建設目標之一。

      國家社科重大項目除完成所設定的研究任務(wù)外,還應有益于學(xué)科建設。漢語(yǔ)方言學(xué)從20世紀20年代誕生至今已近一個(gè)世紀,碩果累累。但需要發(fā)展。我們認為,漢語(yǔ)方言學(xué)承繼先賢智慧與碩果,對語(yǔ)言靜態(tài)基礎單位字、詞的研究已達極致,儲備了足夠的發(fā)展勢能。探索語(yǔ)言動(dòng)態(tài)運作基本單位語(yǔ)篇,應是本世紀漢語(yǔ)方言學(xué)發(fā)展的重要方向,因為語(yǔ)篇的動(dòng)態(tài)研究更能揭示語(yǔ)言本質(zhì),故此,國際語(yǔ)言學(xué)界近年推崇立足于語(yǔ)篇研究的功能語(yǔ)言學(xué)。但研究語(yǔ)篇的工作量遠大于字詞,傳統的作坊式手工勞動(dòng)已不能勝任,與之匹配的應是方言研究的數字化,包括①采錄語(yǔ)料數字化,②確定語(yǔ)料音質(zhì)實(shí)驗數據化,③轉寫(xiě)標注語(yǔ)料軟件化,④匯集語(yǔ)料數據庫化,⑤繪制方言地圖平臺化,⑥刊布成果自控化(《中國社會(huì )科學(xué)報》2014年8月11日)。所報5項成果與上述①至④有關(guān)。這5項成果都很稚嫩,但這是我們邁出的第一步,祈望能拋磚引玉,推動(dòng)方言研究的數字化發(fā)展。

      1.1《漢語(yǔ)方言語(yǔ)料采制手冊》(16.6萬(wàn)字)

      這是本項目工作的法規性文件。2013年完成初稿,2014年試用后修訂,2015年再試用再修訂,同年11月在項目中期研討會(huì )印發(fā)紙質(zhì)本。該手冊分上下兩編。

      如上所述,轉型語(yǔ)篇研究是本世紀漢語(yǔ)方言學(xué)發(fā)展的重要方向,本手冊下編為方言學(xué)轉型提供了語(yǔ)料采集的初本。與方言語(yǔ)篇研究匹配的研究方式是方言研究的數字化,本手冊上編提供了語(yǔ)料采集數字化初案。

      上編有梳理資料、采錄語(yǔ)料與整理語(yǔ)料三項規范。

      (1)資料規范:有擬制文化語(yǔ)料及特征詞規范,確定音系規范。

      (2)采錄規范:有采錄對象、采錄內容、音頻采錄與處理、視頻采錄與處理、拍照等五項規范。同時(shí)提供具體操作指導。

      (3)語(yǔ)料整理規范:有音頻與視頻剪輯、轉寫(xiě)漢字、標注國際音標、字詞標注及復核、例句標注及復核、語(yǔ)篇標注、數據模板、入庫數據語(yǔ)料包等八項操作規范。同時(shí)寫(xiě)明各類(lèi)軟件的使用方法、操作步驟與具體要求。

      下編有語(yǔ)料概覽、基礎語(yǔ)料與語(yǔ)篇語(yǔ)料三部分。

      (1)語(yǔ)料概覽:用6張表列出采錄底本的結構、語(yǔ)料種類(lèi)、數量,各類(lèi)語(yǔ)料錄制時(shí)長(cháng)、錄制方式,不同角色發(fā)音人的具體任務(wù)。

      (2)基礎語(yǔ)料:有單字4002個(gè),雙音節韻律詞546組(研究變調用),詞匯約5600(核心詞200、基礎詞29類(lèi)5260詞、特征詞100-300),語(yǔ)法例句100。

      (3)語(yǔ)篇語(yǔ)料:有話(huà)本、話(huà)題、自話(huà)三類(lèi)。話(huà)本語(yǔ)篇有六類(lèi),分所有方言通用與各方言特用。話(huà)題語(yǔ)篇有四類(lèi):?jiǎn)慰跀⑹鲂、多口交互型、儀式型、藝術(shù)型,每類(lèi)提供話(huà)題及引導詞。自話(huà)語(yǔ)篇有自然場(chǎng)景與特定場(chǎng)景兩種。

      上編集中闡述采制方言語(yǔ)料的數字化方式與技術(shù)手段。下編是以語(yǔ)篇為核心的自成體系的語(yǔ)篇采錄大綱。就我們目力所及,語(yǔ)篇調查大綱在漢語(yǔ)方言學(xué)界尚未見(jiàn),本手冊應是首次。

      1.2 現代漢語(yǔ)方言有聲詞匯庫V1.0(網(wǎng)址:fych.njnu.edu.cn,4.94G)

      語(yǔ)料庫是儲存語(yǔ)料的數字化方式!艾F代漢語(yǔ)方言有聲詞匯庫”是本項目的前期成果,可在網(wǎng)上查詢(xún)使用,是一個(gè)兼顧語(yǔ)音的方言有聲詞匯庫。2016年取得國家計算機軟件著(zhù)作權(登記號2016SR157089)。由兩期211重點(diǎn)學(xué)科建設項目資助建設,10年中約40名碩士生、博士生參與研究。2008年建成單機光盤(pán)版,2012年改造成網(wǎng)絡(luò )版。經(jīng)多次語(yǔ)料復核后2015年11月上網(wǎng),更名為“現代漢語(yǔ)方言有聲數據庫”(該庫還有二期建設的其他語(yǔ)料,但未完成復核,未上網(wǎng),該庫目前只有詞匯)。下圖是其首頁(yè)。

      圖8 “現代漢語(yǔ)方言有聲詞匯庫”首頁(yè)

      該庫所選方言點(diǎn)分布于全國10大方言區,覆蓋官話(huà)的8個(gè)二級區,以及湘、閩、吳語(yǔ)的部分二級區。每方言點(diǎn)錄制詞匯3600~4000條。每條數據有26字段,分5類(lèi):詞項,詞屬,詞音,詞義,詞性。詞項是綱,統領(lǐng)各方言詞義;“詞屬”標明每一詞條的詞匯大類(lèi)(基礎詞、核心詞、特征詞);“詞音、詞義、詞性”

      描寫(xiě)詞條的內部構造。詞音與詞義并注,聲音與文本同現,集中反映方言詞匯的共性和個(gè)性?蓮姆窖、詞項、詞屬、詞音、詞義、詞性等不同角度檢索詞匯,還可進(jìn)行聲母、韻母、韻尾、調類(lèi)、調值、音節數等單項或多項語(yǔ)音檢索?蛇x擇單點(diǎn)或多點(diǎn)方言組合檢索?稍跈z索結果中進(jìn)行10次再檢索。每種檢索同時(shí)匹配文本與聲音,并有計數?捎糜谡Z(yǔ)音、詞匯的專(zhuān)項研究,也可用作教學(xué)演示,如方言課、語(yǔ)音課,中小學(xué)語(yǔ)文課,文化課等,也可供社會(huì )使用。

      本項目所建語(yǔ)料庫與此詞匯庫不同:(1)本項目所建庫有字庫、詞庫、句庫和語(yǔ)篇庫,該庫只是兼顧語(yǔ)音的詞匯庫;(2)本項目詞庫每方言有5600詞,該庫是3600~4000詞;(3)本項目詞庫數據有137字段,該庫為26字段;(4)兩庫的方言布點(diǎn)與發(fā)音人皆有不同。

      1.3 語(yǔ)料庫標音系統

      這是一個(gè)給方言詞和方言句子自動(dòng)標注國際音標的軟件。由鮑培明副教授團隊研制。軟件自身占用空間6兆。無(wú)需安裝,直接復制即可使用。該標音系統附有使用說(shuō)明,有文有圖,按圖索驥便可操作。使用前將要標音的詞表、句表與已標好音的字表復制到軟件指定位置。然后運行程序,即可自動(dòng)完成詞表與句表的標音。漢字標音后需要手動(dòng)標注詞匯中的音變,如變調、變聲與變韻。

      本項目各方言已使用,普遍反映提高了標音效率。其他方言也可使用,前提是按照本項目字表、詞表與句表的格式輸入數據。

      1.4 同音類(lèi)記法

      是一種快速記音法,基本原理是聚類(lèi)同音字、批量記音,而不必一字一記。按照同音聚類(lèi)原理,利用EXCEL表的批量處理功能,即可實(shí)現字表的快速記音。關(guān)鍵步驟是聚類(lèi)同音字、批量記音與校音。記音的第一步是給方言音系的聲韻調例字標注方音;第二步利用方音與古音的對應關(guān)系聚類(lèi)同音字;第三步用EXCEL表的批量處理功能記錄字音;第四步關(guān)聯(lián)漢字音檔與標音,運用同音校對法核對標記的字音,校正與古音不對應的字音。

      該方法由侯超實(shí)驗師與劉俐李教授歸納整理。

      1.5方言聲調分析軟件VoiceSort

      這是一款用于分析和歸納方言聲調的軟件。由宋益丹講師研制。

      軟件的設計思路是對接praat基頻提取腳本,實(shí)現方言聲調五度值轉換的批量處理,提升方言聲調系統歸納的效率。VoiceSort分析和歸納方言聲調系統的

      優(yōu)勢:

      (1)根據五度值曲線(xiàn)進(jìn)行調類(lèi)歸納,不受主觀(guān)因素干擾,聲調系統的歸納過(guò)程更具科學(xué)性,并有助于發(fā)現聲調系統的動(dòng)態(tài)變化;

      (2)批量處理多個(gè)文件(如老男、老女、青男、青女),無(wú)需分次打開(kāi),大大提高聲調歸納的效率;

      (3)所有樣本的作圖自動(dòng)完成,一步到位;數據與圖表直接以excel表形式輸出,便于數據匯總和結果呈現。

      目前已完成單字調的分析部分,預計于2017年1月完成雙字調系統的自動(dòng)化處理,實(shí)現軟件的全部功能。

      同音類(lèi)記法、語(yǔ)料庫標音系統與方言聲調分析軟件VoiceSort,是針對本項目字表、詞表、句表的標音以及聲調研究的數據處理工具,覆蓋了本項目4個(gè)子庫的語(yǔ)料標音(語(yǔ)篇可拆分成句應用標音系統)。這套方言研究的系列數字化工具有效緩解了本項目語(yǔ)料標注的難題,同樣也應有助于其他同類(lèi)研究。

      2014年至2016年,項目組成員獲立國家社科基金課題6項,其中重大項目1項,重點(diǎn)課題1項。

      二、成果清單 見(jiàn)下頁(yè)。

      成果清單

      課題組供稿

      (責編:沈王一)