DiSCUSS現(xiàn)代漢語平衡口語語料庫的創(chuàng)建
提要:本文主要介紹“DiSCUSS現(xiàn)代漢語平衡口語語料庫”(簡稱DiSCUSS庫)的建設過程。作為國內(nèi)首個開源的百萬詞級現(xiàn)代漢語平衡口語語料庫,DiSCUSS庫采用與“國際英語語料庫”相同的取樣模式創(chuàng)建,庫容為100萬詞。該語料庫具有較好的平衡性和代表性,使其可廣泛應用于漢語口語研究、漢外口語對比等領域。(剩余9336字)
提要:本文主要介紹“DiSCUSS現(xiàn)代漢語平衡口語語料庫”(簡稱DiSCUSS庫)的建設過程。作為國內(nèi)首個開源的百萬詞級現(xiàn)代漢語平衡口語語料庫,DiSCUSS庫采用與“國際英語語料庫”相同的取樣模式創(chuàng)建,庫容為100萬詞。該語料庫具有較好的平衡性和代表性,使其可廣泛應用于漢語口語研究、漢外口語對比等領域。(剩余9336字)