簡繁智能轉換

漢字簡繁文本智能轉換系統 官方博客
漢字簡繁文本智能轉換系統提供了字、詞、術語、標點等不同層次的轉換功能,以及網頁轉換服務,轉換準確率高於國內外同類產品。
廈門大學自然語言處理實驗室出品

國家語委漢字簡繁文本智能轉換系統成果居國際領先水平

  近日,《漢字簡繁文本智能轉換系統》第二期成果在京通過專家鑑定。該項目是教育部、國家語委為落實《第五屆兩岸經貿文化論壇共同建議》設立的專項項目,是兩岸語言文字交流合作的又一重要成果。項目由廈門大學、教育部語言文字應用研究所、北京師範大學聯合承擔,第一期成果於2014年11月發布,已免費提供社會使用。

  《漢字簡繁文本智能轉換系統》能夠進行面向中國台灣、面向古籍、面向香港的多種簡繁轉換,克服了同類軟件在“一簡對多繁”轉換情況下的不足。系統可同時進行字、詞、專業術語、標點符號等多種轉換,還提供了網站全部頁面轉換功能,能夠滿足用戶不同轉換需求。此外,廈門大學研發團隊建立的23億字的繁體語料庫,...

基於語義相似度的兩岸對應詞語發現方法


王博立,史曉東. 基於語義相似度的兩岸對應詞語發現方法. 漢語詞彙語義學研討會, 2015. 下載


漢字簡繁文本智能轉換系統 宣傳材料

語料庫語言學視角下的台灣漢字簡化研究Poster

語料庫語言學視角下的台灣漢字簡化研究


王博立,史曉東,陳毅東,任文瑤,閻思瑤. 語料庫語言學視角下的台灣漢字簡化研究. 北京大學學報(自然科學版),2015,02:249-254.(同時發表在NLPCC2014) 下載

漢字簡繁文本智能轉換系統常見問題

:為什麼單機版要求需要8G以上內存?

:由於簡繁轉換系統運用了大規模的語言模型,為保證語言模型能完全讀入內存,計算機必須有8G以上內存。


:word插件的轉換速度為什麼比word自帶的簡繁轉換功能慢很多?

:由於由於微軟開放的word開發接口中不能直接操作底層的文本內容,因此為了保留文檔的樣式,word插件必須比word本身進行更多的文本樣式判斷和處理。如果需要得到快速的簡繁轉換而無需保留文檔樣式,可以勾選“丟棄樣式”選項。


:word插件為何需要進行聯網轉換?

:由於簡繁轉換系統運用了大規模的語言模型,因此難以在普通用戶的計算機上運行。我們採用基於雲服務的架構,...

《漢字簡繁文本智能轉換系統》發佈會在京召開