維基詞典:繁簡處理

以下為維基百科上繁簡處理的介紹:(供參考)


中文版的繁簡體問題Zhengzhu和許多用戶的努力下,已經得到了初步解決。請參看w:Help:中文維基百科的繁簡處理,對於繁簡轉換出現的問題請到w:Wikipedia:繁簡體轉換請求反映。

初衷

編輯

如何處理繁體簡體的並存,是中文維基百科自創建以來最為迫切的問題之一。繁簡體之間的對應關係,不是簡單的一對一,而是複雜的多對多。而維基百科所面臨的問題,已經超出了繁簡之間的字體轉換問題。由於大陸、港澳、台灣、馬來西亞、新加坡等地多年來交流較少,許多外國譯名以及新生詞語也有非常大的分歧。如台灣所說的「帛琉」,在大陸卻是「帕劳」,大陸使用「打印机」,台灣用的卻是「印表機」。如此案例,屢見不鮮,且大大地超出了英語維基百科上英美詞語之間的分歧。由此可見,中文維基百科必須採取特殊的方法,不然就只能面臨繁簡分家的命運。

原先方法

編輯

中文維基百科建立時,雖然只有用一個域名「zh.wikipedia.org」,但實際上有不少條目都寫了兩個版本,如法国法國(国<=>國)就曾經是兩個不同的條目;繁簡名稱沒有區別的條目(如日本)也分成兩個條目(日本/簡,日本/繁)。這個方法的好處在於:條目內部不存在繁簡問題,繁體條目使用繁體字、港台詞彙、簡體條目使用簡體字、大陸詞彙,兩者互不干擾。但這種方法卻為大家大大地增加了工作量,因為繁簡版本之間很快地就不同步了,只能靠人工來整合繁簡之間的差異。

共識

編輯

我們的最終目標是:取消過去的繁簡分立體系,每個條目只保留一個版本,並通過電腦程序自動轉換繁簡體。

以上所提到的繁簡轉換,不僅僅要處理繁體字和簡體字的問題,還要處理大陸和港台之間詞彙分歧問題。如「帕劳」和「帛琉」也應該實現自動轉換。

當前的做法

編輯

用繁體或簡體創建的文章,標題必須是全部為簡體或繁體字,如果標題繁簡混雜,例如中國历史,那麼系統將無法自動轉換。在以前存在有繁簡體兩個版本的文章現在仍然需要通過手工進行合併。具體請參看Help:中文維基百科的繁簡處理#編輯一般文章時的注意事項

參看

編輯

w:Wikipedia:繁簡處理/技術方案以及w:Wikipedia:繁簡處理/轉換表校對工作