维基词典:語系
本页或以下篇幅是一项有關维基詞典的方针、指引或流程的提议。该提议可能仍需要进一步的完善,需要更多讨论并进一步获得社群的共识来确立。请勿在引用或者链接中把本页的描述作为一项正式的方针或指引。 |
維基詞典將語言分為不同的語言家族(包括語門、語系、語族、語支、語組等稱呼,以下以「語系」稱之)。大多數語系是藉由共同祖先而聯繫在一起的,但也有少數語系僅僅是普通分類,如「克里奧爾語和皮欽語」。維基詞典按語系組織語言分類和派生分類。每個語系在維基詞典上都有一個名稱和一個代碼。
關於語言和方言的討論,請分別參見Wiktionary:語言和Wiktionary:方言。
語系代碼
编辑維基詞典使用代碼來表示語系。語系代碼及相關數據存儲在Module:families中。這些代碼通常由三個字母組成,或者是三個字母後跟連字符再跟三個字母。特殊情況下,還可能是其他字符串。語系代碼可以合理地用於詞源模板中,如{{der}}
、{{bor}}
和{{inh}}
,當然也用於專門用於重構的命名空間。
遺傳語系
编辑遺傳語系(Genetic families)是具有共同祖先的語言群體。維基詞典在將語言分為遺傳分類時遵循主流學術觀點。每個遺傳語系都有一個代碼。
許多遺傳語系有ISO 639-5代碼。當有可用的 ISO 639-5 代碼時,維基詞典也會使用它。例如,漢藏語系是 sit
,南亞語系的代碼是 aav
,日本-琉球語系是 jpx
。
當一個語系沒有標準的 ISO-639-5 代碼,但它的某個上層語系有代碼時,維基詞典會為它分配一個由兩部分組成的特殊代碼。第一部分是其最接近的上層語系的 ISO-639-5 代碼,第二部分是三個小寫字母,通常近似於該語系的名稱。例如,帕馬-恩永甘語系是 aus-pam
:當中 aus
是澳大利亞語言的 ISO 639-5 代碼,pam
則是「帕馬-恩永甘」的縮寫。布立吞亞支是 cel-bry
;漢白語支是 sit-sba
;佤德昂語支是 mkh-pal
。
當一個語系及其所有上層語系都沒有 ISO 639-5 代碼時,會使用特殊代碼「qfa
」作為第一部分,其中「q...」範圍是 ISO 允許私人使用的,而「fa」代表「family(語系)」。例如,中部大安達曼語族是 qfa-adc
。
非遺傳類別和孤立語
编辑並非所有語言分組都是遺傳性的。有些群體包含具有其他共同特性的語言,或在某個特定地區使用的語言。以下是被認可的分類:
art
= 人工/人造語言,是由語言學家或業餘愛好者有目的地創造的。有些可能被廣泛使用(如世界語),但大多數僅限於小型社群(如拉丹語)。crp
= 克里奧爾語或皮欽語,它們是作為沒有共同語言的群體之間的溝通方式而發展起來的。例如,塞拉利昂克里奧爾語、寒溪語、洋涇浜英語。sgn
= 手語(如美國手語),這些語言不是通過說話而是通過手勢來交流的。qfa-mix
= 混合語言,由兩種或多種語言大致等量混合而成,通常由能流利說出源語言的人創造。qfa-iso
= 語言孤立體,這些語言與任何其他語言都沒有明確的關係(如阿伊努語)。qfa-not
= 原則上不屬於任何語系的語言,因為它們不是真正的語言。「跨語言」(mul
)、「未確定」(und
)和「底層」(qfa-sub
)不是語言,不能被視為任何語系的成員。這個代碼也用於在維基詞典中被視為語系但實際上並不相關的語言群體。前面提到的特殊語系代碼本身也使用這個代碼。
語系名稱
编辑- 所有的語系名稱在各自的維基詞典條目中都應被定義為中文單詞。
- 每一語系只使用一個名稱(用於詞源、分類和其他方面)。當有兩個或更多可能的名稱時,應選擇其中一個。
- 為明確起見,應盡可能避免語系和語言使用相同的名稱。
- 語系的其他名稱應在每個條目的「同義詞」或「替代形式」章節中列出。