L10n:Språkkonventionskoder

From MozillaWiki
Jump to: navigation, search

Mozilla L10n: Swedish Huvudsida | Engagera dig | Översikt | Projektledning På engelska | Grupper På engelskasv-SE | Möten På engelska | Blogg På engelska | Verktyg


Idea.png
For the English version of this page, see L10n:Locale Codes.

En språkkonvention (en. locale) är en kodbeteckning, som vanligen används för att indikera

  • det språk (d.v.s. skriftspråk) som skall visas och
  • den region (i vilken språket talas) som avses.
Språkkonventioner kan även innehålla koder som indikerar
  • den dialekt/variantform av språket som avses,
  • den språkfamilj språket tillhör,
  • det alfabet som skall användas vid visning och
  • många andra egenskaper, som vi inte behöver ta upp här.

Regler för Mozillas språkkonventionskoder

Ledningen för MLP har beslutat att använda ett utökat schema för språkkonventionskoder i enlighet med RFC 4646 om språktaggar, som sedan beslutet togs har ersatts av RFC 5646: "Tags for Identifying Languages".

Det här innebär att vi utöver de gamla koderna (som har formatet ab-XY) även stöder enkla koder som endast anger språk och t.o.m. utökade koder som kan innehålla dialekter.

De aktuella språkkonventioner som Mozilla använder finns alltid listade på sidan Mozilla Web Localization Dashboard.

Parametrar

Grundformatet för våra språkkonventionskoder är <språk>-<region>-<dialekt>, där parametrarna <region> och <dialekt> är valfria, med förbehåll.

I själva verket skall alla språk, inom vilka skriftspråket inte skiljer sig mellan olika regioner endast använda parametern <språk>. Om de regionala skillnaderna påverkar hur skriftspråket ser ut och används, så läggs parametern <region> till (enl. <språk>-<region>). Och om det dessutom finns stora dialektala skillnader inom regionen (som påverkar skriftspråket) lägger man till parametern <dialekt> (enl. <språk>-<region>-<dialekt>). Parametrarna avgränsas med bindestreck.

Språk

Språkkoden följer ISO 639-1 (2 bokstäver) eller ISO 639-2 (3 bokstäver), beroende på i vilken av de två standarderna språket ifråga är medtaget. Om det finns en sådan skall ISO 639-1-koden användas. Språkkoden skrivs med gemener.

Exempel:
  • de för tyska, eo för esperanto, sv för svenska, o.s.v.

Region

Begreppet "region" betyder i de allra flesta fall "land"/"rike". Regionkoden följer ISO 3166 (2 bokstäver) och skrivs med versaler.

Exempel 1:
  • DE för Tyskland, IN för Indien, SE för Sverige, o.s.v.

För variantformer av språk – två eller fler varianter av ett och samma språk, som inte kan sägas vara separata språk och som förstås av personer från andra länder där språket talas och skrivs – används formatet <språk>-<region> för att markera att det finns en viss skillnad, men att den framförallt är regionalt betingad.

Exempel 2:
  • es-ES för spanska talad i Spanien, es-AR för spanska talad i Argentina, es-MX för spanska talad i Mexiko, o.s.v.
  • sv-SE för rikssvenska och sv-FI för finlandssvenska.

Språkkonventionen en-US (d.v.s. amerikansk engelska) är Mozillas standardspråkkonvention.

Dialekt

I sällsynta fall kan vi behöva bifoga dialektparametern. Vissa språk och dialekter finns medtagna i ISO 639-3 (3 bokstäver; administreras av SIL International), när så är fallet skall den däri angivna koden användas. I de fall en dialekt inte finns angiven i ISO 639-3 kan den skrivas på fri hand (3 till 8 bokstäver), men bör då formmässigt hålla sig till det engelska namnet på dialekten som avses. Dialektkoden skrivs med gemener.

Exempel:
  • ISO 639-3: vec för venetianska.
  • Fri hand: t.ex. gutnish för gutniska, elfdal för älvdalska, bavarian för bayerska, o.s.v.

För närvarande kan vi tänka oss två scenarier, där dialektkoden kan komma att användas.

  1. Om ett språk saknar en ISO 639-2-kod, men det finns användare som vill göra en översättning; så är t.ex. fallet för den venetianska översättningen av Firefox. Här kan vi använda den allmänna identifieraren för språkfamiljen (romanska språk: roa) ur ISO 639-2 som språkkod och lägga till en identifierare för språket i form av en dialektkod, enligt formatet <språk>-<region>-<dialekt>. Om språket ifråga har en ISO 639-3-kod, så skall den användas. I exemplet med venetianska ger det oss språkkonventionen roa-IT-vec.
  2. Om det finns en genuin dialekt av ett språk, som tillåts skapa en språkkonvention. Vi tänker oss ett L10n-projekt för bayerska. Det skulle i sådana fall komma att få koden de-DE-bavarian eller liknande.

Scheman som stöds

För att sammanfatta. Följande språkkonventionsscheman stöds:

  • ab
  • ab-XY
  • abc-XY
  • abc-XY-SIL
  • abc-XY-dialekt

där

  • ab/abc följer ISO 639-1/639-2,
  • XY följer ISO 3166,
  • SIL följer ISO 639-3,
  • dialekt följer reglerna som anges i RFC 5646, d.v.s. 5 till 8 bokstäver (a-z), eller ett nummer följt av tre bokstäver (a-z) eller tre siffror.

För närvarande stöder vi, vid utgivning av nya programversioner, endast de språkkonventioner, som använder det ovan beskrivna namngivningsformatet och som har översatta filer i CVS under partitionen l10n/ (i CVS huvudkatalog). De nya reglerna gäller närmare bestämt Firefox och Thunderbirds stamkod ("trunk") för version 1.1 och senare. Vi stöder inte det nya namngivningsformatet för Firefox/Thunderbird 1.0.x (el. tidigare) eller Mozilla Suite. För dem gäller fortfarande de två gamla formaten ab-XY och abc-XY.

Observera att vi (ännu) inte stöder språkkonventionskoder/-taggar i andra format än de som beskrivs ovan, även om det kan finnas sådana i förslag till nya RFC:er eller i IANA-registrerade taggar.

Svenska språket

För svenska gäller tills vidare språkkonventionen sv-SE. Finlandssvenska finns inte med i listan över de språkkonventionskoder Mozilla använder, men skulle få koden sv-FI om det någon gång vore aktuellt. Det är möjligt att svenska i framtiden endast kommer att betecknas med en språkkod, d.v.s. sv, eftersom regionala varianter av svenska språket utanför Sverige och Finland är så små, att de inte motiverar, eller ens kan upprätthålla, separata översättningar.

Dialekter

Svenskan är rent skriftmässigt ett homogent språk, så ytterst få svenska dialekter kan komma ifråga att få skapa översättningar inom Mozilla under en egen språkkonvention. Däremot skulle möjligen mycket särpräglade dialekter med egna skriftspråk, t.ex. gutniska och (i viss mån) jamska, kunna godkännas att få skapa översättningar, förutsatt att användarbasen är stor nog och att kontinuiteten för utveckling av översättningen kan garanteras. Älvdalskan är den variant av svenska, som har det bäst utvecklade skriftspråket. Men älvdalskans omstridda taxonomiska ställning, d.v.s. om det är ett helt eget språk eller en dialekt av svenskan, har lett till att det inte har någon egen språkkod inom ISO 639-1, 639-2/639-5 eller 639-3. Det skulle därför under rådande förutsättningar få en dialektal kod i stil med sv-SE-elfdalia.

Externa länkar