Internationalisation, localisation, codage, Islande et traduction d'un site Web de photos de chats japonais

traduction d'internationalisation

InternationalisationIl existe de nombreuses informations sur l'internationalisation, la localisation et l'encodage dans les applications Web. Il y a aussi beaucoup de malentendus sur ce que chacun fournit pour une application Web. Voici mon avis…

Lorsqu'un navigateur Web se connecte à un serveur Web, il transmet un certain nombre de variables et fait des requêtes supplémentaires, voici un exemple:

GET / HTTP / 1.1
Hébergeur: www.dknewmedia.com
Agent utilisateur: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Accepter: HTTP Accepter = text / xml, application / xml, application / xhtml + xml, text / html; q = 0.9, text / plain; q = 0.8, image / png, * / *; q = 0.5
Accept-Language: en-us, en; q = 0.5
Accept-Encoding: gzip, dégonfler
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

Internationalisation

L'internationalisation est un composite de plusieurs choses:

  1. Localisation: La capacité d'identifier la langue et l'emplacement à partir desquels un visiteur visite. Cela se fait via des requêtes HTTP où le visiteur est identifié par une locale. Dans mon cas, c'est en-US. «En» est l'anglais et «US» est les États-Unis. Il s'agit d'un paramètre de mon système d'exploitation.
  2. Fuseaux horaires: La possibilité de s'adapter aux fuseaux horaires. Ceci est normalement accompli en réglant votre serveur sur un temps moyen de Greenwich (GMT), puis en permettant aux utilisateurs de définir leur décalage local par rapport à GMT.
  3. Encodage de caractère: C'est la possibilité d'afficher correctement les jeux de caractères de langue. C'est différent de la localisation, car la localisation peut me dire la langue et la région de l'ordinateur à partir duquel la demande est effectuée, mais elle ne me dira pas de quelle langue le lecteur demande… c'est au lecteur!

Remarquez dans mon en-tête HTTP lorsque le navigateur a fait la demande, il a dit au serveur qu'il demandait mes paramètres régionaux (Accept-Language: en-us); cependant, il doit également indiquer au serveur quel jeu de caractères est demandé (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 et utf -8 sont tous les deux des jeux de caractères autorisés.

Localisation

Dans ce monde fantastique mélangé, la localisation ne dicte plus jamais la langue. Même si je suis en-US, je peux absolument lire une langue différente en utilisant un jeu de caractères différent ... c'est ce qui se passe lorsque j'utilise Google Hindi (Je n'utilise pas vraiment Google Hindi). Ma demande de paramètres régionaux et de jeu de caractères est identique à celle où je demande le Google Anglais page, mais je suis en fait alimenté par une page que je ne peux pas lire car je n'ai pas le jeu de caractères. Tout se passe ???????????… Cependant, je peux charger ce jeu de caractères dans Firefox (Firefox> Préférences> Avancé> Langues):

Langue de chargement de Firefox

Si je charge cette langue, je peux alors demander la page dans son jeu de caractères natif et l'afficher sur mon ordinateur même si ma langue par défaut est en-US!

Donc… si je suis étudiant en hindi, j'étudie l'anglais à Purdue et je suis connecté via VPN au serveur de l'école, en vacances en Australie ... il y a 3 paramètres différents qui doivent être appliqués à l'application pour être vraiment internationalisée - et aucun dépendent de l'autre.

Ma langue apparaîtrait comme en-US, mais mon fuseau horaire est l'Australie, mais la langue que je demande au site Web peut être l'hindi. Si je devais programmer mon application pour faire hypothèses basé sur les paramètres régionaux de mon ordinateur, je me trompe totalement - nourrir la personne en anglais dans un fuseau horaire de l'Est. Idéalement, je programmerais mon application pour offrir tous les deux paramètres de langue et de fuseau horaire… mais je ne les supposerais pas basés sur les paramètres régionaux.

L'Islande - l'exemple ultime

Nous ignorons les défis multilingues et multilingues aux États-Unis où nous tous parler anglais [sarcasme implicite]. Dans certains pays, comme l'Islande, bien que la langue maternelle soit l'islandais, l'incroyable peuple islandais grandit en apprenant 3 langues! Puisque l'Islande est un pays au milieu de l'Europe et de l'Amérique du Nord, leurs entreprises travaillent sur plusieurs continents, langues, dialectes de langues et plusieurs fuseaux horaires depuis leur bureau!

De nombreux sites Web islandais sont construits en anglais américain, anglais britannique, islandais, espagnol, espagnol, français et allemand! Imaginez à quel point ce serait difficile de construire Icelandair's applications de site Web et systèmes de billetterie… wow!

AVIS DE NON-RESPONSABILITÉ: J'ai eu le plaisir absolu de travailler avec les braves gens d'Icelandair et je peux vous dire qu'ils font partie des professionnels les plus talentueux et les plus sympathiques avec lesquels j'ai eu le plaisir de travailler. C'est tout simplement un pays et des gens incroyables! Allez visiter… prenez Icelandair et assurez-vous de visiter le Lagon bleu!

Langue versus encodage

Il existe même différents encodages de caractères dans une même langue qui ne fonctionnent pas bien les uns avec les autres! Exemple: un e-mail japonais rédigé en Shift-JIS peut devenir illisible sur l'ordinateur d'une personne japonaise avec une localisation définie sur ja-JP car son serveur de messagerie ne reconnaît que EUC-JP. Idéalement, un client devrait être en mesure de définir le codage qu'il souhaite ainsi que la langue - en s'assurant simplement que le codage et la langue sont compatibles avec ce que le client demande.

Si je souhaite lire le japonais, je devrai peut-être sélectionner à la fois le japonais comme langue ET Shift-JIS pour l'encodage afin d'afficher correctement cette langue. Voici un peu plus de confusion à ajouter au mélange… certains types d'encodage prennent en charge plusieurs langues. UNICODE / UTF8 prend en charge des dizaines. L'inverse est également vrai. Certaines langues peuvent être lues dans de nombreux types d'encodage. Si cela n'a pas de sens… Je m'excuse, c'est une question très complexe.

Un jour, je crois (j'espère) que tout changera. Je pense que les concepteurs originaux des codes de localisation espéraient que le combo langue-pays serait tout ce qu'il fallait… mais nous sommes devenus beaucoup plus sophistiqués. Rappelez-vous, une grande partie de cela a été développé avant l'existence d'Internet. Avec l'avènement de SIG, peut-être qu'une personne peut sélectionner son encodage et le SIG gérerait les informations de fuseau horaire et de localisation.

Internationalisation

Retour au support de l'internationalisation. Si vous souhaitez fournir une application internationalisée, vous devez:

  1. Prend en charge plusieurs types de codage, langues et dispose de fichiers de traduction pour afficher ces traductions.
  2. Permettez au client de définir sa langue, et peut-être même son type d'encodage, si nécessaire.
  3. Prise en charge des fuseaux horaires en permettant aux utilisateurs de référencer leur fuseau horaire par rapport à GMT.
  4. Utilisez les codes de localisation avec prudence… ils ne décrivent PAS avec précision ce que votre utilisateur demande réellement ni ce qu'il peut lire.

Traduction

La traduction automatique en est encore à ses balbutiements. Il existe un certain nombre de sites Web (et WordPress Extensions) qui proposent une traduction automatique de votre site. Ne soyez pas tenté de faire cela… il y a deux raisons à cela:

  1. Si la traduction automatique fonctionne, l'utilisateur qui extrait votre site disposera déjà d'un traducteur avec lequel travailler.
  2. La traduction automatique est nul.

Tu ne me crois pas? Voici une traduction en japonais pour vous:
Collé depuis Fichier Masatsu - un mec avec une tonne de photos de chats:

Entrée de blog japonais

????
- 00:29:35 par masatsu

Votre compte a été résilié.
??????????????????????????

?????????? (?)?

????????????????????????????????????????
???????????????????????????

????????????????????????????????? (?)

?????????????????

??????????????
????
????

Votre compte a été redirigé avec succès

???????????????????????????????

???????????????????????????????????
Quel est votre nom
?????????? Ag ????????????????

Votre compte a été redirigé vers votre compte.

Traduction automatique:

?? Han ??????
-00: 29: 35 par masatsu

Le nom du premier saint d'un / l'éléphant qui est apparu sur la flotte d'hier «a / the beast fist ?? ranger »« ?? Hann ???? » avec un / l'acteur radio Yutaka Mizushima….

? (?) qui fait la seiche facilement.

Parce que même l'acteur radio du premier saint, maître ????? d'un / le chat sont le coing chinois d'un Nagai Ichiro = dragon ball le bâton d'un / le ?? Ranger ressemble à ceux qui le savent facilement.

?????? (La sueur) que j'oubliais complètement cette année "le secret du nom de la super flotte", de la pratique habituelle chaque année?,

?????? Si j'écris tardivement cette année,

??????? sanctuaire ??? (peut comment?)? cullion de tournière (?? couper pas) Fukami ?? (? ou observer capable de?) est-ce que c'est

?????? Avec, ça devient "un can /? /?", Autrement dit, "kung fu", quand on s'aligne et qu'on change la tête d'un / le nom.

?????? Bien qu'il soit dit d'augmenter de deux autres prétendument, il peut devenir quel genre de nom.

On dit que la vérité est «l'âge» parce que le symbole de l'élément argent est Ag?, Bien que le nom de «le ???? argent »le Takaoka? technicien de ??????? pensait que le personnage appelé «?» a été utilisé avec l'association d'un film Silver'screen ?, s'il l'appelle avec un membre additionnel.

?????? Cependant, je pense égoïstement, que ma théorie n'est pas sans rapport avec le «?» est inclus dans un / le caractère chinois.

Je suis sûr que l'inversion de la polarité sur cette traduction fournirait une diction tout aussi lisible en anglais. Vous avez compris l'entrée, non?

2 Commentaires

  1. 1

    Vouliez-vous dire Purdue ?
    Bien sûr, un acteur de radio en sueur se demandait la bonne façon de dire certaines choses….

Que pensez-vous?

Ce site utilise Akismet pour réduire les spams. Découvrez comment sont traitées les données de vos commentaires..