Internationalisation, localisation, codage, Islande et traduction d'un site Web de photos de chats japonais

traduction d'internationalisation

InternationalisationIl existe de nombreuses informations sur l'internationalisation, la localisation et l'encodage dans les applications Web. Il y a aussi beaucoup de malentendus sur ce que chacun fournit pour une application Web. Voici mon avis…

Lorsqu'un navigateur web se connecte à un serveur web, il passe pas mal de variables et fait des requêtes supplémentaires, voici un exemple :

GET / HTTP / 1.1
Hébergeur: www.dknewmedia.com
Agent utilisateur: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Accepter: HTTP Accepter = text / xml, application / xml, application / xhtml + xml, text / html; q = 0.9, text / plain; q = 0.8, image / png, * / *; q = 0.5
Accept-Language: en-us, en; q = 0.5
Accept-Encoding: gzip, dégonfler
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

Internationalisation

L'internationalisation est un composite de plusieurs choses:

  1. Localisation: La capacité d'identifier la langue et l'emplacement d'un visiteur. Cela se fait via des requêtes HTTP où le visiteur est identifié par un paramètre régional. Dans mon cas, c'est en-US. « en » est l'anglais et « US » est les États-Unis. Il s'agit d'un paramètre de mon système d'exploitation.
  2. Fuseaux horaires: La possibilité de s'adapter aux fuseaux horaires. Ceci est normalement accompli en réglant votre serveur sur un temps moyen de Greenwich (GMT), puis en permettant aux utilisateurs de définir leur décalage local par rapport à GMT.
  3. Encodage de caractère: Il s'agit de la possibilité d'afficher correctement les jeux de caractères de la langue. C'est différent de la localisation puisque la localisation peut me dire la langue et la région de l'ordinateur à partir duquel la demande est faite, mais elle ne me dira pas de quelle langue lecteur demande… c'est au lecteur de décider !

Remarquez dans mon en-tête HTTP lorsque le navigateur a fait la demande, il a dit au serveur qu'il demandait mes paramètres régionaux (Accept-Language: en-us); cependant, il doit également indiquer au serveur quel jeu de caractères est demandé (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 et utf -8 sont tous les deux des jeux de caractères autorisés.

Localisation

Dans ce monde fantastique et confus, la localisation ne dicte plus la langue. Même si je suis aux États-Unis, je peux absolument lire une langue différente en utilisant un jeu de caractères différent… c'est ce qui se passe lorsque j'utilise Google Hindi (Je n'utilise pas vraiment Google Hindi). Ma demande de paramètres régionaux et de jeu de caractères est identique à celle lorsque je demande le Google Anglais page, mais je suis en fait alimenté d'une page que je ne peux pas lire car je n'ai pas le jeu de caractères. Tout revient ???????????… Cependant, je peux charger ce jeu de caractères dans Firefox (Firefox > Préférences > Avancé > Langues) :

Langue de chargement de Firefox

Si je charge cette langue, je peux alors demander la page dans son jeu de caractères natif et l'afficher sur mon ordinateur même si ma langue par défaut est en-US!

Donc… si je suis un étudiant hindi, que j'étudie l'anglais à Purdue et que je suis connecté via VPN au serveur de l'école, en vacances en Australie… il y a 3 paramètres différents qui doivent être appliqués à l'application pour être vraiment internationalisée - et aucun dépendent de l'autre.

Mes paramètres régionaux seraient en-US, mais mon fuseau horaire est l'Australie, mais la langue que je demande sur le site Web peut être l'hindi. Si je devais programmer mon application pour faire hypothèses en fonction des paramètres régionaux de mon ordinateur, j'aurais totalement tort - nourrir la personne en anglais dans un fuseau horaire de l'Est. Idéalement, je programmerais mon application pour offrir tous les deux paramètres de langue et de fuseau horaire… mais je ne les supposerais pas en fonction des paramètres régionaux.

L'Islande - l'exemple ultime

Nous ignorons les défis multilingues et multi-locales aux États-Unis où nous tous parler anglais [sarcasme implicite]. Dans certains pays, comme l'Islande, bien que la langue maternelle soit l'islandais, l'incroyable peuple islandais grandit en apprenant 3 langues! Puisque l'Islande est un pays au milieu de l'Europe et de l'Amérique du Nord, leurs entreprises travaillent sur plusieurs continents, langues, dialectes de langues et plusieurs fuseaux horaires depuis leur bureau!

De nombreux sites Web islandais sont construits en anglais américain, anglais britannique, islandais, espagnol, espagnol, français et allemand! Imaginez à quel point ce serait difficile de construire Icelandair applications de site Web et systèmes de billetterie… wow!

AVIS DE NON-RESPONSABILITÉ : J'ai eu le plaisir absolu de travailler avec les gens d'Icelandair et je peux vous dire qu'ils sont parmi les professionnels les plus talentueux et sympathiques avec lesquels j'ai eu le plaisir de travailler. C'est tout simplement un pays et des gens incroyables! Allez visiter… prenez Icelandair et assurez-vous de visiter le Lagon bleu!

Langue versus encodage

Il existe même différents encodages de caractères dans une même langue qui ne fonctionnent pas bien les uns avec les autres ! Exemple : Un e-mail japonais écrit en Shift-JIS peut être rendu illisible sur l'ordinateur d'un Japonais avec une localisation définie sur ja-JP car son serveur de messagerie ne reconnaît que EUC-JP. Idéalement, un client devrait être en mesure de définir l'encodage qu'il souhaite ainsi que la langue, en s'assurant simplement que l'encodage et la langue sont compatibles avec ce que le client demande.

Si je souhaite lire le japonais, je devrai peut-être sélectionner à la fois le japonais comme langue ET Shift-JIS pour l'encodage afin d'afficher correctement cette langue. Voici un peu plus de confusion à ajouter au mélange… certains types d'encodage prennent en charge plusieurs langues. UNICODE/UTF8 en prend en charge des dizaines. L'inverse est également vrai. Certaines langues peuvent être lues dans de nombreux types de codage. Si cela n'a pas de sens… Je m'excuse, c'est une question très complexe.

Un jour, je crois (j'espère) que tout va changer. Je pense que les concepteurs originaux des codes de localisation espéraient que le combo langue-pays serait tout ce qui est nécessaire… mais nous sommes devenus beaucoup plus sophistiqués. Rappelez-vous, une grande partie de cela a été développée avant qu'Internet n'existe. Avec l'avènement de SIG, peut-être qu'une personne peut sélectionner son encodage et le SIG gérerait les informations de fuseau horaire et de localisation.

Internationalisation

Retour au support de l'internationalisation. Si vous souhaitez fournir une application internationalisée, vous devez:

  1. Prend en charge plusieurs types de codage, langues et dispose de fichiers de traduction pour afficher ces traductions.
  2. Permettez au client de définir sa langue, et peut-être même son type d'encodage, si nécessaire.
  3. Prise en charge des fuseaux horaires en permettant aux utilisateurs de référencer leur fuseau horaire par rapport à GMT.
  4. Utilisez les codes de localisation avec prudence… ils ne décrivent PAS avec précision ce que votre utilisateur demande réellement ni ce qu'il peut lire.

Traduction

La traduction automatique en est encore à ses balbutiements. Il existe un certain nombre de sites Web (et WordPress Extensions) qui proposent la traduction automatique de votre site. Ne soyez pas tenté de le faire… il y a deux raisons pour lesquelles :

  1. Si la traduction automatique fonctionne, l'utilisateur qui extrait votre site disposera déjà d'un traducteur avec lequel travailler.
  2. La traduction automatique est nul.

Ne me croyez pas ? Voici une traduction japonaise pour vous :
Collé depuis Fichier Masatsu - un mec avec une tonne de photos de chats:

Entrée de blog japonais

????
- 00:29:35 par masatsu

Votre compte a été résilié.
??????????????????????????

?????????? (?)?

????????????????????????????????????????
???????????????????????????

????????????????????????????????? (?)

?????????????????

??????????????
????
????

Votre compte a été redirigé avec succès

???????????????????????????????

???????????????????????????????????
Quel est votre nom
?????????? Ag ????????????????

Votre compte a été redirigé vers votre compte.

Traduction automatique:

?? Hann ?????
-00: 29: 35 par masatsu

Le nom du poing saint d'un/l'éléphant qui est apparu sur la flotte de poing d'un/la bête d'hier ?? ranger" "?? Hann ???? avec un/l'acteur radio Yutaka Mizushima….

? (?) qui fait la seiche facilement.

Parce que même l'acteur radio du premier saint, maître ????? d'un / le chat sont le coing chinois d'un Nagai Ichiro = dragon ball le bâton d'un / le ?? Ranger ressemble à ceux qui le savent facilement.

?????? (La sueur) que j'oubliais complètement cette année "le secret du nom de la super flotte", de la pratique habituelle chaque année?,

?????? Si j'écris tardivement cette année,

??????? sanctuaire ??? (peut comment?)? cullion de tournière (?? couper pas) Fukami ?? (? ou observer capable de?) est-ce que c'est

?????? Avec, ça devient "un can /? /?", Autrement dit, "kung fu", quand on s'aligne et qu'on change la tête d'un / le nom.

?????? Bien qu'il soit dit d'augmenter de deux autres prétendument, il peut devenir quel genre de nom.

La vérité est dite « âge » parce que le symbole de l'élément argent est Ag ?, bien que le nom de « le ???? argent” le Takaoka ? technicien de ??????? pensait que le personnage appelé "?" a été utilisé avec l'association d'un film sur grand écran, s'il l'appelle avec un membre supplémentaire.

?????? Cependant, je pense égoïstement, que ma théorie n'est pas sans rapport avec le «?» est inclus dans un / le caractère chinois.

Je suis sûr que l'inversion de la polarité sur cette traduction fournirait une diction tout aussi lisible en anglais. Vous avez compris l'entrée, non?

2 Commentaires

  1. 1

    vouliez-vous dire Purdue?
    Bien sûr - un acteur de radio en sueur se demandait la bonne façon de dire certaines choses….

Que pensez-vous?

Ce site utilise Akismet pour réduire les spams. Découvrez comment sont traitées les données de vos commentaires..