special - Javascript: Unicode-String zu Hex




javascript unicode to string (3)

Ich versuche, eine Unicode-Zeichenfolge in eine hexadezimale Darstellung in JavaScript zu konvertieren.

Das habe ich:

function convertFromHex(hex) {
    var hex = hex.toString();//force conversion
    var str = '';
    for (var i = 0; i < hex.length; i += 2)
        str += String.fromCharCode(parseInt(hex.substr(i, 2), 16));
    return str;
}

function convertToHex(str) {
    var hex = '';
    for(var i=0;i<str.length;i++) {
        hex += ''+str.charCodeAt(i).toString(16);
    }
    return hex;
}

Aber wenn Unicode-Zeichen fehlschlagen, wie Chinesisch;

Eingabe: 漢字

Ausgabe: ªo "[W

Irgendwelche Ideen? Kann dies in Javascript getan werden?


Wie bekommst du "\u6f22\u5b57" von 漢字 in JavaScript?

Dies sind JavaScript-Unicode-Escape-Sequenzen, zB \u12AB . Um sie zu konvertieren, können Sie über jede Code-Einheit in der Zeichenfolge iterieren, rufen Sie .toString(16) darauf, und gehen Sie von dort aus.

Es ist jedoch effizienter, auch hexadezimale Escape-Sequenzen z. B. \xAA in der Ausgabe zu verwenden, wo immer dies möglich ist.

Beachten Sie außerdem, dass ASCII-Symbole wie A , b und - wahrscheinlich nicht maskiert werden müssen.

Ich habe eine kleine JavaScript-Bibliothek geschrieben, die all das für Sie jsesc , jsesc . Es hat viele Optionen, um die Ausgabe zu steuern.

Hier ist eine Online-Demo des Tools in Aktion: http://mothereff.in/js-escapes#1%E6%BC%A2%E5%AD%97

http://mothereff.in/js-escapes#1%E6%BC%A2%E5%AD%97

Ihre Frage wurde als utf-8 markiert. Wenn Sie den Rest Ihrer Frage utf8.js scheint die UTF-8-Kodierung / Dekodierung nicht das zu sein, was Sie hier wollten, aber falls Sie sie jemals brauchen sollten: Verwenden Sie utf8.js ( Online-Demo ).


Denken Sie daran, dass eine JavaScript-Code-Einheit 16 Bit breit ist. Daher wird die hexadezimale Zeichenfolge 4 Ziffern pro Codeeinheit sein.

Verwendung:

var str = "\u6f22\u5b57"; // "\u6f22\u5b57" === "漢字"
alert(str.hexEncode().hexDecode());

Zeichenfolge in Hex-Form:

String.prototype.hexEncode = function(){
    var hex, i;

    var result = "";
    for (i=0; i<this.length; i++) {
        hex = this.charCodeAt(i).toString(16);
        result += ("000"+hex).slice(-4);
    }

    return result
}

Wieder zurück:

String.prototype.hexDecode = function(){
    var j;
    var hexes = this.match(/.{1,4}/g) || [];
    var back = "";
    for(j = 0; j<hexes.length; j++) {
        back += String.fromCharCode(parseInt(hexes[j], 16));
    }

    return back;
}

Hier ist ein Tweak von McDowells Algorithmus, der das Ergebnis nicht auffüllt:

  function toHex(str) {
    var result = '';
    for (var i=0; i<str.length; i++) {
      result += str.charCodeAt(i).toString(16);
    }
    return result;
  }




hex