[C#] URL-Codierung mit C #


Answers

Ich habe mit den verschiedenen Methoden experimentiert, die .NET für die URL-Codierung bietet. Vielleicht ist die folgende Tabelle nützlich (als Ausgabe von einer Test-App, die ich geschrieben habe):

Unencoded UrlEncoded UrlEncodedUnicode UrlPathEncoded EscapedDataString EscapedUriString HtmlEncoded HtmlAttributeEncoded HexEscaped
A         A          A                 A              A                 A                A           A                    %41
B         B          B                 B              B                 B                B           B                    %42

a         a          a                 a              a                 a                a           a                    %61
b         b          b                 b              b                 b                b           b                    %62

0         0          0                 0              0                 0                0           0                    %30
1         1          1                 1              1                 1                1           1                    %31

[space]   +          +                 %20            %20               %20              [space]     [space]              %20
!         !          !                 !              !                 !                !           !                    %21
"         %22        %22               "              %22               %22              "      "               %22
#         %23        %23               #              %23               #                #           #                    %23
$         %24        %24               $              %24               $                $           $                    %24
%         %25        %25               %              %25               %25              %           %                    %25
&         %26        %26               &              %26               &                &       &                %26
'         %27        %27               '              '                 '                '       '                %27
(         (          (                 (              (                 (                (           (                    %28
)         )          )                 )              )                 )                )           )                    %29
*         *          *                 *              %2A               *                *           *                    %2A
+         %2b        %2b               +              %2B               +                +           +                    %2B
,         %2c        %2c               ,              %2C               ,                ,           ,                    %2C
-         -          -                 -              -                 -                -           -                    %2D
.         .          .                 .              .                 .                .           .                    %2E
/         %2f        %2f               /              %2F               /                /           /                    %2F
:         %3a        %3a               :              %3A               :                :           :                    %3A
;         %3b        %3b               ;              %3B               ;                ;           ;                    %3B
<         %3c        %3c               <              %3C               %3C              &lt;        &lt;                 %3C
=         %3d        %3d               =              %3D               =                =           =                    %3D
>         %3e        %3e               >              %3E               %3E              &gt;        >                    %3E
?         %3f        %3f               ?              %3F               ?                ?           ?                    %3F
@         %40        %40               @              %40               @                @           @                    %40
[         %5b        %5b               [              %5B               %5B              [           [                    %5B
\         %5c        %5c               \              %5C               %5C              \           \                    %5C
]         %5d        %5d               ]              %5D               %5D              ]           ]                    %5D
^         %5e        %5e               ^              %5E               %5E              ^           ^                    %5E
_         _          _                 _              _                 _                _           _                    %5F
`         %60        %60               `              %60               %60              `           `                    %60
{         %7b        %7b               {              %7B               %7B              {           {                    %7B
|         %7c        %7c               |              %7C               %7C              |           |                    %7C
}         %7d        %7d               }              %7D               %7D              }           }                    %7D
~         %7e        %7e               ~              ~                 ~                ~           ~                    %7E

Ā         %c4%80     %u0100            %c4%80         %C4%80            %C4%80           Ā           Ā                    [OoR]
ā         %c4%81     %u0101            %c4%81         %C4%81            %C4%81           ā           ā                    [OoR]
Ē         %c4%92     %u0112            %c4%92         %C4%92            %C4%92           Ē           Ē                    [OoR]
ē         %c4%93     %u0113            %c4%93         %C4%93            %C4%93           ē           ē                    [OoR]
Ī         %c4%aa     %u012a            %c4%aa         %C4%AA            %C4%AA           Ī           Ī                    [OoR]
ī         %c4%ab     %u012b            %c4%ab         %C4%AB            %C4%AB           ī           ī                    [OoR]
Ō         %c5%8c     %u014c            %c5%8c         %C5%8C            %C5%8C           Ō           Ō                    [OoR]
ō         %c5%8d     %u014d            %c5%8d         %C5%8D            %C5%8D           ō           ō                    [OoR]
Ū         %c5%aa     %u016a            %c5%aa         %C5%AA            %C5%AA           Ū           Ū                    [OoR]
ū         %c5%ab     %u016b            %c5%ab         %C5%AB            %C5%AB           ū           ū                    [OoR]

Die Spalten stellen Kodierungen wie folgt dar:

  • UrlEncoded: HttpUtility.UrlEncode

  • UrlEncodedUnicode: HttpUtility.UrlEncodeUnicode

  • UrlPathEncoded: HttpUtility.UrlPathEncode

  • EscapedDataString: Uri.EscapeDataString

  • EscapedUriString: Uri.EscapeUriString

  • HtmlEncoded: HttpUtility.HtmlEncode

  • HtmlAttributeEncoded: HttpUtility.HtmlAttributeEncode

  • HexEscaped: Uri.HexEscape

ANMERKUNGEN:

  1. HexEscape kann nur die ersten 255 Zeichen verarbeiten. Daher wird eine ArgumentOutOfRange Ausnahme für die lateinischen A-Extended-Zeichen (z. B. Â) ausgelöst.

  2. Diese Tabelle wurde in .NET 4.0 generiert (siehe untenstehenden Kommentar von Levi Botelho, dass die Codierung in .NET 4.5 etwas anders ist).

BEARBEITEN:

Ich habe eine zweite Tabelle mit den Codierungen für .NET 4.5 hinzugefügt. Siehe diese Antwort: https://stackoverflow.com/a/21771206/216440

EDIT 2:

Da die Leute diese Tabellen zu schätzen scheinen, dachte ich, dass dir der Quellcode, der die Tabelle generiert, gefallen könnte, damit du selbst spielen kannst. Es ist eine einfache C # -Konsolenanwendung, die auf .NET 4.0 oder 4.5 abzielen kann:

using System;
using System.Collections.Generic;
using System.Text;
// Need to add a Reference to the System.Web assembly.
using System.Web;

namespace UriEncodingDEMO2
{
    class Program
    {
        static void Main(string[] args)
        {
            EncodeStrings();

            Console.WriteLine();
            Console.WriteLine("Press any key to continue...");
            Console.Read();
        }

        public static void EncodeStrings()
        {
            string stringToEncode = "ABCD" + "abcd"
            + "0123" + " !\"#$%&'()*+,-./:;<=>?@[\\]^_`{|}~" + "ĀāĒēĪīŌōŪū";

            // Need to set the console encoding to display non-ASCII characters correctly (eg the 
            //  Latin A-Extended characters such as ĀāĒē...).
            Console.OutputEncoding = Encoding.UTF8;

            // Will also need to set the console font (in the console Properties dialog) to a font 
            //  that displays the extended character set correctly.
            // The following fonts all display the extended characters correctly:
            //  Consolas
            //  DejaVu Sana Mono
            //  Lucida Console

            // Also, in the console Properties, set the Screen Buffer Size and the Window Size 
            //  Width properties to at least 140 characters, to display the full width of the 
            //  table that is generated.

            Dictionary<string, Func<string, string>> columnDetails =
                new Dictionary<string, Func<string, string>>();
            columnDetails.Add("Unencoded", (unencodedString => unencodedString));
            columnDetails.Add("UrlEncoded",
                (unencodedString => HttpUtility.UrlEncode(unencodedString)));
            columnDetails.Add("UrlEncodedUnicode",
                (unencodedString => HttpUtility.UrlEncodeUnicode(unencodedString)));
            columnDetails.Add("UrlPathEncoded",
                (unencodedString => HttpUtility.UrlPathEncode(unencodedString)));
            columnDetails.Add("EscapedDataString",
                (unencodedString => Uri.EscapeDataString(unencodedString)));
            columnDetails.Add("EscapedUriString",
                (unencodedString => Uri.EscapeUriString(unencodedString)));
            columnDetails.Add("HtmlEncoded",
                (unencodedString => HttpUtility.HtmlEncode(unencodedString)));
            columnDetails.Add("HtmlAttributeEncoded",
                (unencodedString => HttpUtility.HtmlAttributeEncode(unencodedString)));
            columnDetails.Add("HexEscaped",
                (unencodedString
                    =>
                    {
                        // Uri.HexEscape can only handle the first 255 characters so for the 
                        //  Latin A-Extended characters, such as A, it will throw an 
                        //  ArgumentOutOfRange exception.                       
                        try
                        {
                            return Uri.HexEscape(unencodedString.ToCharArray()[0]);
                        }
                        catch
                        {
                            return "[OoR]";
                        }
                    }));

            char[] charactersToEncode = stringToEncode.ToCharArray();
            string[] stringCharactersToEncode = Array.ConvertAll<char, string>(charactersToEncode,
                (character => character.ToString()));
            DisplayCharacterTable<string>(stringCharactersToEncode, columnDetails);
        }

        private static void DisplayCharacterTable<TUnencoded>(TUnencoded[] unencodedArray,
            Dictionary<string, Func<TUnencoded, string>> mappings)
        {
            foreach (string key in mappings.Keys)
            {
                Console.Write(key.Replace(" ", "[space]") + " ");
            }
            Console.WriteLine();

            foreach (TUnencoded unencodedObject in unencodedArray)
            {
                string stringCharToEncode = unencodedObject.ToString();
                foreach (string columnHeader in mappings.Keys)
                {
                    int columnWidth = columnHeader.Length + 1;
                    Func<TUnencoded, string> encoder = mappings[columnHeader];
                    string encodedString = encoder(unencodedObject);

                    // ASSUMPTION: Column header will always be wider than encoded string.
                    Console.Write(encodedString.Replace(" ", "[space]").PadRight(columnWidth));
                }
                Console.WriteLine();
            }
        }
    }
}
Question

Ich habe eine Anwendung, die eine POST-Anfrage an die VB-Forum-Software sendet und jemanden anmeldet (ohne Cookies oder irgendetwas zu setzen).

Sobald der Benutzer angemeldet ist, erstelle ich eine Variable, die auf ihrem lokalen Rechner einen Pfad erstellt.

c: \ tempfolder \ Datum \ Benutzername

Das Problem ist, dass einige Benutzernamen "Illegal chars" Ausnahme werfen. Zum Beispiel, wenn mein Benutzername mas|fenix wäre, würde es eine Ausnahme mas|fenix ..

Path.Combine( _      
  Environment.GetFolderPath(System.Environment.SpecialFolder.CommonApplicationData), _
  DateTime.Now.ToString("ddMMyyhhmm") + "-" + form1.username)

Ich möchte es nicht aus der Zeichenfolge entfernen, aber ein Ordner mit ihrem Benutzernamen wird über FTP auf einem Server erstellt. Und das führt zu meiner zweiten Frage. Wenn ich einen Ordner auf dem Server erstelle, kann ich die "illegalen Zeichen" in? Ich frage nur, weil der Server Linux basiert und ich bin mir nicht sicher, ob Linux das akzeptiert oder nicht.

EDIT: Es scheint, dass URL-Encoding ist nicht was ich will .. Hier ist, was ich tun möchte:

old username = mas|fenix
new username = mas%xxfenix

Wobei% xx der ASCII-Wert oder irgendein anderer Wert ist, der das Zeichen leicht identifizieren würde.




Seit .NET Framework 4.5 können Sie msdn.microsoft.com/en-us/library/… .

Erstens befindet es sich in System.dll , so dass es keine zusätzlichen Verweise benötigt.

Zweitens entkommt es im Gegensatz zu Uri.EscapeUriString korrekt den Zeichen für URLs (siehe Kommentare zur drweb86-Antwort).

Drittens hat es im Gegensatz zu Uri.EscapeDataString (siehe verwandte Frage ) keine Begrenzung für die Länge der Zeichenfolge , so dass es zum Beispiel für POST-Anfragen verwendet werden kann.

Viertens ist es auf WinRT verfügbar , anders als HttpUtility (siehe verwandte Frage ).




Im Idealfall würden diese in einer Klasse namens "FileNaming" oder vielleicht nur umbenennen Encode zu "FileNameEncode" gehen. Hinweis: Diese sind nicht dafür gedacht, Full Paths zu behandeln, nur die Ordner- und / oder Dateinamen. Im Idealfall würden Sie zuerst Ihren vollständigen Pfad teilen ("/") und dann die Teile überprüfen. Und offensichtlich könnte man anstelle einer Union das Zeichen "%" zur Liste der Zeichen hinzufügen, die in Windows nicht erlaubt sind, aber ich denke, es ist auf diese Weise hilfreicher / lesbarer / sachlicher. Decode () ist genau das gleiche, aber wechselt das Ersetzen (Uri.HexEscape (s [0]), s) mit dem Zeichen "maskiert".

public static List<string> urlEncodedCharacters = new List<string>
{
  "/", "\\", "<", ">", ":", "\"", "|", "?", "%" //and others, but not *
};
//Since this is a superset of urlEncodedCharacters, we won't be able to only use UrlEncode() - instead we'll use HexEncode
public static List<string> specialCharactersNotAllowedInWindows = new List<string>
{
  "/", "\\", "<", ">", ":", "\"", "|", "?", "*" //windows dissallowed character set
};

    public static string Encode(string fileName)
    {
        //CheckForFullPath(fileName); // optional: make sure it's not a path?
        List<string> charactersToChange = new List<string>(specialCharactersNotAllowedInWindows);
        charactersToChange.AddRange(urlEncodedCharacters.
            Where(x => !urlEncodedCharacters.Union(specialCharactersNotAllowedInWindows).Contains(x)));   // add any non duplicates (%)

        charactersToChange.ForEach(s => fileName = fileName.Replace(s, Uri.HexEscape(s[0])));   // "?" => "%3f"

        return fileName;
    }

Danke @ simon-tewsi für die sehr nützliche Tabelle oben!




URL-Codierung ist in .NET einfach. Benutzen:

System.Web.HttpUtility.UrlEncode(string url)

Wenn dies entschlüsselt wird, um den Ordnernamen zu erhalten, müssen Sie immer noch Zeichen ausschließen, die nicht in Ordnernamen (*,?, /, Usw.) verwendet werden können.




Wenn Sie System.Web nicht sehen können, ändern Sie Ihre Projekteinstellungen. Das Zielframework sollte ".NET Framework 4" anstelle von ".NET Framework 4-Clientprofil" sein.




Ich habe eine C # -Methode geschrieben, die alle Symbole URL-codiert:

    /// <summary>
    /// !#$345Hf} → %21%23%24%33%34%35%48%66%7D
    /// </summary>
    public static string UrlEncodeExtended( string value )
    {
        char[] chars = value.ToCharArray();
        StringBuilder encodedValue = new StringBuilder();
        foreach (char c in chars)
        {
            encodedValue.Append( "%" + ( (int)c ).ToString( "X2" ) );
        }
        return encodedValue.ToString();
    }