[C#] Case insensitive 'Contains (string)'



Answers

È possibile utilizzare il metodo String.IndexOf e passare StringComparison.OrdinalIgnoreCase come tipo di ricerca da utilizzare:

string title = "STRING";
bool contains = title.IndexOf("string", StringComparison.OrdinalIgnoreCase) >= 0;

Ancora meglio sta definendo un nuovo metodo di estensione per la stringa:

public static class StringExtensions
{
    public static bool Contains(this string source, string toCheck, StringComparison comp)
    {
        return source?.IndexOf(toCheck, comp) >= 0;
    }
}

Nota, quella propagazione nulla ?. è disponibile da C # 6.0 (VS 2015), per le versioni precedenti

   if(source==null) return false;
   return source.IndexOf(toCheck, comp) >= 0;

USO:

string title = "STRING";
bool contains = title.Contains("string", StringComparison.OrdinalIgnoreCase);
Question

C'è un modo per rendere il seguente ritorno vero?

string title = "ASTRINGTOTEST";
title.Contains("string");

Non sembra esserci un sovraccarico che mi permetta di impostare la distinzione tra maiuscole e minuscole. Al momento li UPPERCASE entrambi, ma è solo sciocco.

AGGIORNARE
La sciocchezza a cui mi riferisco sono i problemi i18n che arrivano con l'involucro verticale.

AGGIORNARE
Questa domanda è antica e da allora mi sono reso conto che ho chiesto una risposta semplice per un argomento davvero vasto e difficile se ti interessa investigarlo completamente.
Per la maggior parte dei casi, in base al codice in lingua inglese, this risposta sarà sufficiente. Sospetto che la maggior parte della gente che viene qui cada in questa categoria è la risposta più popolare.
This risposta, tuttavia, fa emergere il problema intrinseco che non possiamo confrontare il maiuscolo / minuscolo del testo fino a quando non sappiamo che entrambi i testi sono la stessa cultura e sappiamo che cos'è questa cultura. Questa è forse una risposta meno popolare, ma penso che sia più corretta ed è per questo che l'ho contrassegnata come tale.




Soluzione alternativa con Regex:

bool contains = Regex.IsMatch("StRiNG to search", "string", RegexOptions.IgnoreCase);

Avviso

Come ha sottolineato @cHao nel suo commento, ci sono degli scenari che causeranno che questa soluzione restituisca risultati errati. Assicurati di sapere cosa stai facendo prima di implementare questa soluzione a caso.




Questo è pulito e semplice.

Regex.IsMatch(file,fileNamestr,RegexOptions.IgnoreCase)



Modo semplice per principianti:

title.ToLower().Contains("string");//of course "string" is lowercase.



In definitiva, un'operazione generica "contiene" si riduce a una funzione come questa,

/// <summary>
/// Determines whether the source contains the sequence.
/// </summary>
/// <typeparam name="T">The type of the items in the sequences.</typeparam>
/// <param name="sourceEnumerator">The source enumerator.</param>
/// <param name="sequenceEnumerator">The sequence enumerator.</param>
/// <param name="equalityComparer">An equality comparer.</param>
/// <remarks>
/// An empty sequence will return <c>true</c>.
/// The sequence must support <see cref="IEnumerator.Reset"/>
/// if it does not begin the source.
/// </remarks>
/// <returns>
/// <c>true</c> if the source contains the sequence;
/// otherwise <c>false</c>.
/// </returns>
public static bool Contains<T>(
    IEnumerator<T> sourceEnumerator,
    IEnumerator<T> sequenceEnumerator,
    IEqualityComparer<T> equalityComparer)
{
    if (equalityComparer == null)
    {
        equalityComparer = EqualityComparer<T>.Default;
    }

    while (sequenceEnumerator.MoveNext())
    {
        if (sourceEnumerator.MoveNext())
        {
            if (!equalityComparer.Equals(
                sourceEnumerator.Current,
                sequenceEnumerator.Current))
            {
                sequenceEnumerator.Reset();
            }
        }
        else
        {
            return false;
        }
    }

    return true;
}

questo può essere banalmente racchiuso in una versione di estensione che accetta IEnumerable come questo,

public static bool Contains<T>(
        this IEnumerable<T> source,
        IEnumerable<T> sequence,
        IEqualityComparer<T> equalityComparer = null)
{
    if (sequence == null)
    {
        throw new ArgumentNullException("sequence");
    }

    using(var sequenceEnumerator = sequence.GetEnumerator())
    using(var sourceEnumerator = source.GetEnumerator())
    {
        return Contains(
            sourceEnumerator,
            sequenceEnumerator,
            equalityComparer);
    }
}

Ora, questo funzionerà per il confronto ordinale di tutte le sequenze, incluse le stringhe, poiché la string implementa IEnumerable<char> ,

// The optional parameter ensures the generic overload is invoked
// not the string.Contains() implementation.
"testable".Contains("est", EqualityComparer<char>.Default)

Tuttavia, come sappiamo, le stringhe non sono generiche, sono specializzate. Ci sono due fattori chiave in gioco.

  1. Il problema del "casing" che a sua volta ha vari casi limite dipendenti dalla lingua.
  2. La questione piuttosto complessa di come un insieme di "Elementi di testo" (lettere / numeri / simboli ecc.) Sono rappresentati da Unicode Code Points e quali sequenze valide di caratteri possono rappresentare una determinata stringa, i dettagli vengono espansi in these answers .

L'effetto netto è lo stesso. Le stringhe che potresti affermare sono linguisticamente uguali possono essere validamente rappresentate da diverse combinazioni di caratteri. Cosa c'è di più, le regole per la validità cambiano tra culture.

Tutto ciò porta a un'implementazione "Contains" basata su string specializzata come questa.

using System.Globalization;

public static bool Contains(
         this string source,
         string value,
         CultureInfo culture = null,
         CompareOptions options = CompareOptions.None)
{
    if (value == null)
    {
        throw new ArgumentNullException("value");
    }

    var compareInfo = culture == null ? 
            CultureInfo.CurrentCulture.CompareInfo :
            culture.CompareInfo;

    var sourceEnumerator = StringInfo.GetTextElementEnumerator(source);
    var sequenceEnumerator = StringInfo.GetTextElementEnumerator(value);

    while (sequenceEnumerator.MoveNext())
    {
        if (sourceEnumerator.MoveNext())
        {
            if (!(compareInfo.Compare(
                    sourceEnumerator.Current,
                    sequenceEnumerator.Current,
                    options) == 0))
            {
                sequenceEnumerator.Reset();
            }
        }
        else
        {
            return false;
        }
    }

    return true;
}

Questa funzione può essere utilizzata per eseguire una distinzione tra maiuscole e minuscole, "contiene" specifici della cultura che funzioneranno, indipendentemente dalla normalizzazione delle stringhe. per esempio

"testable".Contains("EST", StringComparer.CurrentCultureIgnoreCase)



Questo è abbastanza simile ad un altro esempio qui, ma ho deciso di semplificare enum per bool, primario perché normalmente non sono necessarie altre alternative. Ecco il mio esempio:

public static class StringExtensions
{
    public static bool Contains(this string source, string toCheck, bool bCaseInsensitive )
    {
        return source.IndexOf(toCheck, bCaseInsensitive ? StringComparison.OrdinalIgnoreCase : StringComparison.Ordinal) >= 0;
    }
}

E l'utilizzo è qualcosa come:

if( "main String substring".Contains("SUBSTRING", true) )
....



public static class StringExtension
{
    #region Public Methods

    public static bool ExContains(this string fullText, string value)
    {
        return ExIndexOf(fullText, value) > -1;
    }

    public static bool ExEquals(this string text, string textToCompare)
    {
        return text.Equals(textToCompare, StringComparison.OrdinalIgnoreCase);
    }

    public static bool ExHasAllEquals(this string text, params string[] textArgs)
    {
        for (int index = 0; index < textArgs.Length; index++)
            if (ExEquals(text, textArgs[index]) == false) return false;
        return true;
    }

    public static bool ExHasEquals(this string text, params string[] textArgs)
    {
        for (int index = 0; index < textArgs.Length; index++)
            if (ExEquals(text, textArgs[index])) return true;
        return false;
    }

    public static bool ExHasNoEquals(this string text, params string[] textArgs)
    {
        return ExHasEquals(text, textArgs) == false;
    }

    public static bool ExHasNotAllEquals(this string text, params string[] textArgs)
    {
        for (int index = 0; index < textArgs.Length; index++)
            if (ExEquals(text, textArgs[index])) return false;
        return true;
    }

    /// <summary>
    /// Reports the zero-based index of the first occurrence of the specified string
    /// in the current System.String object using StringComparison.InvariantCultureIgnoreCase.
    /// A parameter specifies the type of search to use for the specified string.
    /// </summary>
    /// <param name="fullText">
    /// The string to search inside.
    /// </param>
    /// <param name="value">
    /// The string to seek.
    /// </param>
    /// <returns>
    /// The index position of the value parameter if that string is found, or -1 if it
    /// is not. If value is System.String.Empty, the return value is 0.
    /// </returns>
    /// <exception cref="ArgumentNullException">
    /// fullText or value is null.
    /// </exception>
    public static int ExIndexOf(this string fullText, string value)
    {
        return fullText.IndexOf(value, StringComparison.OrdinalIgnoreCase);
    }

    public static bool ExNotEquals(this string text, string textToCompare)
    {
        return ExEquals(text, textToCompare) == false;
    }

    #endregion Public Methods
}



Un problema con la risposta è che genererà un'eccezione se una stringa è nulla. Puoi aggiungerlo come assegno per non farlo:

public static bool Contains(this string source, string toCheck, StringComparison comp)
{
    if (string.IsNullOrEmpty(toCheck) || string.IsNullOrEmpty(source))
        return true;

    return source.IndexOf(toCheck, comp) >= 0;
} 



Proprio come questo:

string s="AbcdEf";
if(s.ToLower().Contains("def"))
{
    Console.WriteLine("yes");
}



È possibile utilizzare la funzione string.indexof () . Questo sarà case insensitive




Il metodo InStr dall'assembly VisualBasic è il migliore se si ha una preoccupazione per l'internazionalizzazione (o si potrebbe reimplementarla). Guardando in esso, dotNeetPeek mostra che non solo tiene conto di maiuscole e minuscole, ma anche di caratteri kana e di caratteri pieni e semi-larghi (principalmente rilevanti per le lingue asiatiche, sebbene ci siano anche versioni a larghezza intera dell'alfabeto romano) ). Sto saltando alcuni dettagli, ma controlla il metodo privato InternalInStrText :

private static int InternalInStrText(int lStartPos, string sSrc, string sFind)
{
  int num = sSrc == null ? 0 : sSrc.Length;
  if (lStartPos > num || num == 0)
    return -1;
  if (sFind == null || sFind.Length == 0)
    return lStartPos;
  else
    return Utils.GetCultureInfo().CompareInfo.IndexOf(sSrc, sFind, lStartPos, CompareOptions.IgnoreCase | CompareOptions.IgnoreKanaType | CompareOptions.IgnoreWidth);
}



Links