java - जावा में एक स्ट्रिंग में इनपुटस्ट्रीम को कैसे पढ़ / परिवर्तित करें?




string io stream inputstream (25)

अन्य उत्तरों का संक्षेप में मुझे यह करने के 11 मुख्य तरीके मिले (नीचे देखें)। और मैंने कुछ प्रदर्शन परीक्षण लिखे (नीचे परिणाम देखें):

किसी इनपुटस्ट्रीम को स्ट्रिंग में कनवर्ट करने के तरीके:

  1. IOUtils.toString का उपयोग करना (अपाचे उपयोग)

    String result = IOUtils.toString(inputStream, StandardCharsets.UTF_8);
    
  2. CharStreams (Guava) का उपयोग करना

    String result = CharStreams.toString(new InputStreamReader(
          inputStream, Charsets.UTF_8));
    
  3. Scanner का उपयोग (जेडीके)

    Scanner s = new Scanner(inputStream).useDelimiter("\\A");
    String result = s.hasNext() ? s.next() : "";
    
  4. स्ट्रीम एपीआई (जावा 8) का उपयोग करना। चेतावनी : यह समाधान विभिन्न लाइन ब्रेक (जैसे \r\n ) \r\n परिवर्तित करता है।

    String result = new BufferedReader(new InputStreamReader(inputStream))
      .lines().collect(Collectors.joining("\n"));
    
  5. समांतर स्ट्रीम एपीआई (जावा 8) का उपयोग करना। चेतावनी : यह समाधान विभिन्न लाइन ब्रेक (जैसे \r\n ) \r\n परिवर्तित करता है।

    String result = new BufferedReader(new InputStreamReader(inputStream)).lines()
       .parallel().collect(Collectors.joining("\n"));
    
  6. InputStreamReader और StringBuilder (जेडीके) का उपयोग करना

    final int bufferSize = 1024;
    final char[] buffer = new char[bufferSize];
    final StringBuilder out = new StringBuilder();
    Reader in = new InputStreamReader(inputStream, "UTF-8");
    for (; ; ) {
        int rsz = in.read(buffer, 0, buffer.length);
        if (rsz < 0)
            break;
        out.append(buffer, 0, rsz);
    }
    return out.toString();
    
  7. StringWriter और IOUtils.copy (अपाचे कॉमन्स) का उपयोग करना

    StringWriter writer = new StringWriter();
    IOUtils.copy(inputStream, writer, "UTF-8");
    return writer.toString();
    
  8. ByteArrayOutputStream और inputStream.read (JDK) का उपयोग करना

    ByteArrayOutputStream result = new ByteArrayOutputStream();
    byte[] buffer = new byte[1024];
    int length;
    while ((length = inputStream.read(buffer)) != -1) {
        result.write(buffer, 0, length);
    }
    // StandardCharsets.UTF_8.name() > JDK 7
    return result.toString("UTF-8");
    
  9. BufferedReader (जेडीके) का उपयोग करना। चेतावनी: यह समाधान लाइन लाइन से अलग लाइन ब्रेक (जैसे \n\r ) को line.separator है। उदाहरण के लिए, विंडोज़ में "\ r \ n")।

    String newLine = System.getProperty("line.separator");
    BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream));
    StringBuilder result = new StringBuilder();
    boolean flag = false;
    for (String line; (line = reader.readLine()) != null; ) {
        result.append(flag? newLine: "").append(line);
        flag = true;
    }
    return result.toString();
    
  10. BufferedInputStream और ByteArrayOutputStream (JDK) का उपयोग करना

    BufferedInputStream bis = new BufferedInputStream(inputStream);
    ByteArrayOutputStream buf = new ByteArrayOutputStream();
    int result = bis.read();
    while(result != -1) {
        buf.write((byte) result);
        result = bis.read();
    }
    // StandardCharsets.UTF_8.name() > JDK 7
    return buf.toString("UTF-8");
    
  11. inputStream.read() और inputStream.read() का उपयोग करना। चेतावनी : इस समाधान में यूनिकोड के साथ समस्याएं हैं, उदाहरण के लिए रूसी पाठ के साथ (केवल गैर-यूनिकोड टेक्स्ट के साथ सही ढंग से काम करता है)

    int ch;
    StringBuilder sb = new StringBuilder();
    while((ch = inputStream.read()) != -1)
        sb.append((char)ch);
    reset();
    return sb.toString();
    

चेतावनी :

  1. समाधान 4, 5 और 9 अलग-अलग लाइन ब्रेक को एक में परिवर्तित करते हैं।

  2. समाधान 11 यूनिकोड टेक्स्ट के साथ सही ढंग से काम नहीं कर सकता है

प्रदर्शन जांच

छोटे String (लंबाई = 175) के लिए प्रदर्शन परीक्षण, जीथब में यूआरएल (मोड = औसत समय, सिस्टम = लिनक्स, स्कोर 1,343 सर्वश्रेष्ठ है):

              Benchmark                         Mode  Cnt   Score   Error  Units
 8. ByteArrayOutputStream and read (JDK)        avgt   10   1,343 ± 0,028  us/op
 6. InputStreamReader and StringBuilder (JDK)   avgt   10   6,980 ± 0,404  us/op
10. BufferedInputStream, ByteArrayOutputStream  avgt   10   7,437 ± 0,735  us/op
11. InputStream.read() and StringBuilder (JDK)  avgt   10   8,977 ± 0,328  us/op
 7. StringWriter and IOUtils.copy (Apache)      avgt   10  10,613 ± 0,599  us/op
 1. IOUtils.toString (Apache Utils)             avgt   10  10,605 ± 0,527  us/op
 3. Scanner (JDK)                               avgt   10  12,083 ± 0,293  us/op
 2. CharStreams (guava)                         avgt   10  12,999 ± 0,514  us/op
 4. Stream Api (Java 8)                         avgt   10  15,811 ± 0,605  us/op
 9. BufferedReader (JDK)                        avgt   10  16,038 ± 0,711  us/op
 5. parallel Stream Api (Java 8)                avgt   10  21,544 ± 0,583  us/op

बड़े String (लंबाई = 50100) के लिए प्रदर्शन परीक्षण, जीथब में यूआरएल (मोड = औसत समय, सिस्टम = लिनक्स, स्कोर 200,715 सर्वश्रेष्ठ है):

               Benchmark                        Mode  Cnt   Score        Error  Units
 8. ByteArrayOutputStream and read (JDK)        avgt   10   200,715 ±   18,103  us/op
 1. IOUtils.toString (Apache Utils)             avgt   10   300,019 ±    8,751  us/op
 6. InputStreamReader and StringBuilder (JDK)   avgt   10   347,616 ±  130,348  us/op
 7. StringWriter and IOUtils.copy (Apache)      avgt   10   352,791 ±  105,337  us/op
 2. CharStreams (guava)                         avgt   10   420,137 ±   59,877  us/op
 9. BufferedReader (JDK)                        avgt   10   632,028 ±   17,002  us/op
 5. parallel Stream Api (Java 8)                avgt   10   662,999 ±   46,199  us/op
 4. Stream Api (Java 8)                         avgt   10   701,269 ±   82,296  us/op
10. BufferedInputStream, ByteArrayOutputStream  avgt   10   740,837 ±    5,613  us/op
 3. Scanner (JDK)                               avgt   10   751,417 ±   62,026  us/op
11. InputStream.read() and StringBuilder (JDK)  avgt   10  2919,350 ± 1101,942  us/op

ग्राफ (विंडोज 7 सिस्टम में इनपुट स्ट्रीम लंबाई के आधार पर प्रदर्शन परीक्षण)

विंडोज 7 सिस्टम में इनपुट स्ट्रीम लंबाई के आधार पर प्रदर्शन परीक्षण (औसत समय):

 length  182    546     1092    3276    9828    29484   58968

 test8  0.38    0.938   1.868   4.448   13.412  36.459  72.708
 test4  2.362   3.609   5.573   12.769  40.74   81.415  159.864
 test5  3.881   5.075   6.904   14.123  50.258  129.937 166.162
 test9  2.237   3.493   5.422   11.977  45.98   89.336  177.39
 test6  1.261   2.12    4.38    10.698  31.821  86.106  186.636
 test7  1.601   2.391   3.646   8.367   38.196  110.221 211.016
 test1  1.529   2.381   3.527   8.411   40.551  105.16  212.573
 test3  3.035   3.934   8.606   20.858  61.571  118.744 235.428
 test2  3.136   6.238   10.508  33.48   43.532  118.044 239.481
 test10 1.593   4.736   7.527   20.557  59.856  162.907 323.147
 test11 3.913   11.506  23.26   68.644  207.591 600.444 1211.545

यदि आपके पास java.io.InputStream ऑब्जेक्ट है, तो आप उस ऑब्जेक्ट को कैसे संसाधित कर सकते हैं और String उत्पादन कैसे कर सकते हैं?

मान लीजिए मेरे पास एक InputStream है जिसमें टेक्स्ट डेटा है, और मैं इसे String रूपांतरित करना चाहता हूं, इसलिए उदाहरण के लिए मैं इसे लॉग फ़ाइल में लिख सकता हूं।

InputStream लेने और इसे String बदलने का सबसे आसान तरीका क्या है?

public String convertStreamToString(InputStream is) { 
    // ???
}

बाइट सरणी बफर का उपयोग करके केवल जेडीके का उपयोग करके इसे कैसे करें। यह वास्तव में कॉमन्स-आईओ IOUtils.copy()विधियों को कैसे काम करता है। यदि आप किसी के बजाय कॉपी कर रहे हैं तो आप इसके byte[]साथ प्रतिस्थापित कर सकते char[]हैं ।ReaderInputStream

import java.io.ByteArrayOutputStream;
import java.io.InputStream;

...

InputStream is = ....
ByteArrayOutputStream baos = new ByteArrayOutputStream(8192);
byte[] buffer = new byte[8192];
int count = 0;
try {
  while ((count = is.read(buffer)) != -1) {
    baos.write(buffer, 0, count);
  }
}
finally {
  try {
    is.close();
  }
  catch (Exception ignore) {
  }
}

String charset = "UTF-8";
String inputStreamAsString = baos.toString(charset);

यहां कम-से-कम संपथ का उत्तर दिया गया है, थोड़ा सा साफ किया गया है और फ़ंक्शन के रूप में प्रतिनिधित्व किया गया है:

String streamToString(InputStream in) throws IOException {
  StringBuilder out = new StringBuilder();
  BufferedReader br = new BufferedReader(new InputStreamReader(in));
  for(String line = br.readLine(); line != null; line = br.readLine()) 
    out.append(line);
  br.close();
  return out.toString();
}

जेडीके में सबसे आसान तरीका निम्नलिखित कोड स्निपलेट्स के साथ है।

String convertToString(InputStream in){
    String resource = new Scanner(in).useDelimiter("\\Z").next();
    return resource;
}

यदि आप Google-संग्रह / अमरूद का उपयोग कर रहे हैं तो आप निम्न कार्य कर सकते हैं:

InputStream stream = ...
String content = CharStreams.toString(new InputStreamReader(stream, Charsets.UTF_8));
Closeables.closeQuietly(stream);

ध्यान दें कि इनपुटस्ट्रीम InputStreamReader लिए दूसरा पैरामीटर (यानी Charsets.UTF_8) आवश्यक नहीं है, लेकिन एन्कोडिंग निर्दिष्ट करना आम तौर पर एक अच्छा विचार है यदि आप इसे जानते हैं (जो आपको चाहिए!)


मैंने कुछ समय परीक्षण चलाया क्योंकि समय हमेशा मायने रखता है।

मैंने स्ट्रिंग 3 अलग-अलग तरीकों से प्रतिक्रिया प्राप्त करने का प्रयास किया। (नीचे दिखाया गया है)
मैंने पठनीयता के लिए कोशिश / पकड़ ब्लॉक छोड़ दिया।

संदर्भ देने के लिए, यह सभी 3 दृष्टिकोणों के लिए पिछले कोड है:

   String response;
   String url = "www.blah.com/path?key=value";
   GetMethod method = new GetMethod(url);
   int status = client.executeMethod(method);

1)

 response = method.getResponseBodyAsString();

2)

InputStream resp = method.getResponseBodyAsStream();
InputStreamReader is=new InputStreamReader(resp);
BufferedReader br=new BufferedReader(is);
String read = null;
StringBuffer sb = new StringBuffer();
while((read = br.readLine()) != null) {
    sb.append(read);
}
response = sb.toString();

3)

InputStream iStream  = method.getResponseBodyAsStream();
StringWriter writer = new StringWriter();
IOUtils.copy(iStream, writer, "UTF-8");
response = writer.toString();

इसलिए, एक ही अनुरोध / प्रतिक्रिया डेटा के साथ प्रत्येक दृष्टिकोण पर 500 परीक्षण चलाने के बाद, यहां संख्याएं हैं। एक बार फिर, ये मेरे निष्कर्ष हैं और आपके निष्कर्ष बिल्कुल समान नहीं हो सकते हैं, लेकिन मैंने इन दृष्टिकोणों के दक्षता मतभेदों के दूसरों को कुछ संकेत देने के लिए यह लिखा है।

रैंक:
दृष्टिकोण # 1
दृष्टिकोण # 3 - 2.6% धीमी # 1 से धीमी है
दृष्टिकोण # 2 - 4.3% धीमी # 1 से धीमी है

इनमें से कोई भी दृष्टिकोण प्रतिक्रिया को पकड़ने और उस से एक स्ट्रिंग बनाने के लिए एक उपयुक्त समाधान है।


जब क्लाउडपाथ संसाधन (जो लोकप्रिय कार्य लगता है) से इनपुट स्ट्रीम आता है तो गुवा बहुत कम कुशल ऑटोक्लोज़िंग समाधान प्रदान करता है :

String content = Files.asCharSource(new File("robots.txt"), StandardCharsets.UTF_8).read();
byte[] data = Files.asByteSource(new File("favicon.ico")).read();

या

String content = Files.toString(new File("robots.txt"), StandardCharsets.UTF_8);
byte[] data = Files.toByteArray(new File("favicon.ico"));

ByteSource और CharSource की सामान्य अवधारणा भी है जो धीरे-धीरे दोनों को खोलने और बंद करने का ख्याल रखती है।

तो, उदाहरण के लिए, इसकी सामग्री को पढ़ने के लिए स्पष्ट रूप से एक छोटी फ़ाइल खोलने की बजाय:

public String read (InputStream is) {
    byte next = is.read();
    return next == -1 ? "" : next + read(is); // Recursive part: reads next byte recursively
}

या केवल

 String content = Files.toString(new File("robots.txt"), StandardCharsets.UTF_8); byte[] data = Files.toByteArray(new File("favicon.ico")); 

यदि आप स्ट्रीम रीडर का उपयोग करते हैं तो स्ट्रीम को अंत में बंद करना सुनिश्चित करें

private String readStream(InputStream iStream) throws IOException {
    //build a Stream Reader, it can read char by char
    InputStreamReader iStreamReader = new InputStreamReader(iStream);
    //build a buffered Reader, so that i can read whole line at once
    BufferedReader bReader = new BufferedReader(iStreamReader);
    String line = null;
    StringBuilder builder = new StringBuilder();
    while((line = bReader.readLine()) != null) {  //Read till end
        builder.append(line);
        builder.append("\n"); // append new line to preserve lines
    }
    bReader.close();         //close all opened stuff
    iStreamReader.close();
    //iStream.close(); //EDIT: Let the creator of the stream close it!
                       // some readers may auto close the inner stream
    return builder.toString();
}

संपादित करें: जेडीके 7+ पर, आप कोशिश-के-संसाधन निर्माण का उपयोग कर सकते हैं।

/**
 * Reads the stream into a string
 * @param iStream the input stream
 * @return the string read from the stream
 * @throws IOException when an IO error occurs
 */
private String readStream(InputStream iStream) throws IOException {

    //Buffered reader allows us to read line by line
    try (BufferedReader bReader =
                 new BufferedReader(new InputStreamReader(iStream))){
        StringBuilder builder = new StringBuilder();
        String line;
        while((line = bReader.readLine()) != null) {  //Read till end
            builder.append(line);
            builder.append("\n"); // append new line to preserve lines
        }
        return builder.toString();
    }
}

मैंने एक कक्षा लिखी है जो सिर्फ यही करती है, इसलिए मैंने सोचा कि मैं इसे सबके साथ साझा करूंगा। कभी-कभी आप केवल एक चीज के लिए अपाचे कॉमन्स जोड़ना नहीं चाहते हैं, और स्कैनर की तुलना में कुछ डम्बर चाहते हैं जो सामग्री की जांच नहीं करता है।

इस प्रकार उपयोग है

byte[] bytes = Resources.toByteArray(classLoader.getResource(path));

रीडर सिंक के लिए कोड यहां दिया गया है:

String text = Resources.toString(classLoader.getResource(path), StandardCharsets.UTF_8);

एक और एक, सभी वसंत उपयोगकर्ताओं के लिए:

import java.nio.charset.StandardCharsets;
import org.springframework.util.FileCopyUtils;

public String convertStreamToString(InputStream is) throws IOException { 
    return new String(FileCopyUtils.copyToByteArray(is), StandardCharsets.UTF_8);
}

उपयोगिता विधियों में से org.springframework.util.StreamUtilsएक के समान हैं FileCopyUtils, लेकिन जब वे पूरा हो जाते हैं तो वे स्ट्रीम को छोड़ देते हैं।


खाता फ़ाइल में लेना सबसे पहले java.io.Reader उदाहरण प्राप्त करना चाहिए। इसे तब StringBuilder पढ़ा और जोड़ा जा सकता है (अगर हम इसे एकाधिक थ्रेड में एक्सेस नहीं कर रहे हैं तो हमें StringBuffer आवश्यकता नहीं है, और StringBuilder तेज है)। यहां चाल यह है कि हम ब्लॉक में काम करते हैं, और इस तरह अन्य बफरिंग धाराओं की आवश्यकता नहीं होती है। ब्लॉक आकार को रन-टाइम प्रदर्शन अनुकूलन के लिए पैरामीटर किया गया है।

public static String slurp(final InputStream is, final int bufferSize) {
    final char[] buffer = new char[bufferSize];
    final StringBuilder out = new StringBuilder();
    try (Reader in = new InputStreamReader(is, "UTF-8")) {
        for (;;) {
            int rsz = in.read(buffer, 0, buffer.length);
            if (rsz < 0)
                break;
            out.append(buffer, 0, rsz);
        }
    }
    catch (UnsupportedEncodingException ex) {
        /* ... */
    }
    catch (IOException ex) {
        /* ... */
    }
    return out.toString();
}

यह अच्छा है क्योंकि:

  • हाथ सुरक्षा चार्सेट।
  • आप पढ़े बफर आकार को नियंत्रित करते हैं।
  • आप बिल्डर की लंबाई का प्रावधान कर सकते हैं और बिल्कुल नहीं हो सकते हैं।
  • लाइब्रेरी निर्भरताओं से मुक्त है।
  • जावा 7 या उच्चतर के लिए है।

के लिए क्या?

public static String convertStreamToString(InputStream is) {
   if (is == null) return null;
   StringBuilder sb = new StringBuilder(2048); // Define a size if you have an idea of it.
   char[] read = new char[128]; // Your buffer size.
   try (InputStreamReader ir = new InputStreamReader(is, StandardCharsets.UTF_8)) {
     for (int i; -1 != (i = ir.read(read)); sb.append(read, 0, i));
   } catch (Throwable t) {}
   return sb.toString();
}

यदि आप कॉमन्स IO (FileUtils / IOUtils / CopyUtils) का उपयोग नहीं कर सकते हैं तो फ़ाइल लाइन को लाइन लाइन पढ़ने के लिए BufferedReader का उपयोग करके एक उदाहरण यहां दिया गया है:

public class StringFromFile {
    public static void main(String[] args) /*throws UnsupportedEncodingException*/ {
        InputStream is = StringFromFile.class.getResourceAsStream("file.txt");
        BufferedReader br = new BufferedReader(new InputStreamReader(is/*, "UTF-8"*/));
        final int CHARS_PER_PAGE = 5000; //counting spaces
        StringBuilder builder = new StringBuilder(CHARS_PER_PAGE);
        try {
            for(String line=br.readLine(); line!=null; line=br.readLine()) {
                builder.append(line);
                builder.append('\n');
            }
        } catch (IOException ignore) { }
        String text = builder.toString();
        System.out.println(text);
    }
}

या यदि आप कच्ची गति चाहते हैं तो मैं पॉल डी वीरीज़ ने जो कुछ सुझाव दिया है उस पर एक भिन्नता का प्रस्ताव देना होगा (जो स्ट्रिंगवाइटर का उपयोग करने से बचाता है (जो आंतरिक रूप से स्ट्रिंगबफर का उपयोग करता है):

public class StringFromFileFast {
    public static void main(String[] args) /*throws UnsupportedEncodingException*/ {
        InputStream is = StringFromFileFast.class.getResourceAsStream("file.txt");
        InputStreamReader input = new InputStreamReader(is/*, "UTF-8"*/);
        final int CHARS_PER_PAGE = 5000; //counting spaces
        final char[] buffer = new char[CHARS_PER_PAGE];
        StringBuilder output = new StringBuilder(CHARS_PER_PAGE);
        try {
            for(int read = input.read(buffer, 0, buffer.length);
                    read != -1;
                    read = input.read(buffer, 0, buffer.length)) {
                output.append(buffer, 0, read);
            }
        } catch (IOException ignore) { }

        String text = output.toString();
        System.out.println(text);
    }
}

इस बारे में कैसा है?

InputStream in = /* your InputStream */;
StringBuilder sb=new StringBuilder();
BufferedReader br = new BufferedReader(new InputStreamReader(in));
String read;

while((read=br.readLine()) != null) {
    //System.out.println(read);
    sb.append(read);   
}

br.close();
return sb.toString();

यदि आप साहसी महसूस कर रहे थे, तो आप स्कैला और जावा मिश्रण कर सकते हैं और इसके साथ समाप्त हो सकते हैं:

scala.io.Source.fromInputStream(is).mkString("")

जावा और स्कैला कोड और पुस्तकालयों को मिलाकर इसका लाभ होता है।

यहां पूरा विवरण देखें: स्केल में एक स्ट्रिंग में एक इनपुटस्ट्रीम को परिवर्तित करने के लिए बेवकूफ तरीका


Java 9 में समर्थित java.io.InputStream.transferTo(OutputStream) उपयोग करें और ByteArrayOutputStream.toString(String) जो वर्णमाला नाम लेता है:

public static String gobble(InputStream in, String charsetName) throws IOException {
    ByteArrayOutputStream bos = new ByteArrayOutputStream();
    in.transferTo(bos);
    return bos.toString(charsetName);
}

अपाचे कॉमन्स अनुमति देता है:

String myString = IOUtils.toString(myInputStream, "UTF-8");

बेशक, आप यूटीएफ -8 के अलावा अन्य चरित्र एन्कोडिंग चुन सकते हैं।

यह भी देखें: ( Docs )


कोटलिन उपयोगकर्ता बस करते हैं:

println(InputStreamReader(is).readText())

जहाँ तक

readText()

कोटलिन मानक पुस्तकालय की अंतर्निहित विस्तार विधि है।


मैंने यहां 14 विशिष्ट उत्तरों पर एक बेंचमार्क किया (क्रेडिट प्रदान न करने के लिए खेद है लेकिन बहुत सारे डुप्लीकेट हैं)

नतीजा बहुत आश्चर्यजनक है। यह पता चला है कि अपाचे IOUtils सबसे धीमा है और ByteArrayOutputStreamसबसे तेज़ समाधान है:

तो सबसे पहले यहां सबसे अच्छी विधि है:

public String inputStreamToString(InputStream inputStream) throws IOException {
    try(ByteArrayOutputStream result = new ByteArrayOutputStream()) {
        byte[] buffer = new byte[1024];
        int length;
        while ((length = inputStream.read(buffer)) != -1) {
            result.write(buffer, 0, length);
        }

        return result.toString(UTF_8);
    }
}

20 चक्रों में 20 एमबी यादृच्छिक बाइट्स के बेंचमार्क परिणाम

मिलीसेकंड में समय

  • ByteArrayOutputStreamTest: 1 9 4
  • निओस्ट्रीम: 1 9 83
  • Java9ISTransferTo: 201
  • Java9ISReadAllBytes: 205
  • BufferedInputStreamVsByteArrayOutputStream: 314
  • अपाचेस्ट्रिंगवाइटर 2: 574
  • GuavaCharStreams: 58 9
  • ScannerReaderNoNextTest: 614
  • स्कैनर रीडर: 633
  • अपाचेस्ट्रिंगवाइटर: 1544
  • StreamApi: त्रुटि
  • समानांतरस्ट्रीमएपीआई: त्रुटि
  • बफर रीडरटेस्ट: त्रुटि
  • इनपुटस्ट्रीम और स्ट्रिंगबिल्डर: त्रुटि

बेंचमार्क स्रोत कोड

import com.google.common.io.CharStreams;
import org.apache.commons.io.IOUtils;

import java.io.*;
import java.nio.ByteBuffer;
import java.nio.channels.Channels;
import java.nio.channels.ReadableByteChannel;
import java.nio.channels.WritableByteChannel;
import java.util.Arrays;
import java.util.List;
import java.util.Random;
import java.util.stream.Collectors;

/**
 * Created by Ilya Gazman on 2/13/18.
 */
public class InputStreamToString {


    private static final String UTF_8 = "UTF-8";

    public static void main(String... args) {
        log("App started");
        byte[] bytes = new byte[1024 * 1024];
        new Random().nextBytes(bytes);
        log("Stream is ready\n");

        try {
            test(bytes);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    private static void test(byte[] bytes) throws IOException {
        List<Stringify> tests = Arrays.asList(
                new ApacheStringWriter(),
                new ApacheStringWriter2(),
                new NioStream(),
                new ScannerReader(),
                new ScannerReaderNoNextTest(),
                new GuavaCharStreams(),
                new StreamApi(),
                new ParallelStreamApi(),
                new ByteArrayOutputStreamTest(),
                new BufferReaderTest(),
                new BufferedInputStreamVsByteArrayOutputStream(),
                new InputStreamAndStringBuilder(),
                new Java9ISTransferTo(),
                new Java9ISReadAllBytes()
        );

        String solution = new String(bytes, "UTF-8");

        for (Stringify test : tests) {
            try (ByteArrayInputStream inputStream = new ByteArrayInputStream(bytes)) {
                String s = test.inputStreamToString(inputStream);
                if (!s.equals(solution)) {
                    log(test.name() + ": Error");
                    continue;
                }
            }
            long startTime = System.currentTimeMillis();
            for (int i = 0; i < 20; i++) {
                try (ByteArrayInputStream inputStream = new ByteArrayInputStream(bytes)) {
                    test.inputStreamToString(inputStream);
                }
            }
            log(test.name() + ": " + (System.currentTimeMillis() - startTime));
        }
    }

    private static void log(String message) {
        System.out.println(message);
    }

    interface Stringify {
        String inputStreamToString(InputStream inputStream) throws IOException;

        default String name() {
            return this.getClass().getSimpleName();
        }
    }

    static class ApacheStringWriter implements Stringify {

        @Override
        public String inputStreamToString(InputStream inputStream) throws IOException {
            StringWriter writer = new StringWriter();
            IOUtils.copy(inputStream, writer, UTF_8);
            return writer.toString();
        }
    }

    static class ApacheStringWriter2 implements Stringify {

        @Override
        public String inputStreamToString(InputStream inputStream) throws IOException {
            return IOUtils.toString(inputStream, UTF_8);
        }
    }

    static class NioStream implements Stringify {

        @Override
        public String inputStreamToString(InputStream in) throws IOException {
            ReadableByteChannel channel = Channels.newChannel(in);
            ByteBuffer byteBuffer = ByteBuffer.allocate(1024 * 16);
            ByteArrayOutputStream bout = new ByteArrayOutputStream();
            WritableByteChannel outChannel = Channels.newChannel(bout);
            while (channel.read(byteBuffer) > 0 || byteBuffer.position() > 0) {
                byteBuffer.flip();  //make buffer ready for write
                outChannel.write(byteBuffer);
                byteBuffer.compact(); //make buffer ready for reading
            }
            channel.close();
            outChannel.close();
            return bout.toString(UTF_8);
        }
    }

    static class ScannerReader implements Stringify {

        @Override
        public String inputStreamToString(InputStream is) throws IOException {
            java.util.Scanner s = new java.util.Scanner(is).useDelimiter("\\A");
            return s.hasNext() ? s.next() : "";
        }
    }

    static class ScannerReaderNoNextTest implements Stringify {

        @Override
        public String inputStreamToString(InputStream is) throws IOException {
            java.util.Scanner s = new java.util.Scanner(is).useDelimiter("\\A");
            return s.next();
        }
    }

    static class GuavaCharStreams implements Stringify {

        @Override
        public String inputStreamToString(InputStream is) throws IOException {
            return CharStreams.toString(new InputStreamReader(
                    is, UTF_8));
        }
    }

    static class StreamApi implements Stringify {

        @Override
        public String inputStreamToString(InputStream inputStream) throws IOException {
            return new BufferedReader(new InputStreamReader(inputStream))
                    .lines().collect(Collectors.joining("\n"));
        }
    }

    static class ParallelStreamApi implements Stringify {

        @Override
        public String inputStreamToString(InputStream inputStream) throws IOException {
            return new BufferedReader(new InputStreamReader(inputStream)).lines()
                    .parallel().collect(Collectors.joining("\n"));
        }
    }

    static class ByteArrayOutputStreamTest implements Stringify {

        @Override
        public String inputStreamToString(InputStream inputStream) throws IOException {
            try(ByteArrayOutputStream result = new ByteArrayOutputStream()) {
                byte[] buffer = new byte[1024];
                int length;
                while ((length = inputStream.read(buffer)) != -1) {
                    result.write(buffer, 0, length);
                }

                return result.toString(UTF_8);
            }
        }
    }

    static class BufferReaderTest implements Stringify {

        @Override
        public String inputStreamToString(InputStream inputStream) throws IOException {
            String newLine = System.getProperty("line.separator");
            BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream));
            StringBuilder result = new StringBuilder(UTF_8);
            String line;
            boolean flag = false;
            while ((line = reader.readLine()) != null) {
                result.append(flag ? newLine : "").append(line);
                flag = true;
            }
            return result.toString();
        }
    }

    static class BufferedInputStreamVsByteArrayOutputStream implements Stringify {

        @Override
        public String inputStreamToString(InputStream inputStream) throws IOException {
            BufferedInputStream bis = new BufferedInputStream(inputStream);
            ByteArrayOutputStream buf = new ByteArrayOutputStream();
            int result = bis.read();
            while (result != -1) {
                buf.write((byte) result);
                result = bis.read();
            }

            return buf.toString(UTF_8);
        }
    }

    static class InputStreamAndStringBuilder implements Stringify {

        @Override
        public String inputStreamToString(InputStream inputStream) throws IOException {
            int ch;
            StringBuilder sb = new StringBuilder(UTF_8);
            while ((ch = inputStream.read()) != -1)
                sb.append((char) ch);
            return sb.toString();
        }
    }

    static class Java9ISTransferTo implements Stringify {

        @Override
        public String inputStreamToString(InputStream inputStream) throws IOException {
            ByteArrayOutputStream bos = new ByteArrayOutputStream();
            inputStream.transferTo(bos);
            return bos.toString(UTF_8);
        }
    }

    static class Java9ISReadAllBytes implements Stringify {

        @Override
        public String inputStreamToString(InputStream inputStream) throws IOException {
            return new String(inputStream.readAllBytes(), UTF_8);
        }
    }

}

कैसा रहेगा:

import java.io.BufferedInputStream;
import java.io.ByteArrayOutputStream;
import java.io.InputStream;
import java.io.IOException;    

public static String readInputStreamAsString(InputStream in) 
    throws IOException {

    BufferedInputStream bis = new BufferedInputStream(in);
    ByteArrayOutputStream buf = new ByteArrayOutputStream();
    int result = bis.read();
    while(result != -1) {
      byte b = (byte)result;
      buf.write(b);
      result = bis.read();
    }        
    return buf.toString();
}

यहां मेरा जावा 8 आधारित समाधान है, जो नई स्ट्रीम एपीआई का उपयोग सभी लाइनों को इकट्ठा करने के लिए करता है InputStream:

public static String toString(InputStream inputStream) {
    BufferedReader reader = new BufferedReader(
        new InputStreamReader(inputStream));
    return reader.lines().collect(Collectors.joining(
        System.getProperty("line.separator")));
}

यह org.apache.commons.io.IOUtils स्रोत कोड से अनुकूलित एक उत्तर है , जो अपाचे कार्यान्वयन चाहते हैं लेकिन पूरी लाइब्रेरी नहीं चाहते हैं।

private static final int BUFFER_SIZE = 4 * 1024;

public static String inputStreamToString(InputStream inputStream, String charsetName)
        throws IOException {
    StringBuilder builder = new StringBuilder();
    InputStreamReader reader = new InputStreamReader(inputStream, charsetName);
    char[] buffer = new char[BUFFER_SIZE];
    int length;
    while ((length = reader.read(buffer)) != -1) {
        builder.append(buffer, 0, length);
    }
    return builder.toString();
}

यहां पूर्णता के लिए जावा 9 समाधान है:

public static String toString(InputStream input) throws IOException {
    return new String(input.readAllBytes(), StandardCharsets.UTF_8);
}

readAllBytes वर्तमान में readAllBytes 9 मुख्य कोडबेस में है, इसलिए यह रिलीज में दिखाई देने की संभावना है। आप अभी जेडीके 9 स्नैपशॉट बिल्ड का उपयोग करके इसे आजमा सकते हैं।


यहां केवल मानक जावा लाइब्रेरी का उपयोग करने का एक तरीका है (ध्यान दें कि स्ट्रीम बंद नहीं है, वाईएमएमवी)।

static String convertStreamToString(java.io.InputStream is) {
    java.util.Scanner s = new java.util.Scanner(is).useDelimiter("\\A");
    return s.hasNext() ? s.next() : "";
}

मैंने इस चाल को "बेवकूफ स्कैनर चाल" लेख से सीखा। कारण यह काम करता है क्योंकि Scanner धारा में टोकन पर पुनरावृत्ति करता है, और इस मामले में हम "इनपुट सीमा की शुरुआत" (\ ए) का उपयोग करके टोकन को अलग करते हैं, इस प्रकार हम स्ट्रीम की पूरी सामग्री के लिए केवल एक टोकन देते हैं।

नोट, यदि आपको इनपुट स्ट्रीम के एन्कोडिंग के बारे में विशिष्ट होना आवश्यक है, तो आप Scanner कन्स्ट्रक्टर को दूसरा तर्क प्रदान कर सकते हैं जो इंगित करता है कि किस वर्ण का उपयोग करना है (उदाहरण के लिए "यूटीएफ -8")।

हैट टिप Jacob, को भी जाता है Jacob, जिसने मुझे एक बार लेख में बताया था।

संपादित: Patrick से एक सुझाव के लिए धन्यवाद, एक खाली इनपुट स्ट्रीम को संभालने के दौरान समारोह को और अधिक मजबूत बना दिया। एक और संपादन: मिश्रित कोशिश / पकड़, पैट्रिक का रास्ता अधिक लापरवाही है।


कुछ लोग मानते हैं कि आपको पासवर्ड को स्टोर करने के लिए उपयोग की जाने वाली मेमोरी को ओवरराइट करना होगा जब आपको इसकी आवश्यकता नहीं होगी। यह समय विंडो को कम करता है जिसे हमलावर को आपके सिस्टम से पासवर्ड पढ़ना पड़ता है और इस तथ्य को पूरी तरह से अनदेखा करता है कि हमलावर को ऐसा करने के लिए जेवीएम मेमोरी को हाइजैक करने के लिए पहले से ही पर्याप्त पहुंच की आवश्यकता है। उस पहुंच के साथ एक हमलावर आपके मुख्य कार्यक्रमों को पूरी तरह से बेकार बना सकता है (AFAIK, तो अगर मैं गलत हूं तो कृपया मुझे सही करें)।

अद्यतन करें

टिप्पणियों के लिए धन्यवाद मुझे अपना जवाब अपडेट करना है। स्पष्ट रूप से दो मामले हैं जहां यह एक (बहुत) मामूली सुरक्षा सुधार जोड़ सकता है क्योंकि यह हार्ड ड्राइव पर पासवर्ड का समय कम कर सकता है। फिर भी मुझे लगता है कि यह ज्यादातर उपयोग मामलों के लिए अधिक है।

  • आपका लक्ष्य तंत्र बुरी तरह कॉन्फ़िगर किया जा सकता है या आपको यह मानना ​​है कि आपको कोर डंप के बारे में पागल होना है (यदि सिस्टम व्यवस्थापक द्वारा प्रबंधित नहीं किया जाता है तो वैध हो सकता है)।
  • CipherShed (बंद), CipherShed , या CipherShed जैसी चीजों का उपयोग करके - हमलावर के साथ डेटा लीक को रोकने के लिए आपके सॉफ़्टवेयर को अत्यधिक CipherShed

यदि संभव हो, कोर डंप अक्षम करने और स्वैप फ़ाइल दोनों समस्याओं का ख्याल रखेगी। हालांकि, उन्हें व्यवस्थापक अधिकारों की आवश्यकता होगी और कार्यक्षमता (उपयोग करने के लिए कम स्मृति) को कम कर सकते हैं और चल रहे सिस्टम से रैम खींचना अभी भी एक वैध चिंता होगी।







java string io stream inputstream