Frage Lesen / konvertieren Sie einen InputStream in einen String


Wenn Sie eine haben java.io.InputStream Objekt, wie soll man das Objekt bearbeiten und ein Objekt erzeugen String?


Angenommen, ich habe eine InputStream das enthält Textdaten, und ich möchte es in a konvertieren StringAlso kann ich das zum Beispiel in eine Log-Datei schreiben.

Was ist der einfachste Weg, um die InputStream und wandle es in a um String?

public String convertStreamToString(InputStream is) { 
    // ???
}

3263
2017-11-21 16:47


Ursprung


Antworten:


Eine gute Möglichkeit, dies zu tun, ist die Verwendung Apache commons  IOUtils das kopieren InputStream in ein StringWriter... etwas wie

StringWriter writer = new StringWriter();
IOUtils.copy(inputStream, writer, encoding);
String theString = writer.toString();

oder auch

// NB: does not close inputStream, you'll have to use try-with-resources for that
String theString = IOUtils.toString(inputStream, encoding); 

Alternativ könnten Sie verwenden ByteArrayOutputStream wenn du deine Streams und Writer nicht mischen willst


2044
2017-11-21 16:54



Hier ist ein Weg, nur die Standard-Java-Bibliothek zu verwenden (beachten Sie, dass der Stream nicht geschlossen ist, YMMV).

static String convertStreamToString(java.io.InputStream is) {
    java.util.Scanner s = new java.util.Scanner(is).useDelimiter("\\A");
    return s.hasNext() ? s.next() : "";
}

Ich habe diesen Trick aus gelernt "Stupid Scanner Tricks" Artikel. Der Grund, warum es funktioniert, ist, weil Scanner Iteriert über Tokens im Stream, und in diesem Fall trennen wir Token mit "Beginn der Eingabegrenze" (\ A) und geben uns somit nur ein Token für den gesamten Inhalt des Streams.

Hinweis: Wenn Sie die Codierung des Eingabestreams genauer festlegen müssen, können Sie das zweite Argument angeben Scanner Konstruktor, der anzeigt, welcher Zeichensatz zu verwenden ist (z. B. "UTF-8").

Hut Tipp geht auch zu Jacob, wer hat mich einmal auf den besagten Artikel hingewiesen?

BEARBEITET: Dank einem Vorschlag von Patrick, machte die Funktion robuster bei der Handhabung eines leeren Eingabestroms. Noch eine Bearbeitung: nixed try / catch, Patrick ist lakonisch.


2092
2018-03-26 20:40



Fassen Sie andere Antworten zusammen Ich fand 11 Hauptwege, um dies zu tun (siehe unten). Und ich schrieb einige Leistungstests (siehe Ergebnisse unten):

Möglichkeiten, einen InputStream in einen String zu konvertieren:

  1. Verwenden IOUtils.toString (Apache Utils)

    String result = IOUtils.toString(inputStream, StandardCharsets.UTF_8);
    
  2. Verwenden CharStreams (Guave)

    String result = CharStreams.toString(new InputStreamReader(
          inputStream, Charsets.UTF_8));
    
  3. Verwenden Scanner (JDK)

    Scanner s = new Scanner(inputStream).useDelimiter("\\A");
    String result = s.hasNext() ? s.next() : "";
    
  4. Verwenden Stream-API (Java 8). Warnung: Diese Lösung konvertiert verschiedene Zeilenumbrüche (wie \r\n) zu \n.

    String result = new BufferedReader(new InputStreamReader(inputStream))
      .lines().collect(Collectors.joining("\n"));
    
  5. Verwenden Parallele Stream-API (Java 8). Warnung: Diese Lösung konvertiert verschiedene Zeilenumbrüche (wie \r\n) zu \n.

    String result = new BufferedReader(new InputStreamReader(inputStream)).lines()
       .parallel().collect(Collectors.joining("\n"));
    
  6. Verwenden InputStreamReader und StringBuilder (JDK)

    final int bufferSize = 1024;
    final char[] buffer = new char[bufferSize];
    final StringBuilder out = new StringBuilder();
    Reader in = new InputStreamReader(inputStream, "UTF-8");
    for (; ; ) {
        int rsz = in.read(buffer, 0, buffer.length);
        if (rsz < 0)
            break;
        out.append(buffer, 0, rsz);
    }
    return out.toString();
    
  7. Verwenden StringWriter und IOUtils.copy (Apache Commons)

    StringWriter writer = new StringWriter();
    IOUtils.copy(inputStream, writer, "UTF-8");
    return writer.toString();
    
  8. Verwenden ByteArrayOutputStream und inputStream.read (JDK)

    ByteArrayOutputStream result = new ByteArrayOutputStream();
    byte[] buffer = new byte[1024];
    int length;
    while ((length = inputStream.read(buffer)) != -1) {
        result.write(buffer, 0, length);
    }
    // StandardCharsets.UTF_8.name() > JDK 7
    return result.toString("UTF-8");
    
  9. Verwenden BufferedReader (JDK). Warnung: Diese Lösung konvertiert verschiedene Zeilenumbrüche (wie \n\r) zu line.separator Systemeigenschaft (z. B. in Windows zu "\ r \ n").

    String newLine = System.getProperty("line.separator");
    BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream));
    StringBuilder result = new StringBuilder();
    String line; boolean flag = false;
    while ((line = reader.readLine()) != null) {
        result.append(flag? newLine: "").append(line);
        flag = true;
    }
    return result.toString();
    
  10. Verwenden BufferedInputStream und ByteArrayOutputStream (JDK)

    BufferedInputStream bis = new BufferedInputStream(inputStream);
    ByteArrayOutputStream buf = new ByteArrayOutputStream();
    int result = bis.read();
    while(result != -1) {
        buf.write((byte) result);
        result = bis.read();
    }
    // StandardCharsets.UTF_8.name() > JDK 7
    return buf.toString("UTF-8");
    
  11. Verwenden inputStream.read() und StringBuilder (JDK). Warnung: Diese Lösung hat Probleme mit Unicode, zum Beispiel mit russischem Text (funktioniert nur mit Nicht-Unicode-Text korrekt)

    int ch;
    StringBuilder sb = new StringBuilder();
    while((ch = inputStream.read()) != -1)
        sb.append((char)ch);
    reset();
    return sb.toString();
    

Warnung:

  1. Die Lösungen 4, 5 und 9 konvertieren verschiedene Zeilenumbrüche in einen.

  2. Lösung 11 kann nicht korrekt mit Unicode-Text arbeiten

Leistungstests

Leistungstests für kleine String (Länge = 175), URL ein Github (Modus = Durchschnittliche Zeit, System = Linux, 1.343 Punkte sind die Besten):

              Benchmark                         Mode  Cnt   Score   Error  Units
 8. ByteArrayOutputStream and read (JDK)        avgt   10   1,343 ± 0,028  us/op
 6. InputStreamReader and StringBuilder (JDK)   avgt   10   6,980 ± 0,404  us/op
10. BufferedInputStream, ByteArrayOutputStream  avgt   10   7,437 ± 0,735  us/op
11. InputStream.read() and StringBuilder (JDK)  avgt   10   8,977 ± 0,328  us/op
 7. StringWriter and IOUtils.copy (Apache)      avgt   10  10,613 ± 0,599  us/op
 1. IOUtils.toString (Apache Utils)             avgt   10  10,605 ± 0,527  us/op
 3. Scanner (JDK)                               avgt   10  12,083 ± 0,293  us/op
 2. CharStreams (guava)                         avgt   10  12,999 ± 0,514  us/op
 4. Stream Api (Java 8)                         avgt   10  15,811 ± 0,605  us/op
 9. BufferedReader (JDK)                        avgt   10  16,038 ± 0,711  us/op
 5. parallel Stream Api (Java 8)                avgt   10  21,544 ± 0,583  us/op

Leistungstests für große String (Länge = 50100), URL ein Github (Modus = Durchschnittliche Zeit, System = Linux, Score 200.715 ist die beste):

               Benchmark                        Mode  Cnt   Score        Error  Units
 8. ByteArrayOutputStream and read (JDK)        avgt   10   200,715 ±   18,103  us/op
 1. IOUtils.toString (Apache Utils)             avgt   10   300,019 ±    8,751  us/op
 6. InputStreamReader and StringBuilder (JDK)   avgt   10   347,616 ±  130,348  us/op
 7. StringWriter and IOUtils.copy (Apache)      avgt   10   352,791 ±  105,337  us/op
 2. CharStreams (guava)                         avgt   10   420,137 ±   59,877  us/op
 9. BufferedReader (JDK)                        avgt   10   632,028 ±   17,002  us/op
 5. parallel Stream Api (Java 8)                avgt   10   662,999 ±   46,199  us/op
 4. Stream Api (Java 8)                         avgt   10   701,269 ±   82,296  us/op
10. BufferedInputStream, ByteArrayOutputStream  avgt   10   740,837 ±    5,613  us/op
 3. Scanner (JDK)                               avgt   10   751,417 ±   62,026  us/op
11. InputStream.read() and StringBuilder (JDK)  avgt   10  2919,350 ± 1101,942  us/op

Graphen (Leistungstests abhängig von der Länge des Eingabestreams im Windows 7-System)
enter image description here

Leistungstest (durchschnittliche Zeit) abhängig von der Länge des Eingabestreams im Windows 7-System:

 length  182    546     1092    3276    9828    29484   58968

 test8  0.38    0.938   1.868   4.448   13.412  36.459  72.708
 test4  2.362   3.609   5.573   12.769  40.74   81.415  159.864
 test5  3.881   5.075   6.904   14.123  50.258  129.937 166.162
 test9  2.237   3.493   5.422   11.977  45.98   89.336  177.39
 test6  1.261   2.12    4.38    10.698  31.821  86.106  186.636
 test7  1.601   2.391   3.646   8.367   38.196  110.221 211.016
 test1  1.529   2.381   3.527   8.411   40.551  105.16  212.573
 test3  3.035   3.934   8.606   20.858  61.571  118.744 235.428
 test2  3.136   6.238   10.508  33.48   43.532  118.044 239.481
 test10 1.593   4.736   7.527   20.557  59.856  162.907 323.147
 test11 3.913   11.506  23.26   68.644  207.591 600.444 1211.545

1649
2018-02-17 00:58



Apache Commons ermöglicht:

String myString = IOUtils.toString(myInputStream, "UTF-8");

Natürlich könnten Sie neben UTF-8 auch andere Zeichenkodierungen wählen.

Siehe auch: (Dokumente)


794
2017-12-08 20:13



Unter Berücksichtigung der Datei sollte man zuerst einen bekommen java.io.Reader Beispiel. Dies kann dann gelesen und zu a hinzugefügt werden StringBuilder (Wir brauchen nicht StringBuffer wenn wir nicht in mehreren Threads darauf zugreifen, und StringBuilder ist schneller). Der Trick dabei ist, dass wir in Blöcken arbeiten und daher keine anderen Pufferströme benötigen. Die Blockgröße wird für die Laufzeitleistungsoptimierung parametrisiert.

public static String slurp(final InputStream is, final int bufferSize) {
    final char[] buffer = new char[bufferSize];
    final StringBuilder out = new StringBuilder();
    try (Reader in = new InputStreamReader(is, "UTF-8")) {
        for (;;) {
            int rsz = in.read(buffer, 0, buffer.length);
            if (rsz < 0)
                break;
            out.append(buffer, 0, rsz);
        }
    }
    catch (UnsupportedEncodingException ex) {
        /* ... */
    }
    catch (IOException ex) {
        /* ... */
    }
    return out.toString();
}

263
2017-08-04 08:29



Wie wäre es damit?

InputStream in = / * Dein InputStream * /;
StringBuilder sb=new StringBuilder();
BufferedReader br = new BufferedReader(new InputStreamReader(in));
String read;

while((read=br.readLine()) != null) {
    //System.out.println(read);
    sb.append(read);   
}

br.close();
return sb.toString();

226
2017-07-13 15:56



Wenn Sie Google-Collections / Guava verwenden, können Sie Folgendes tun:

InputStream stream = ...
String content = CharStreams.toString(new InputStreamReader(stream, Charsets.UTF_8));
Closeables.closeQuietly(stream);

Beachten Sie, dass der zweite Parameter (d. H. Charsets.UTF_8) für die InputStreamReader ist nicht notwendig, aber es ist im Allgemeinen eine gute Idee, die Codierung anzugeben, wenn Sie es wissen (was Sie sollten!)


153
2018-05-08 20:24