스트림 API
포스트
취소

스트림 API

스트림 API란?

  • 입출력 스트림과는 전혀 다른 개념
  • 데이터를 추상화하여 다룬다.
  • 다양한 방식으로 저장된 데이터를 읽고 쓰기 위한 공통된 방법을 제공한다.
  • 배열이나 컬렉션뿐만 아니라 파일에 저장된 데이터도 모두 같은 방법으로 다룰 수 있게 된다.
  • Java SE 8부터 제공
  • 탄생 배경
    1. Java에서는 많은 양의 데이터를 저장하기 위해서 배열이나 컬렉션을 사용
    2. 저장된 데이터에 접근하기 위해서 반복문이나 반복자를 사용하여 매번 새로운 코드를 작성
    3. 이렇게 작성된 코드는 단점이 많음
      • 길이가 너무 길다.
      • 가독성이 떨어진다.
      • 코드의 재사용이 거의 불가능하다.
      • 데이터베이스의 쿼리와 같이 정형화된 처리 패턴이 없다.
        • 데이터마다 다른 방법으로 접근해야 한다.

스트림 API의 특징

  • 외부 반복을 통해 작업하는 컬렉션과는 달리 내부 반복(internal iteration)을 통해 작업을 수행한다.
  • 재사용이 가능한 컬렉션과는 달리 단 한 번만 사용할 수 있다.
  • 원본 데이터를 변경하지 않는다.
  • 스트림의 연산은 필터-맵(filter-map) 기반의 API를 사용하여 지연(lazy) 연산을 통해 성능을 최적화한다.
  • parallelStream() 메소드를 통한 손쉬운 병렬 처리를 지원한다.

스트림 API의 동작 흐름

  1. 스트림의 생성
  2. 스트림의 중개 연산 (스트림의 변환)
  3. 스트림의 최종 연산 (스트림의 사용)
flowchart LR
    id1("데이터 소스") --> id2(["중개연산 (필터)"])
    id2(["중개연산 (필터)"]) --> id3(["중개연산 (맵)"])
    id3(["중개연산 (맵)"]) --> id4(("필터"))

스트림의 생성

  • 생성 범위
    • 컬렉션
    • 배열
    • 가변 매개변수
    • 지정된 범위의 연속된 정수
    • 특정 타입의 난수들
    • 람다 표현식
    • 파일
    • 빈 스트림

Stream 클래스의 특징

  • Stream 클래스의 forEach() 메소드는 해당 스트림의 요소를 하나씩 소모해가며
    순차적으로 요소에 접근한다.
    • 같은 스트림으로는 forEach() 메소드를 한 번밖에 호출할 수 없다.
    • 원본 데이터의 요소를 소모하는 것은 아니다.
      • 같은 데이터에서 또 다른 스트림을 생성하여 forEach() 메소드를 호출하는 것은 가능하다.

컬렉션

  • Collection 인터페이스에는 stream() 메소드가 정의되어 있다.
    • Collection 인터페이스를 구현한 클래스들은 stream() 메소드로 스트림을 생성할 수 있다.
  • parallelStream() 메소드를 사용하면 병렬 처리가 가능한 스트림을 생성할 수 있다.
  • 사용 예시
ArrayList<Integer> list = new ArrayList<Integer>();

list.add(4);
list.add(2);
list.add(3);
list.add(1);

//컬렉션에서 스트림 생성
Stream<Integer> stream = list.stream();

//forEach() 메소드를 이용한 스트림 요소의 순차 접근
stream.forEach(System.out::println);

배열

  • Arrays 클래스에는 다양한 형태의 stream() 메소드가 클래스 메소드로 정의되어 있다.
  • 기본 타입인 int, long, double 형을 저장할 수 있는 배열에 관한 스트림이 별도로 정의되어 있다.
    • int
      • IntStream
    • long
      • LongStream
    • double
      • DoubleStream
  • Arrays 클래스의 stream() 메소드는 전체 배열뿐만 아니라
    배열의 특정 부분만을 이용하여 스트림을 생성할 수도 있다.
  • 사용 예시
String[] arr = new String[]{"넷", "둘", "셋", "하나"};

//배열에서 스트림 생성
Stream<String> stream1 = Arrays.stream(arr);
stream1.forEach(e -> System.out.print(e + " "));
System.out.println();

//배열의 특정 부분만을 이용한 스트림 생성
Stream<String> stream2 = Arrays.stream(arr, 1, 3);
stream2.forEach(e -> System.out.print(e + " "));

가변 매개변수 (variable parameter)

  • Stream 클래스의 of() 메소드를 사용하면 가변 매개변수를 전달받아 스트림을 생성할 수 있다.
  • 사용 예시
//가변 매개변수에서 스트림 생성
Stream<Double> stream = Stream.of(4.2, 2.5, 3.1, 1.9);
stream.forEach(System.out::println);

지정된 범위의 연속된 정수

  • 지정된 범위의 연속된 정수를 스트림으로 생성하기 위해
    IntStream나 LongStream 인터페이스에는 range()와 rangeClosed() 메소드가 정의되어 있다.
  • 메소드
    • range()
      • 명시된 시작 정수를 포함하지만 명시된 마지막 정수는 포함하지 않는 스트림을 생성한다.
    • rangeClosed()
      • 명시된 시작 정수뿐만 아니라 명시된 마지막 정수까지도 포함하는 스트림을 생성한다.
  • 사용 예시
//지정된 범위의 연속된 정수에서 스트림 생성
IntStream stream1 = IntStream.range(1, 4);
stream1.forEach(e -> System.out.print(e + " "));
System.out.println();

IntStream stream2 = IntStream.rangeClosed(1, 4);
stream2.forEach(e -> System.out.print(e + " "));

특정 타입의 난수들

  • 특정 타입의 난수로 이루어진 스트림을 생성하기 위해
    Random 클래스에는 ints(), longs(), doubles()와 같은 메소드가 정의되어 있다.
    • 매개변수로 스트림의 크기를 long 타입으로 전달받을 수 있습니다.
    • 매개변수를 전달받지 않으면 크기가 정해지지 않은 무한 스트림(infinite stream)을 반환한다.
      • 이 때는 limit() 메소드를 사용하여 따로 스트림의 크기를 제한해야 합니다.
  • 사용 예시
//특정 타입의 난수로 이루어진 스트림 생성
IntStream stream = new Random().ints(4);
stream.forEach(System.out::println);

람다 표현식

  • 람다 표현식을 매개변수로 전달받아
    해당 람다 표현식에 의해 반환되는 값을 요소로 하는 무한 스트림을 생성하기 위해
    Stream 클래스에는 iterate()와 generate() 메소드가 정의되어 있다.
  • iterate() 메소드는 시드(seed)로 명시된 값을 람다 표현식에 사용하여 반환된 값을
    다시 시드로 사용하는 방식으로 무한 스트림을 생성한다.
  • generate() 메소드는 매개변수가 없는 람다 표현식을 사용하여 반환된 값으로 무한 스트림을 생성한다.
  • 사용 예시
IntStream stream = Stream.iterate(2, n -> n + 2); // 2, 4, 6, 8, 10, ...

파일

  • 파일의 한 행(line)을 요소로 하는 스트림을 생성하기 위해
    java.nio.file.Files 클래스에는 lines() 메소드가 정의되어 있다.
  • java.io.BufferedReader 클래스의 lines() 메소드를 사용하면 파일뿐만 아니라
    다른 입력으로부터도 데이터를 행(line) 단위로 읽어 올 수 있다.

  • 사용 예시
String<String> stream = Files.lines(Path path);

빈 스트림

  • 아무 요소도 가지지 않는 빈 스트림은 Stream 클래스의 empty() 메소드를 사용하여 생성할 수 있다.
  • 사용 예시
//빈 스트림 생성
Stream<Object> stream = Stream.empty();

System.out.println(stream.count()); //스트림의 요소의 총 개수를 출력

스트림의 중개 연산 (intermediate operation)

  • 스트림 API에 의해 생성된 초기 스트림은 중개 연산을 통해 또 다른 스트림으로 변환된다.
  • 중개 연산은 스트림을 전달받아 스트림을 반환하므로 중개 연산은 연속으로 연결해서 사용할 수 있다.
  • 스트림의 중개 연산은 필터-맵(filter-map) 기반의 API를 사용함으로 지연(lazy) 연산을 통해 성능을 최적화할 수 있다.
사용 목적메소드
스트림 필터링filter()
distinct()
스트림 변환map()
flatMap()
스트림 제한limit()
skip()
스트림 정렬sorted()
스트림 연산 결과 확인peek()

스트림 중개 연산 메소드

메소드설명
Stream filter(Predicate<? super T> predicate)해당 스트림에서 주어진 조건(predicate)에 맞는 요소만으로 구성된 새로운 스트림을 반환함.
Stream map(Functoin<? super T, ? extends R> mapper)해당 스트림의 요소들을 주어진 함수에 인수로 전달하여, 그 반환값으로 이루어진 새로운 스트림을 반환함.
Stream flatMap(Functoin<? super T, ? extends Stream<? extends R>> mapper)해당 스트림의 요소가 배열일 경우, 배열의 각 요소를 주어진 함수에 인수로 전달하여, 그 반환값으로 이루어진 새로운 스트림을 반환함.
Stream distinct()해당 스트림에서 중복된 요소가 제거된 새로운 스트림을 반환함.
내부적으로 Object 클래스의 equals() 메소드를 사용함.
Stream limit(long maxSize)해당 스트림에서 전달된 개수만큼의 요소만으로 이루어진 새로운 스트림을 반환함.
Stream peek(Consumer<? super T> action)결과 스트림으로부터 각 요소를 소모하여 추가로 명시된 동작(action)을 수행하여 새로운 스트림을 생성하여 반환함.
Stream skip(long n)해당 스트림의 첫 번째 요소부터 전달된 개수만큼의 요소를 제외한 나머지 요소만으로 이루어진 새로운 스트림을 반환함.
Stream sorted()
Stream sorted(Comparator<? super T> comparator)
해당 스트림을 주어진 비교자(comparator)를 이용하여 정렬함.
비교자를 전달하지 않으면 영문사전 순(natural order)으로 정렬함.

스트림 필터링

  • 메소드
    • filter() 메소드
      • 해당 스트림에서 주어진 조건(predicate)에 맞는 요소만으로 구성된 새로운 스트림을 반환한다.
    • distinct() 메소드
      • 해당 스트림에서 중복된 요소가 제거된 새로운 스트림을 반환한다.
      • 내부적으로 Object 클래스의 equals() 메소드를 사용하여 요소의 중복을 비교한다.
  • 사용 예시
IntStream stream1 = IntStream.of(7, 5, 5, 2, 1, 2, 3, 5, 4, 6);
IntStream stream2 = IntStream.of(7, 5, 5, 2, 1, 2, 3, 5, 4, 6);

//스트림에서 중복된 요소를 제거
stream1.distinct().forEach(e -> System.out.print(e + " "));
System.out.println();

//스트림에서 홀수만을 골라낸다.
stream2.filter(n -> n % 2 != 0).forEach(e -> System.out.print(e + " "));

스트림 변환

  • 메소드
    • map() 메소드
      • 해당 스트림의 요소들을 주어진 함수에 인수로 전달하여, 그 반환값들로 이루어진 새로운 스트림을 반환한다.
        • 해당 스트림의 요소가 배열이라면,
          flatMap() 메소드를 사용하여 각 배열의 각 요소의 반환값을
          하나로 합친 새로운 스트림을 얻을 수 있습니다.
  • 사용 예시
문자열로 이루어진 스트림을 map() 메소드를 이용하여  문자열의 길이로 이루어진 스트림으로 변환하는 예제
Stream<String> stream = Stream.of("HTML", "CSS", "JAVA", "JAVASCRIPT");
stream.map(s -> s.length()).forEach(System.out::println);

//여러 문자열이 저장된 배열을 각 문자열에 포함된 단어로 이루어진 스트림으로 변환
String[] arr = {"I study hard", "You study JAVA", "I am hungry"};
Stream<String> stream = Arrays.stream(arr);
stream.flatMap(s -> Stream.of(s.split(" +"))).forEach(System.out::println);

스트림 제한

  • 메소드
    • limit() 메소드
      • 해당 스트림의 첫 번째 요소부터 전달된 개수만큼의 요소만으로 이루어진 새로운 스트림을 반환한다.
    • skip() 메소드
      • 해당 스트림의 첫 번째 요소부터 전달된 개수만큼의 요소를 제외한
        나머지 요소만으로 이루어진 새로운 스트림을 반환한다.
  • 사용 예시
IntStream stream1 = IntStream.range(0, 10);
IntStream stream2 = IntStream.range(0, 10);
IntStream stream3 = IntStream.range(0, 10);

stream1.skip(4).forEach(n -> System.out.print(n + " "));
System.out.println();

stream2.limit(5).forEach(n -> System.out.print(n + " "));
System.out.println();

stream3.skip(3).limit(5).forEach(n -> System.out.print(n + " "));

스트림 정렬

  • 메소드
    • sorted() 메소드
      • 해당 스트림을 주어진 비교자(comparator)를 이용하여 정렬한다.
        • 비교자를 전달하지 않으면 기본적으로 사전 편찬 순(natural order)으로 정렬한다.
  • 사용 예시
Stream<String> stream1 = Stream.of("JAVA", "HTML", "JAVASCRIPT", "CSS");
Stream<String> stream2 = Stream.of("JAVA", "HTML", "JAVASCRIPT", "CSS");

stream1.sorted().forEach(s -> System.out.print(s + " "));
System.out.println();

stream2.sorted(Comparator.reverseOrder()).forEach(s -> System.out.print(s + " "));

스트림 연산 결과 확인

  • 메소드
    • peek() 메소드
      • 결과 스트림으로부터 요소를 소모하여 추가로 명시된 동작을 수행한다.
      • 원본 스트림에서 요소를 소모하지 않으므로, 주로 연산과 연산 사이에 결과를 확인하고 싶을 때 사용한다.
      • 개발자가 디버깅 용도로 많이 사용합니다.
  • 사용 예시
IntStream stream = IntStream.of(7, 5, 5, 2, 1, 2, 3, 5, 4, 6);

stream.peek(s -> System.out.println("원본 스트림 : " + s))
.skip(2)
.peek(s -> System.out.println("skip(2) 실행 후 : " + s))
.limit(5)
.peek(s -> System.out.println("limit(5) 실행 후 : " + s))
.sorted()
.peek(s -> System.out.println("sorted() 실행 후 : " + s))
.forEach(n -> System.out.println(n));

스트림의 최종 연산 (terminal operation)

  • 스트림 API에서 중개 연산을 통해 변환된 스트림은 마지막으로 최종 연산을 통해 각 요소를 소모하여 결과를 표시한다.
  • 지연(lazy)되었던 모든 중개 연산들이 최종 연산 시에 모두 수행된다.
  • 최종 연산 시에 모든 요소를 소모한 해당 스트림은 사용할 수 없게 됩니다.
사용 목적메소드
요소의 출력forEach()
요소의 소모reduce()
요소의 검색findFirst(), findAny()
요소의 검사anyMatch(), allMatch(), noneMatch()
요소의 통계count(), min(), max()
요소의 연산sum(), average()
요소의 수집collect()

스트림 최종 연산 메소드

메소드설명
void forEach(Consumer<? super T> action)스트림의 각 요소에 대해 해당 요소를 소모하여 명시된 동작을 수행함.
Optional reduce(BinaryOperator accumulator)
T reduce(T identity, BinaryOperator accumulator)
처음 두 요소를 가지고 연산을 수행한 뒤, 그 결과와 다음 요소를 가지고 또다시 연산을 수행함.
이런 식으로 해당 스트림의 모든 요소를 소모하여 연산을 수행하고, 그 결과를 반환함.
Optional findFirst()
Optional findAny()
해당 스트림에서 첫 번째 요소를 참조하는 Optional 객체를 반환함.
(findAny() 메소드는 병렬 스트림일 때 사용함)
boolean anyMatch(Predicate<? super T> predicate)해당 스트림의 일부 요소가 특정 조건을 만족할 경우에 true를 반환함.
boolean allMatch(Predicate<? super T> predicate)해당 스트림의 모든 요소가 특정 조건을 만족할 경우에 true를 반환함.
boolean noneMatch(Predicate<? super T> predicate)해당 스트림의 모든 요소가 특정 조건을 만족하지 않을 경우에 true를 반환함.
long count()해당 스트림의 요소의 개수를 반환함.
Optional max(Comparator<? super T> comparator)해당 스트림의 요소 중에서 가장 큰 값을 가지는 요소를 참조하는 Optional 객체를 반환함.
Optional min(Comparator<? super T> comparator)해당 스트림의 요소 중에서 가장 작은 값을 가지는 요소를 참조하는 Optional 객체를 반환함.
T sum()해당 스트림의 모든 요소에 대해 합을 구하여 반환함.
Optional average()해당 스트림의 모든 요소에 대해 평균값을 구하여 반환함.
<R,A> R collect(Collector<? super T,A,R> collector)인수로 전달되는 Collectors 객체에 구현된 방법대로 스트림의 요소를 수집함.

요소의 출력

  • 메소드
    • forEach() 메소드
      • 스트림의 각 요소를 소모하여 명시된 동작을 수행한다.
      • 반환 타입이 void이므로 보통 스트림의 모든 요소를 출력하는 용도로 많이 사용한다.
  • 사용 예시
Stream<String> stream = Stream.of("넷", "둘", "셋", "하나");
stream.forEach(System.out::println);

요소의 소모

  • 스트림의 최종 연산은 모두 스트림의 각 요소를 소모하여 연산을 수행하게 된다.
  • 메소드
    • reduce() 메소드
      • 첫 번째와 두 번째 요소를 가지고 연산을 수행한 뒤, 그 결과와 세 번째 요소를 가지고 또다시 연산을 수행한다.
      • 해당 스트림의 모든 요소를 소모하여 연산을 수행하고, 그 결과를 반환한다.
      • 인수로 초깃값을 전달하면 초깃값과 해당 스트림의 첫 번째 요소와 연산을 시작하며,
        그 결과와 두 번째 요소를 가지고 계속해서 연산을 수행한다.
      • 비어 있는 스트림과 reduce 연산을 할 경우 전달받은 초깃값을 그대로 반환해야 하기 때문에
        반환 타입이 Optional가 아닌 T 타입이다.
  • 사용 예시
//스트림의 각 문자열 요소를 "++" 기호로 연결하여 출력
Stream<String> stream1 = Stream.of("넷", "둘", "셋", "하나");
Stream<String> stream2 = Stream.of("넷", "둘", "셋", "하나");

Optional<String> result1 = stream1.reduce((s1, s2) -> s1 + "++" + s2);
result1.ifPresent(System.out::println);


String result2 = stream2.reduce("시작", (s1, s2) -> s1 + "++" + s2);
System.out.println(result2);

요소의 검색

  • 메소드
    • findFirst() 메소드 & findAny() 메소드
      • 해당 스트림에서 첫 번째 요소를 참조하는 Optional 객체를 반환한다.
        • 비어 있는 스트림에서는 비어있는 Optional 객체를 반환한다.
        • 병렬 스트림인 경우에는 findAny() 메소드를 사용해야만 정확한 연산 결과를 반환할 수 있다.
  • 사용 예시
IntStream stream1 = IntStream.of(4, 2, 7, 3, 5, 1, 6);
IntStream stream2 = IntStream.of(4, 2, 7, 3, 5, 1, 6);

OptionalInt result1 = stream1.sorted().findFirst();
System.out.println(result1.getAsInt());

OptionalInt result2 = stream2.sorted().findAny();
System.out.println(result2.getAsInt());

요소의 검사

  • 해당 스트림의 요소 중에서 특정 조건을 만족하는 요소가 있는지, 아니면 모두 만족하거나 모두 만족하지 않는지를 확인한다.
  • 관련 메소드 모두 인수로 Predicate 객체를 전달받으며, 요소의 검사 결과는 boolean 값으로 반환한다.
  • 메소드
    • anyMatch()
      • 해당 스트림의 일부 요소가 특정 조건을 만족할 경우에 true를 반환한다.
    • allMatch()
      • 해당 스트림의 모든 요소가 특정 조건을 만족할 경우에 true를 반환한다.
    • noneMatch()
      • 해당 스트림의 모든 요소가 특정 조건을 만족하지 않을 경우에 true를 반환한다.
  • 사용 예시
IntStream stream1 = IntStream.of(30, 90, 70, 10);
IntStream stream2 = IntStream.of(30, 90, 70, 10);

System.out.println(stream1.anyMatch(n -> n > 80));
System.out.println(stream2.allMatch(n -> n > 80));

요소의 통계

  • 메소드
    • count() 메소드
      • 해당 스트림의 요소의 총 개수를 long 타입의 값으로 반환한다.
    • max() 메소드
      • 해당 스트림의 요소 중에서 가장 큰 값을 가지는 요소를 참조하는 Optional 객체를 얻을 수 있다.
    • min() 메소드
      • 해당 스트림의 요소 중에서 가장 작은 값을 가지는 요소를 참조하는 Optional 객체를 얻을 수 있다.
  • 사용 예시
IntStream stream1 = IntStream.of(30, 90, 70, 10);
IntStream stream2 = IntStream.of(30, 90, 70, 10);

System.out.println(stream1.count());
System.out.println(stream2.max().getAsInt());

요소의 연산

  • 각 메소드들은 IntStream이나 DoubleStream과 같은 기본 타입 스트림에 정의되어 있다.
  • 메소드
    • sum() 메소드
      • 해당 스트림의 모든 요소에 대해 합을 구한다.
    • average() 메소드
      • 해당 스트림의 모든 요소에 대해 평균을 구한다.
      • 각 기본 타입으로 래핑 된 Optional 객체를 반환합니다.
  • 사용 예시
IntStream stream1 = IntStream.of(30, 90, 70, 10);
DoubleStream stream2 = DoubleStream.of(30.3, 90.9, 70.7, 10.1);

System.out.println(stream1.sum());
System.out.println(stream2.average().getAsDouble());

요소의 수집

  • Collectors 클래스에는 미리 정의된 다양한 방법이 클래스 메소드로 정의되어 있다.
  • 사용자가 직접 Collector 인터페이스를 구현하여 자신만의 수집 방법을 정의할 수도 있다.
  • 기본 메소드
    • collect() 메소드
      • 인수로 전달되는 Collectors 객체에 구현된 방법대로 스트림의 요소를 수집한다.
  • 수집 용도별 Collectors 메소드
    • 스트림을 배열이나 컬렉션으로 변환
      • toArray()
      • toCollection()
      • toList()
      • toSet()
      • toMap()
    • 요소의 통계와 연산 메소드와 같은 동작을 수행
      • counting()
      • maxBy()
      • minBy()
      • summingInt()
      • averagingInt()
    • 요소의 소모와 같은 동작을 수행
      • reducing()
      • joining()
    • 요소의 그룹화와 분할
      • groupingBy()
      • partitioningBy()
  • 사용 예시
//s:collect() 메소드를 이용하여 해당 스트림을 리스트로 변환
Stream<String> stream = Stream.of("넷", "둘", "하나", "셋");

List<String> list = stream.collect(Collectors.toList());

Iterator<String> iter = list.iterator();
while(iter.hasNext()) {
    System.out.print(iter.next() + " ");
}
//e:collect() 메소드를 이용하여 해당 스트림을 리스트로 변환

//s:partitioningBy() 메소드를 이용하여 해당 스트림의 각 요소별 글자 수에 따라 홀수와 짝수로 나누어 저장
Stream<String> stream = Stream.of("HTML", "CSS", "JAVA", "PHP");

Map<Boolean, List<String>> patition = stream.collect(Collectors.partitioningBy(s -> (s.length() % 2) == 0));

List<String> oddLengthList = patition.get(false);
System.out.println(oddLengthList);

List<String> evenLengthList = patition.get(true);
System.out.println(evenLengthList);
//e:partitioningBy() 메소드를 이용하여 해당 스트림의 각 요소별 글자 수에 따라 홀수와 짝수로 나누어 저장
이 기사는 저작권자의 CC BY 4.0 라이센스를 따릅니다.