김영한의 실전 자바 - 중급 2편| 김영한 - 인프런 강의
현재 평점 5.0점 수강생 8,982명인 강의를 만나보세요. 자바 제네릭과 컬렉션 프레임워크를 실무 중심으로 깊이있게 학습합니다. 자료 구조에 대한 기본기도 함께 학습합니다. 자바 제네릭, 컬렉
www.inflearn.com
이 링크를 통해 구매하시면 제가 수익을 받을 수 있어요. 🤗
빅오(O) 표기법
- 알고리즘의 성능을 분석할 때 사용하는 수학적 표현 방식이다.
- 알고리즘이 처리해야할 데이터의 양이 증가할 때, 그 알고리즘이 얼마나 빠르게 실행되는지 나타낸다.
- 중요한 것은 알고리즘의 정확한 실행 시간을 계산하는 것이 아니라, 데이터 양의 증가에 따른 성능의 변화 추세를 이해하는 것이다.
- O(1) - 상수 시간: 입력 데이터의 크기에 관계없이 알고리즘의 실행 시간이 일정하다.
- e.g. 배열에서 인덱스를 사용하는 경우
- O(n) - 선형 시간: 알고리즘의 실행 시간이 입력 데이터 크기에 비례하여 증가한다.
- e.g. 배열의 검색, 배열의 모든 요소를 순회하는 경우
- O(n^2) - 제곱 시간: 알고리즘의 실행 시간이 입력 데이터 크기의 제곱에 비례하여 증가한다.
- n^2은 `n*n`을 뜻한다.
- e.g. 보통 이중 루프를 사용하는 알고리즘에서 나타남
- O(log n) - 로그 시간: 알고리즘의 실행 시간이 데이터 크기의 로그에 비례하여 증가한다.
- e.g. 이진 탐색
- O(n log n) - 선형 로그 시간
- e.g. 많은 효율적인 정렬 알고리즘들
빅오 표기법은 매우 큰 데이터를 입력한다고 가정하고, 데이터 양 증가에 따른 성능의 변화 추세를 비교하는데 사용한다. 따라서 데이터가 매우 많이 들어오면 추세를 보는데 상수는 크게 의미가 없어진다. 이런 이유로 빅오 표기법에서는 상수를 제거한다.
빅오 표기법은 별도의 이야기가 없으면 보통 최악의 상황을 가정해서 표기한다. 물론 최적, 평균, 최악의 경우로 나누어 표기하는 경우도 있다.
배열의 특징
배열과 인덱스
배열과 같이 여러 데이터(자료)를 구조화해서 다루는 것을 자료 구조라 한다. 자바는 배열 뿐만 아니라 컬렉션 프레임워크라는 이름으로 다양한 자료 구조를 제공한다.
public class ArrayMain1 {
public static void main(String[] args) {
int[] arr = new int[5];
//index 입력: O(1)
System.out.println("==index 입력: O(1)==");
arr[0] = 1;
arr[1] = 2;
arr[2] = 3;
System.out.println(Arrays.toString(arr));
//index 변경: O(1)
System.out.println("==index 변경: O(1)==");
arr[2] = 10;
System.out.println(Arrays.toString(arr));
//index 조회: O(1)
System.out.println("==index 조회: O(1)==");
System.out.println("arr[2] = " + arr[2]);
//검색: O(n)
System.out.println("==배열 검색: O(n)==");
System.out.println(Arrays.toString(arr));
int value = 10;
for (int i = 0; i < arr.length; i++) {
System.out.println("arr[" + i + "]:" + arr[i]);
if (arr[i] == value) {
System.out.println(value + " 찾음");
break;
}
}
}
}
배열의 특징
- 배열에서 자료를 찾을 때 인덱스(index)를 사용하면 매우 빠르게 자료를 찾을 수 있다.
- 인덱스를 통한 입력, 변경, 조회의 경우 한 번의 계산으로 자료의 위치를 찾을 수 있다.
배열 index 사용 예시
공식: `배열의 시작 참조 + (자료의 크기 * 인덱스 위치)`
- `arr[2]`에 위치한 자료를 찾는다고 가정
- 배열은 메모리상에 순서대로 붙어서 존재한다.
- `int`는 `4byte`를 차지한다.
- 따라서 배열의 시작 위치인 `x100`부터 시작해서 자료의 크기(`4byte`)와 인덱스 번호를 곱하면 원하는 메모리 위치를 찾을 수 있다.
- 배열의 시작 참조(`x100`) + (자료의 크기(`4byte`) * 인덱스 위치(`2`)) = `x108`이 나온다. 여기에는 숫자 10이 들어있다.
배열의 경우 인덱스를 사용하면 한 번의 계산으로 매우 효율적으로 자료의 위치를 찾을 수 있다. 인덱스를 통한 입력, 변경, 조회 모두 한 번의 계산으로 필요한 위치를 찾아서 처리할 수 있다. 정리하면 배열에서 인덱스를 사용하는 경우 데이터가 아무리 많아도 한 번의 연산으로 필요한 위치를 찾을 수 있다.
배열의 검색
배열에 들어있는 데이터를 찾은 것을 검색이라 한다. 배열에 들어있는 데이터를 검색할 때는 배열에 들어있는 데이터를 하나하나 비교해야 한다. 이때는 이전과 같이 인덱스를 사용해서 한 번에 찾을 수 없다. 따라서 평균적으로 볼 때 배열의 크기가 클수록 오랜 시간이 걸린다.
배열의 순차 검색은 배열에 들어있는 데이터의 크기만큼 연산이 필요하다. 배열의 크기가 n이면 연산도 n만큼 필요하다.
데이터 추가
추가는 기존 데이터를 유지하면서 새로운 데이터를 입력하는 것을 뜻한다. 참고로 데이터를 중간에 추가하면 기존 데이터가 오른쪽으로 한 칸씩 이동해야 한다.
배열에 데이터를 추가하는 위치에 따라 크게 3가지로 나눌 수 있다.
- 배열의 첫 번째 위치에 추가
- 배열의 중간 위치에 추가
- 배열의 마지막 위치에 추가
배열의 첫번째 위치에 추가
- 배열의 첫번째 위치에 숫자 3을 추가해보자
- 기존 데이터들을 모두 오른쪽으로 한 칸 씩 밀어서 추가할 위치를 확보해야 한다.
- 이때 배열의 마지막 부분부터 오른쪽으로 밀어야 데이터를 유지할 수 있다.
- 왼쪽의 데이터를 오른쪽에 대입하는 과정을 반복한다.
- 첫번째 공간이 확보되었다. 여기에 새로운 값인 숫자 3을 추가하면 된다.
배열의 중간 위치에 추가
- 배열의 중간이나 특정 index 위치에 추가하는 경우를 보자.
- 여기서는 인덱스 2의 공간을 확보해야 한다.
- 지정한 index에 데이터를 추가할 위치를 확보해야 한다 .따라서 index부터 시작해서 데이터들을 오른쪽으로 한 칸씩 밀어야 한다.
- 이 경우 index 왼쪽의 데이터는 이동하지 않아도 된다.
- 인덱스 2의 공간이 확보되었다. 여기에 새로운 값인 숫자 4를 추가하면 된다.
배열의 마지막 위치에 추가
- 배열의 마지막 위치에 데이터를 추가하는 경우 여기가 배열의 마지막이다. 이 경우 기존 데이터를 이동하지 않아도 된다. 따라서 단순하게 값만 입력하면 된다.
배열에 데이터를 추가할 때 위치에 따른 성능 변화
- 배열의 첫번째 위치에 추가
- 배열의 첫번째 위치를 찾는데는 인덱스를 사용하므로 O(1)이 걸린다.
- 모든 데이터를 배열의 크기만큼 한 칸씩 이동해야 한다. 따라서 O(n)만큼의 연산이 걸린다.
- O(1+n) → O(n)이 된다.
- 배열의 중간 위치에 추가
- 배열의 위치를 찾는데는 O(1)이 걸린다.
- index의 오른쪽에 있는 데이터를 모두 한 칸씩 이동해야 한다. 따라서 평균 연산은 O(n/2)이 된다.
- O(1+n/2) → O(n)이 된다.
- 배열의 마지막 위치에 추가
- 이 경우 배열이 이동하지 않고 배열의 길이를 사용하면 마지막 인덱스에 바로 접근할 수 있으므로 한번의 계산으로 위치를 찾을 수 있고, 기존 배열을 이동하지 않으므로 O(1)이 된다.
배열의 한계
배열은 가장 기본적인 자료 구조이고, 특히 인덱스를 사용할 때 최고의 효율이 나온다. 하지만 이런 배열에는 큰 단점이 있다. 바로 배열의 크기를 배열을 생성하는 시점에 미리 정해야 한다는 점이다.
이벤트 참가자를 배열에 보관한다고 가정했을 때,
- 고정 길이 배열을 쓰면 인원 초과 시 추가 참여자가 못 들어오는 문제가 생김
- 그렇다고 처음부터 너무 큰 배열을 만들면 메모리가 낭비됨
즉, 참여자가 실시간으로 계속 늘어나는데 고정 크기 배열은 유연하지 않다는 문제가 잇다.
배열처럼 처음부터 정적으로 길이가 정해져있는 것이 아니라, 동적으로 언제든지 길이를 늘리고 줄일 수 있는 자료 구조가 있다면 편리할 것이다.
직접 구현하는 배열 리스트
배열의 경우 다음 2가지 불편함이 있다.
- 배열의 길이를 동적으로 변경할 수 없다.
- 데이터를 추가하기 불편하다.
- 데이터를 추가할 경우 직접 오른쪽으로 한 칸씩 데이터를 밀어야 한다.
배열의 이런 불편함을 해소하고 동적으로 데이터를 추가할 수 있는 자료 구조를 List(리스트)라 한다.
- 배열: 순서가 있고 중복을 허용하지만 크기가 정적으로 고정된다.
- 리스트: 순서가 있고 중복을 허용하지만 크기가 동적으로 변할 수 있다.
단순 구현
public class MyArrayListV1 {
private static final int DEFAULT_CAPACITY = 5;
private Object[] elementData;
private int size = 0; // 실제 데이터가 입력된 크기
public MyArrayListV1() {
elementData = new Object[DEFAULT_CAPACITY];
}
public MyArrayListV1(int initialCapacity) {
elementData = new Object[initialCapacity];
}
public int size() {
return size;
}
public void add(Object e) {
elementData[size] = e;
size++;
}
public Object get(int index) {
return elementData[index];
}
public Object set(int index, Object element) {
Object oldValue = get(index);
elementData[index] = element;
return oldValue;
}
public int indexOf(Object o) {
for (int i = 0; i < size; i++) {
if (o.equals(elementData[i])) {
return i;
}
}
return -1;
}
// size 이후의 의미 없는 값 출력X
@Override
public String toString() {
return Arrays.toString(Arrays.copyOf(elementData, size)) + " size=" + size + ", capacity=" + elementData.length;
}
}
- `Object[] elementData`: 다양한 타입의 데이터를 보관하기 위해 `Object` 배열 사용
- `DEFAULT_CAPACITY`: 리스트를 생성할 때 사용하는 기본 배열의 크기
- 배열의 크기를 다르게 만들고 싶으면 `MyArrayListV1(int initialCapacity)` 생성자를 사용하면 된다.
- `Arrays.copyOf(elementData, size)`: `size` 크기의 배열을 새로 만든다.
동적 배열
- 데이터를 추가할 때 리스트의 `size`가 배열의 크기인 `capacity`를 넘어가야하는 상황이면 더 큰 배열을 만드는 기능 추가
public void add(Object e) {
if (size == elementData.length) {
grow();
}
elementData[size] = e;
size++;
}
private void grow() {
int oldCapacity = elementData.length;
int newCapacity = oldCapacity * 2;
elementData = Arrays.copyOf(elementData, newCapacity);
}
- `Arrays.copyOf(기존 배열, 새로운 길이)`: 새로운 길이의 배열을 생성하고, 기존 배열의 값을 새로운 배열에 복사한다.
배열의 크기를 초과할 때
- 데이터를 추가하면 `size`가 배열의 크기인 `capacity`를 초과하게 된다.
- 이때 `grow()` 메서드를 호출하는데, 이 메서드는 다음과 같은 역할을 수행한다.
- 2배 큰 배열을 새로 생성한다.
- 새로운 배열에 기존 배열의 값을 복사한다.
- `Arrays.copyOf(기존 배열, 새로운 길이)`를 사용해서 2배 큰 배열을 새로 생성하면서 동시에 새로운 배열에 기존 배열의 값을 복사한다.
- 참조값을 변경한다.
- 이렇게 되면 내부 데이터를 보관하는 `elementData`는 기본보다 2배 큰 `capacity`를 가진 배열을 보유하게 된다.
- 증가된 배열에 데이터를 추가하면 된다. (`size`도 하나 증가)
- 기존 배열(`x100`)은 더는 참조하는 곳이 없으므로 GC의 대상이 된다.
`grow()`
- 데이터가 하나 추가될 때 마다 배열의 크기를 1씩만 증가하게 되면 배열을 복사하는 연산이 너무 자주 발생할 가능성이 높다.
- 배열을 새로 복사해서 만드는 연산은 배열을 새로 만들고 또 기존 데이터를 복사하는 시간이 걸리므로 가능한 줄이는 것이 좋다.
- 2배씩 증가하면 배열을 새로 만들고 복사하는 연산을 줄일 수 있다. 반면에 배열의 크기를 너무 크게 증가하면 사용되지 않고 낭비되는 메모리가 많아지는 단점이 발생할 수 있다.
- 보통 50% 정도 증가하는 방법을 사용한다.
기능 추가
- `add(index, 데이터)`: index 위치에 데이터 추가
- `remove(index)`: index 위치의 데이터 삭제
public void add(int index, Object e) {
if (size == elementData.length) {
grow();
}
shiftRightFrom(index);
elementData[index] = e;
size++;
}
private void grow() {
int oldCapacity = elementData.length;
int newCapacity = oldCapacity * 2;
elementData = Arrays.copyOf(elementData, newCapacity);
}
// 요소의 마지막부터 index까지 오른쪽으로 밀기
private void shiftRightFrom(int index) {
for (int i = size; i > index; i--) {
elementData[i] = elementData[i - 1];
}
}
public Object remove(int index) {
Object oldValue = get(index);
shiftLeftFrom(index);
size--;
elementData[size] = null;
return oldValue;
}
// 요소의 index부터 마지막까지 왼쪽으로 밀기
private void shiftLeftFrom(int index) {
for (int i = index; i < size - 1; i++) {
elementData[i] = elementData[i + 1];
}
}
정리
배열 리스트의 빅오
- 데이터 추가
- 마지막에 추가: O(1)
- 앞, 중간에 추가: O(n)
- 데이터 삭제
- 마지막에 삭제: O(1)
- 앞, 중간에 삭제: O(n)
- 인덱스 조회: O(1)
- 데이터 검색: O(n)
배열 리스트는 마지막에 데이터를 추가하거나 마지막에 있는 데이터를 삭제할 때는 O(1)로 매우 빠르지만, 중간에 데이터를 추가하거나 삭제하는 경우에는 O(n)으로 느리다.
배열 리스트는 보통 데이터를 중간에 추가하고 삭제하는 변경보다는, 데이터를 순서대로 입력하고(데이터를 마지막에 추가하고), 순서대로 출력하는 경우에 가장 효율적이다.
제네릭
제네릭 도입
앞서 만든 `MyArrayList`들은 `Object`를 입력받기 때문에 아무 데이터나 입력할 수 있고, 또 결과로 `Object`를 반환한다. 따라서 필요한 경우 다운 캐스팅을 해야하고, 또 안전성이 떨어지는 단점이 있다.
public class MyArrayListV3BadMain {
public static void main(String[] args) {
MyArrayListV3 numberList = new MyArrayListV3();
// 숫자만 입력 하기를 기대
numberList.add(1);
numberList.add(2);
numberList.add("문자3"); //문자를 입력
System.out.println(numberList);
// Object를 반환하므로 다운 캐스팅 필요
Integer num1 = (Integer) numberList.get(0);
Integer num2 = (Integer) numberList.get(1);
// ClassCastException 발생, 문자를 Integer로 캐스팅
Integer num3 = (Integer) numberList.get(2);
}
}
- `numberList`에는 숫자만 입력하기를 기대했지만, `Object`를 받아서 저장하기 때문에 자바의 모든 타입을 다 저장할 수 있다. 따라서 숫자를 입력하다가 실수로 문자를 입력해도 아무런 문제가 되지 않는다.
- 값을 꺼낼 때 `Object`를 반환하기 때문에, 원래 입력한 타입으로 받으려면 다운 캐스팅을 해야한다. 이때 입력한 데이터 타입을 정확하게 알고 있지 않으면 예외가 발생한다.
제네릭을 도입하면 타입 안정성을 확보하면서 이런 문제를 한번에 해결할 수 있다.
public class MyArrayListV4<E> {
private static final int DEFAULT_CAPACITY = 5;
private Object[] elementData;
private int size = 0;
public MyArrayListV4() {
elementData = new Object[DEFAULT_CAPACITY];
}
public MyArrayListV4(int initialCapacity) {
elementData = new Object[initialCapacity];
}
public int size() {
return size;
}
public void add(E e) {
if (size == elementData.length) {
grow();
}
elementData[size] = e;
size++;
}
public void add(int index, E e) {
if (size == elementData.length) {
grow();
}
shiftRightFrom(index);
elementData[index] = e;
size++;
}
//요소의 마지막부터 index까지 오른쪽으로 밀기
private void shiftRightFrom(int index) {
for (int i = size; i > index; i--) {
elementData[i] = elementData[i - 1];
}
}
@SuppressWarnings("unchecked")
public E get(int index) {
return (E) elementData[index];
}
public E set(int index, E element) {
E oldValue = get(index);
elementData[index] = element;
return oldValue;
}
public E remove(int index) {
E oldValue = get(index);
shiftLeftFrom(index);
size--;
elementData[size] = null;
return oldValue;
}
//요소의 index부터 마지막까지 왼쪽으로 밀기
private void shiftLeftFrom(int index) {
for (int i = index; i < size - 1; i++) {
elementData[i] = elementData[i + 1];
}
}
public int indexOf(E o) {
for (int i = 0; i < size; i++) {
if (o.equals(elementData[i])) {
return i;
}
}
return -1;
}
private void grow() {
int oldCapacity = elementData.length;
int newCapacity = oldCapacity * 2;
elementData = Arrays.copyOf(elementData, newCapacity);
}
@Override
public String toString() {
return Arrays.toString(Arrays.copyOf(elementData, size)) + " size=" + size + ", capacity=" + elementData.length;
}
}
- `MyArrayListV4<E>`로 제네릭 타입을 선언한다. `E`는 `Element`로 요소의 줄임말이다.
Object 배열
`Object[] elementData`를 그대로 사용하는 이유
- 제네릭은 런타임에 이레이저에 의해 타입 정보가 사라진다. 따라서 런타임에 타입 정보가 필요한 생성자에 사용할 수 없다. 따라서 제네릭을 기반으로 배열을 생성하는 다음 코드는 작동하지 않고, 컴파일 오류가 발생한다.
- `new E[DEFAULT_CAPACITY]`
- 대신에 다음과 같이 모든 데이터를 담을 수 있는 `Object`를 그대로 사용해야 한다.
- `new Object[DEFAULT_CAPACITY]`
`Object`는 모든 데이터를 담을 수 있기 때문에 데이터를 담는데는 아무런 문제가 없다. 다만 데이터를 조회할 때 문제가 될 수 있는데, 이때는 조회한 `Object` 타입을 지정한 타입 매개변수로 다운캐스팅 해준다.
@SuppressWarnings("unchecked")
public E get(int index) {
return (E) elementData[index];
}
- `add(E e)`를 통해 `Object elementData[]`에 보관한 모든 데이터는 `E` 타입이라는 것이 확실하다.
정리
생성자에는 제네릭의 타입 매개변수를 사용할 수 없는 한계가 있다. 따라서 배열을 생성할 때 대안으로 Object 배열을 사용해야 한다. 하지만 제네릭이 리스트의 데이터를 입력 받고 반환하는 곳의 타입을 고정해준다. 따라서 고정된 타입으로 Object 배열에 데이터를 보관하고, 또 데이터를 꺼낼 때도 같은 고정된 타입으로 안전하게 다운 캐스팅 할 수 있다.
MyArrayList 단점
- 배열을 사용하므로 배열 뒷 부분에 사용되지 않고, 낭비되는 메모리가 있다.
- 데이터를 추가하거나 삭제할 때 비효율적이다.
- 이 경우 데이터를 한 칸씩 밀어야 한다. 이것은 O(n)으로 성능이 좋지 않다.
- 만약 데이터의 크기가 1,000,000건이라면 최악의 경우 데이터를 추가할 때마다 1,000,000건의 데이터를 밀어야 한다.
배열 리스트는 순서대로 마지막에 데이터를 추가하거나 삭제할 때는 성능이 좋지만, 앞이나 중간에 데이터를 추가하거나 삭제할 때는 성능이 좋지 않다.
'Java > 김영한' 카테고리의 다른 글
[Java/김영한] List (0) | 2025.09.11 |
---|---|
[Java/김영한] LinkedList (0) | 2025.09.11 |
[Java/김영한] 제네릭 (0) | 2025.08.19 |
[Java/김영한] 예외 처리 (0) | 2025.05.04 |
[Java/김영한] 중첩 클래스, 내부 클래스 (1) | 2025.05.01 |