hashing - 마지막

728x90

좋은 해쉬 함수란?

- 현실에서는 키들이 랜덤하지 않음

- 만약 키들의 통계적 분포에 대해 알고 있다면 이를 이용해서 해쉬 함수를 고안하는 것이 가능하겠지만 현실적으로 어려움

- 키들이 어떤 특정한 (가시적인)패턴을 가지더라도 해쉬함수값이 불규칙적이 되도록 하는게 바람직

* 해쉬함수값이 키의 특정 부분에 의해서만 결정되지 않아야 함

Division 기법

h(k) = k mod m
예 : m = 20 and k = 91 => h(k) = 11
장점 : 한번의 mod연산으로 계산. 따라서 빠름
단점 : 어떤 m값에 대해서는 해쉬 함수값이 키값의 특정 부분에 의해서 결정되는 경우가 있음. 가령 m = 2^p이면 키의 하위 p비트가 해쉬 함수값이 됨.

Multiplication 기법

Hash code in Java

- java의 object 클래스는 hashcode() 메서드를 가짐. 따라서 모든 클래스는 hashcode() 메서드를 상속받는다. 이 메서드는 하나의 32비트 정수를 반환한다.

- 만약 x.equals(y)이면 x.hashcode() == y.hashcode()이다. 하지만 역은 성립 x

- object 클래스의 hashcode() 메서드는 객체의 메모리 주소를 반환하는 것으로 알려져 있음

- 필요에 따라 각 클래스마다 이 메서드를 override하여 사용한다.

ex) integer 클래스는 정수값을 hashcode로 사용

string안에 있는 hashcode메서드

HashMap in Java

- 내부적으로 하나의 배열을 해쉬 테이블로 사용

- chaining으로 충돌 해결

- load factor를 지정할 수 있음(0~1사이의 실수)

- 저장된 키의 개수가 load factor를 초과하면 더 큰 배열을 할당하고 저장된 키들을 재배치

HashSet in Java

- add, contains,remove를 사용한다

* 위의 그림들은 "영리한 프로그래밍을 위한 알고리즘" 강좌에서 가져왔습니다.

728x90