도수 분포표(Frequency Distribution Table) - 특정 구간에 속하는 자료의 개수를 나타내는 표이다.
히스토그램(Histogram) - 도수 분포표를 그래프화 한 것이다. 데이터가 많을 때 가치가 높아진다.
데이터 비닝(Data binning) - 값의 범위에 따라 지정된 통에 데이터를 넣는 것이다.
해시 함수 - 입력값은 임의의 길이를 가질 수 있고, 출력값은 정해진 길이를 가진다. 입력값이 같으면 출력값도 같다. 자료 검색 속도 향상용, 보안, 파일 위변조 검사에 주로 사용된다.
해시 충돌 - 서로 다른 입력값을 해시 함수에 돌렸는데 같은 출력값이 나온 것이다.
근사값 - 근사계산을 통해 얻은 수치로 실제 값에 가까운 값이다. 정확도는 조금 떨어진다.
최적선(Best Fit Line) - 추세선(Trend Line)이라고도 한다. 최대한 많은 점에 가깝게 그리는 직선이다. 이 선에는 실제 데이터가 있을 수도 없을 수도 있다. 오차율이 가장 적어야 한다.
곡선 맞춤(Curve Fitting) - 최적선도 곡선 맞춤의 일종이다. 곡선이 한번 꺾일 때마다 차수가 증가한다.
'프로그래밍 > 이산 수학' 카테고리의 다른 글
점근 표기법 (1) | 2023.01.29 |
---|---|
정규 분포 (0) | 2023.01.27 |
확률 (0) | 2023.01.25 |
경우의 수, 순열, 조합 (0) | 2023.01.21 |
벡터, 튜플, 행렬 (0) | 2023.01.17 |