Subject 01 : Should Generative A.I. be regulated by law? Thesis statement Generative A.I. must be regulated by law because it is prone to technological self-destruction and collapses human social ...
[알고리즘/지도학습] 회귀문제 - 선형회귀, 의사결정회귀나무, 의사결정회귀나무 앙상블(그래디언트 부스트)
‘프로그래머가 알아야 할 알고리즘 40’(임란 아마드 지음, 길벗 출판사) 을 통해 선형회귀, 의사결정회귀나무, 의사결정회귀나무 앙상블을 공부하고 나서, 그 내용을 내 언어로 바꾸어 기록한다. 회귀문제 분류문제는 타겟값이 카테고리 확률변수였다. $\Rightarrow$ 회귀문제는 타겟값이 연속확률변수다. 아래는 회귀문제 해결하는 데 사용할 ...
[알고리즘/지도학습] 로지스틱 회귀, 서포트벡터 머신, 나이브 베이즈 알고리듬, 분류모형 별 성능 비교
‘프로그래머가 알아야 할 알고리즘 40’(임란 아마드 지음, 길벗 출판사) 을 통해 로지스틱 회귀, 서포트벡터 머신, 나이브 베이즈 알고리듬을 공부하고 나서, 그 내용을 내 언어로 바꾸어 기록한다. 로지스틱 회귀(Logistic Regression) 분류 알고리즘 이진분류에 로지스틱 함수(시그모이드 함수) 사용하는, 이진분류 알고리즘이다. 목...
[알고리즘/지도학습] 앙상블 알고리즘-부스팅(에이다 부스트, 그래디언트 부스트)
2. 부스팅(Boosting) 정의 모델 1개로 시작해서, 모델 집합에 약 분류기 계속 추가해 나가는 앙상블 알고리즘. 한번에 모델 1개씩 만 추가한다. 약 분류기 모두 추가한 최종 모형은, 개별 모형의 가중선형조합 형태다. $c_{m} = \alpha_{1}k_{1} + … + a_{m}k_{m}$ 부스팅은 이진분류를 위해 사용하며...
[알고리즘/지도학습] 앙상블 알고리즘-취합(다수결 투표, 배깅, 랜덤포레스트)
모델 앙상블(ensemble) 정의 여러 모델 조합해서, 데이터 분류하는 알고리즘 효과 개별 모형보다 과적합 잘 억제할 수 있다. 개별 모형 성능 떨어져도, 여러 개 묶어놓으면 성능 더 향상된다. 종류 취합(aggregation) 다수결 투표(hard, soft voting) 배깅(bagging; boostrap aggr...
[알고리즘/지도학습] 의사결정나무(Decision Tree) 알고리듬
‘프로그래머가 알아야 할 알고리즘 40’(임란 아마드 지음, 길벗 출판사) 을 통해 의사결정나무 알고리듬을 공부. 복습하고나서, 그 내용을 내 언어로 바꾸어 기록한다. 의사결정나무(Decision Tree) 정의 각 데이터포인트(레코드) 가장 잘 분류할 수 있는 특성변수와 기준점 찾고, 그 기준점에 따라 데이터포인트 분류하기. $\Right...
[알고리즘] 너비우선탐색, 깊이우선탐색, K-평균 클러스터링, 계층적 클러스터링, FP-Growth 알고리즘(연관규칙 마이닝)
‘프로그래머가 알아야 할 알고리즘 40’(임란 아마드 지음, 길벗 출판사) 을 통해 너비우선탐색, 깊이우선탐색, 비지도학습-클러스터링 알고리즘, 연관규칙마이닝-빈출 패턴 성장알고리즘을 공부. 복습하고나서, 그 내용을 내 언어로 바꾸어 기록한다. 그래프 알고리듬 - 2 그래프 순회 정의 그래프 탐색(검색) 방법. 원칙 모든 정점과 간선 단...
[알고리즘] 페이지랭크(PageRank) 알고리듬, 선형계획법(LP 문제)
‘프로그래머가 알아야 할 알고리즘 40’(임란 아마드 지음, 길벗 출판사) 을 통해 페이지랭크 알고리듬, 선형계획법 알고리듬을 공부. 복습하고나서, 그 내용을 내 언어로 바꾸어 기록한다. 페이지랭크(PageRank) 알고리듬 정의 다른 웹페이지로 부터 받은 링크 수에 따라, 웹페이지 별 중요도 매기는 알고리듬. 근간 아이디어 “다른 웹페이...
[알고리즘] 그래프 기본 개념, 그래프 분석 이론 기초
‘프로그래머가 알아야 할 알고리즘 40’(임란 아마드 지음, 길벗 출판사) 을 통해 그래프 기본 개념, 그래프 분석 이론 기초를 공부. 복습하고나서, 그 내용을 내 언어로 바꾸어 기록한다. 그래프 알고리듬 - 1 그래프 알고리듬은 주로 효율적인 검색 알고리듬으로 쓰인다. 그래프 정의 정점(vertex)과 간선(edge) 집합. 간선은...
[알고리즘/문제해결전략] 분할 정복 전략, 동적 계획법, 탐욕 알고리듬
‘프로그래머가 알아야 할 알고리즘 40’(임란 아마드 지음, 길벗 출판사) 을 통해 3가지 문제 해결 전략을 공부. 복습하고나서, 그 내용을 내 언어로 바꾸어 기록한다. 알고리듬 설계에 적용할, 문제해결 전략 분할 정복 전략(divide and conquer) 동적 계획법 탐욕 알고리듬 1. 분할 정복 전략 정의 문제를 작은...