der Wille zur Macht,

[수학 기반 메모] 공부 메모

스칼라

  • 숫자하나가 스칼라다.
  • 예) 3

벡터

  • 스칼라를 모아놓은 걸 벡터라 한다.
  • 벡터 1 == 데이터레코드 1
  • 열이 1개 짜리인 행렬.
  • 스칼라도 행이 1인 벡터요, 행렬이다.
  • 예)
    np.array([1,2,3]) #3차원 열벡터
    np.array([[1],[2],[2]]) # 3차원 열벡터. 하나의 벡터를 1차원 배열. 2차원 배열 모두로 나타낼 수 있다. # 벡터의 차원은 담고 있는 스칼라 갯수다. 
    

    행렬

  • 벡터를 모아놓은 것.
  • 열벡터 하나가 행렬의 행 하나가 된다. 내적 연산(벡터 곱)을 수행하기 위해 이렇게 표시한다.
  • 2차원 배열로 표현가능하다.
  • 스칼라는 행. 열이 1인 행렬 / 벡터는 행 N. 열이 1인 행렬과 같다.
    np.array([1,2,3],[4,5,6],[7,8,9]) #3차원 행렬이다. (벡터 수가 3개)
    

    텐서

  • 보통 다차원 배열 (3이상)을 말한다.
  • 행렬을 여러 개 입체로 겹처놓은 개념이다.
  • RGB 이미지 파일은 하나의 행렬이다. (R,G,B채널 행렬을 3개 겹친 것과 같다)

데이터사이언스 분야에서 벡터의 의미

  • 벡터란 1개 데이터레코드와 같다.
  • 벡터 1개는 확률론 관점에서 다변수확률변수 표본 1개와 같다.
  • 두 벡터가 있을 때, 두 벡터 방향이 같다면 두 벡터가 담고 있는 데이터의 속성이 같음을 의미한다.
  • 두 벡터 방향이 같고. 길이가 다른 경우, 두 벡터가 담고 있는 데이터 속성은 같으나, 각 스칼라값의 크기라던지 세부 내용에서 차이가 있음을 말한다. 하지만. 두 벡터 방향이 같다면, 두 벡터가 담고 있는 데이터는 엄연히 같은 데이터다.
  • WORD2VEC이 이 원리 응용한 것이다.
  • 벡터 내적값이 클 수록, 두 벡터 방향이 비슷함을(담고 있는 데이터가 유사함을) 말한다. 이는 다음과 같은 이유 때문이다.

Screen Shot 2021-06-21 at 20 56 57

두 벡터 길이(norm 값) 곱 * 코사인 유사도 == 벡터 a와 b의 내적

위 식에서는 코사인 유사도가 영향을 크게 미쳤다. 두 벡터 방향이 유사하면 코사인 유사도가 1에 가까울 것이다. 결과적으로 벡터 a와 b 내적값도 커진다.

  • 두 벡터가 방향이 다르면 무조건 선형독립이다. (직교, 다른 방향 가리키는 경우 모두 포함)
  • 위 원리때문에 서로 직교하는 벡터는 선형독립이다.
  • 참고로 데이터셋의 각 벡터는 선형독립이어야 한다.
  • 선형조합했을 때 영벡터가 되는 가중치 벡터가 영벡터 말고도 존재할 경우를 선형종속이라 하는데, 선형 종속이면 ‘다중공선성’이 발생해서, 예측모형 성능이 떨어진다. 따라서 각 벡터는 모두 선형독립이어야 한다.

+ [데이터사이언스 스쿨] 복습하며 계속 추가시켜 나가기