본문 바로가기

AI + 대학원/딥러닝 공부4

[용어] 초보자를 위한 머신러닝 용어 _ 특성, 인스턴스(instance) 등 용어를 알아보자! k-nn 알고리즘에 대해 좀 더 알아보던 중 '인스턴스 기반 학습 (instance based learning) 중 하나라는 설명을 읽고 인스턴스의 의미에 대해 찾아보았다. 왜 이제서야 접한 것인지 신기할 정도로 자주 쓰이는 용어였다. 겸사겸사 오늘 몇 가지 용어들과 함께 정리를 해보려한다! 설명을 위해 붓꽃 데이터를 함께 살펴볼 예정이다. 1 데이터 셋 data set : 모든 데이터의 집합 붓꽃 데이터 셋(data set) 안에는 150개의 붓꽃들의 데이터가 들어있다. 2 인스턴스 (instance) ≒ 사례, 샘플 (example, case, sample) ≒ 레코드 (record) ≒ 데이터 포인트 (datapoint) ≒ 행 (row) : 개별 데이터 위의 나열한 용어들은 여러.. 2023. 2. 19.
14주차 EOS 란? (자연어처리) / np.zeros() / iterrows 앞 파트도 꼭 나중에 블로그에 옮겨놓겠다! 14주차 : 데이터 전처리의 이해 데이터 전처리를 위한 여러가지 코드를 배우고 있는데, 결측치 제거 부터 ( )부분 날리는 것, 응답데이터의 그리고 글자수를 통해 어느정도 글자수가 충족될때 유의미한 데이터일지를 고려하여 데이터를 추린다는 것까지 너무 재미있었다. 이걸 왜 14주차에 되서야 배웠나 아쉬울 정도. 15주차가 종강인데.. 프로젝트 과제할 때 이 파트를 미리 알았더라면 정말 좋았겠다 싶다. csv파일 내에서도 고치는 방법이 있다지만, 코드 몇줄로 데이터를 추리고, 다시 그 데이터를 살펴보고 의미를 찾는 재미가 적성에 맞는 모양이다. 이파트가 아마도 종강하고 나서 가장 빨리 복습하러 올 파트 같다. #자연어 처리 참고 도서 : 밑바닥부터 시작하는 딥러닝 .. 2021. 5. 29.
KNN (K-최근접 알고리즘) 시각화 학습 사이트 knn 알고리즘을 이해하는 데에 유용한 사이트와 그 사용법을 소개합니다.vision.stanford.edu/teaching/cs231n-demos/knn/ 접속하면, 아래와 같은 페이지가 나타납니다. 페이지 하단의 메뉴의 버튼들을 클릭하는 것으로 간단하게 조건을 바꿀 수 있습니다. 우선, 1. 첫번째 Metric 에서는 거리를 구하는 방법을 정할 수 있습니다. L1: 맨해튼 거리 공식L2: 유클리드 거리 공식이 두가지를 의미합니다. (보통 L2 설정) 2. Num classes 는 그룹, 분류의 갯수를 정합니다. 3. Num Neighbors (K) 는 바로 최근접 이웃의 갯수를 정합니다.보통 홀수로 정하며, 주변 K개의 데이터의 결과에서 다수결의 원칙에 따라 결정됩니다. 4. Num Points (K).. 2021. 3. 13.
파이썬으로 배우는 알고리즘 트레이딩 wikidocs.net/2825 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 2021. 2. 15.
반응형