개발목표: "주어진 데이터에 대해, 원하는 결과를 내는 가상의 함수"를 흉내내는 함수를 만드는 것
개발과정:
문제정의 -> 데이터 수집 -> 데이터 전처리 및 분석 -> 알고리즘 적용 -> 평가 -> 배포
문제정의
- 풀려는 문제를 단계별로 나누고 simplify해야 한다.
- 신경망이라는 함수에 넣기 위한 "입력값 x"와 "결과값 y"를 명확히 정의
데이터 수집
- 문제 정의에 따라 정해진 x와 y를 수집
- 풀고자 하는 문제의 영역에 따라 수집 방법이 다르다
*NLP, CV : 크롤링
*RecSys : 실제 수집한 데이터
- 필요에 따라 레이블링(라벨링) 작업을 수행
*자동적으로 레이블이 y로 주어질 수도 있으나
*하지만 대부분의 경우, 레이블이 따로 필요하다
*비지도학습를 기대하지 말자...
댓글