<aside>
💡 분석 문제 정의 : 어떤 문제를 머신러닝 방법론을 이용해서 해결할 것이냐! 머신러닝 방법론을 기준으로 문제를 정의하는 것.
</aside>
![Screen Shot 2022-01-19 at 2.24.24 PM.png](https://s3-us-west-2.amazonaws.com/secure.notion-static.com/702ef6e9-405e-48cf-95b7-01d30221aa45/Screen_Shot_2022-01-19_at_2.24.24_PM.png)
이슈 파악 및 문제 도출
- 문제 이해를 위해 예시를 하나 정의합니다.
- 우리는 식물학자입니다.
- Iris(붓꽃)의 생태계에 대해 연구를 해보려고 합니다.
- 조사를 한 결과, Iris는 3개의 종(*setosa, versicolor, virginica)*이 있다는 것을 확인했습니다.
- 우리는
Iris DB
를 구축하려고 합니다.
- 이 DB에는 후대에 Iris를 연구하는 연구자들을 위해 Iris data를 입력하면 어떤 종(species)인지 알려주는 프로그램을 작성하려고 합니다.
![Source : Iris setosa](https://s3-us-west-2.amazonaws.com/secure.notion-static.com/c4a58f25-aeaf-4121-a9b7-7c57334b60b4/Iris_setosa.jpg)
Source : Iris setosa
![Source : Iris versicolor](https://s3-us-west-2.amazonaws.com/secure.notion-static.com/4b34994e-0586-4c68-90d6-acfc59209e09/Iris_versicolor_3.jpg)
Source : Iris versicolor
![Source : Iris virginica](https://s3-us-west-2.amazonaws.com/secure.notion-static.com/dcdd0384-e2f7-4fca-9a2d-7a257be807a0/Iris_virginica.jpg)
Source : Iris virginica
분석 데이터 정의
- 우리는 이 3개의 종에 대한 특징을 기록(저장)하고 싶습니다.
- 어떤 정보들이 필요할까요?
머신러닝 문제 정의
- 정의한 특징들을 기반으로 Iris 데이터를 종별로 나누려고 합니다.
- 어떤 머신러닝 작업(task)들이 있을까요?
- 이 중에서 어떤 task가 우리가 하려는 일에 해당할까요?
- 둘 중에 어떤 방법이 더 좋을까요?
베이스라인(baseline) 선정 → 기존 사례 조사
- 우리가 하려는 일을 과거에 한 사례가 있다면, 참고합시다.