본문 바로가기
프로그래밍/프로젝트

머신러닝 전에 지식 카테고리 분류하기

by 숙님 2025. 1. 7.
728x90

1. 오늘 학습시킬 지식의 카테고리를 정하고 

2. 총 5개 카테고리(대~소)중에서 대분류를 정했다(1/5 끝냄)

 

[카테고리 하면서 문제점]

- 카테고리가 각각 연관이 1도 없는 것이 아니라서 제품명으로 분류하면  애매한 제품명이 있어서 문제가 있음

- 양이 어마어마하게 많기 때문에 하나하나 수기로 하는 건 어렵고 코딩으로 했다 

 

[카테고리 해결법] 

- 제품명을 기준으로 분류를 하되, 제거해야 할 단어와 포함해야 할 단어로 좀 더 세심히 나눠서 코딩으로 분류하도록 하였다 

- 제품명이 있는 자료의 열을 기준으로 a라는 단어가 들어가면 포함하되, b라는 제외 단어 들어가면 넣지 않음 

- 각 카테고리별로 기준을 세우고 도입했다 

예를 들어, 충전용품 중에 맥세이프되는 제품은 카테고리를 한 번에 나누기 애매하다 

그래서 충전기로 잡고, 맥세이프에서 '충전'들어가는 건 제외하는 식으로 했다 

제품명이 '맥세이프 충전기'라면 '충전용품'으로 나오게 하는 상황(not 맥세이프) 

 

[1차 완료 상황: 카테고리 총 160개 나온 상황]

- 하면서 더 증가/삭제될 수 있다 

카카오톡 챗봇 관리자 페이지

댓글