-
์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ์ข ๋ฅ(๋ด์ฉ ๊ธฐ๋ฐ ํํฐ๋ง vs ํ์กฐ ํํฐ๋ง, ๋ชจ๋ธ ๊ธฐ๋ฐ vs ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ) [RecSys]
2024. 4. 7.
Ch04 ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ ๊ฐ์
'์ฌ๋ฌ ํ๋ณด ๊ฐ์ด๋ฐ ๊ฐ์น ์๋ ๊ฒ์ ์ ์ 'ํ๋ ๊ฒ์ ๊ตฌํํ๋ ์ถ์ฒ ์์คํ ์๊ณ ๋ฆฌ์ฆ์ ๋ํด ์ค๋ช
1์ฅ์์ ์ค๋ช ํ ์ถ์ฒ ์์คํ ์ ๊ตฌ์ ์์ ์ค ‘ํ๋ก์ธ์ค(์ถ์ฒ ์ค๊ณ)’์ ํด๋น
4.1 ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ ๋ถ๋ฅ
๋ด์ฉ ๊ธฐ๋ฐ ํํฐ๋ง(content-based-filtering)๊ณผ ํ์กฐํํฐ๋ง(collaborative filtering)
- ๋ด์ฉ ๊ธฐ๋ฐ ํํฐ๋ง: ์ ์ ๋ชฉ์ด๋ ์ ์, ์ฅ๋ฅด ๋ฑ๊ณผ ๊ฐ์ด ์์ดํ ์ ๋ด์ฉ์ ๋ํ๋ด๋ ์ ๋ณด๋ฅผ ์ฌ์ฉ. ์ฌ์ฉ์๊ฐ ์ ํธํ๋ ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ด์ฉ์ด ๋น์ทํ ์์ดํ ์ ๊ณ์ฐํจ์ผ๋ก์จ ์ถ์ฒ์ ์ํํ๋ ์๊ณ ๋ฆฌ์ฆ
- ํ์กฐ ํํฐ๋ง: ๋ค๋ฅธ ์ฌ์ฉ์์ ๊ณผ๊ฑฐ ํ๋ ๋ฑ์ ํตํด ์ป์ด์ง ๊ธฐํธ ๊ฒฝํฅ์ ํ์ฉํ์ฌ ์ถ์ฒํ๋ ์๊ณ ๋ฆฌ์ฆ
๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ(memory-based method)๊ณผ ๋ชจ๋ธ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ(model-based method)
- ํ์กฐ ํํฐ๋ง์ ์์ธก์ ์คํํ๋ ๋ฐฉ๋ฒ์ ๋ฐ๋ผ ๋ ๊ฐ์ง๋ก ๋๋๋ค.
- ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ: ์ถ์ฒ ์์คํ ์ด ์ฌ์ฉ๋ ๋๊น์ง ์์คํ ์ ์ฌ์ฉ์์ ๋ฐ์ดํฐ๋ฅผ ์ถ์ ํ๊ธฐ๋ง ํ๊ณ ์์ธก์ ์ํ ๊ณ์ฐ์ ์ํํ์ง ์๋๋ค. ์์ธก์ ์ํํ๋ ์์ ์ ์ถ์ ๋ ๋ฐ์ดํฐ ์ค ํ์ํ ๋ฐ์ดํฐ๋ฅผ ๋ชจ๋ ์ฌ์ฉํด ์์ธก ๊ณ์ฐ์ ์ํ
- ๋ชจ๋ธ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ: ์ถ์ฒ ์์คํ ์ ์ฌ์ฉํ๊ธฐ ์ ์ ๋ฏธ๋ฆฌ ์์คํ ๋ด ์ถ์ ๋ ๋ฐ์ดํฐ์ ๊ท์น์ฑ์ ํ์ตํ ๋ชจ๋ธ์ ๋ง๋ค์ด๋๊ณ ์์ธก ์ ๋ฏธ๋ฆฌ ๋ง๋ค์ด์ง ๋ชจ๋ธ๊ณผ ์ถ์ฒ์ ์ ๊ณต ํ๋ ๋์ ์ฌ์ฉ์์ ๋ฐ์ดํฐ๋ง ์ฌ์ฉํด ๊ณ์ฐ์ ์ํ
4.2 ๋ด์ฉ ๊ธฐ๋ฐ ํํฐ๋ง
4.2.1 ๊ฐ์
- ์ฌ์ฉ์ ํ๋กํ๊ณผ ์์ดํ ํน์ง๊ณผ์ ์ผ์น๋, ์ฆ ์ ์ฌ๋๋ฅผ ๊ณ์ฐํด์ ์ฌ์ฉ์์๊ฒ ์์ดํ ์ ์ถ์ฒ
- ์ด ๊ฒฝ์ฐ์๋ ์์ดํ A๋ฅผ ์ถ์ฒ.
4.2.2 ์์ดํ ํน์ง ํ๋
- ์์ดํ ์ ์ฑ์ง์ ๋ฐ๋ผ ๋ค์ํ๋ค.
- ex) ์์ฑ ๋ฐ์ดํฐ๋ผ๋ฉด ์๊ณก์, ์๊ณก์ฐ๋ ๋ฑ ํน์ ์์ฑ ๋ถ์์ ํตํด ์๋์ด, ์์, ์๋ ๋ฑ์ ์ ๋ณด๋ฅผ ํ์
4.2.3 ์ฌ์ฉ์ ํ๋กํ ํ๋
- ๊ฐ์ ์ง์ ํ: ์ฌ์ฉ์์ ๊ณผ๊ฑฐ ํ๋ ์ด๋ ฅ์ ๊ธฐ๋ฐํด ์ฌ์ฉ์ ํ๋กํ์ ์์ฑ
- ์ง์ ์ง์ ํ: ์ฌ์ฉ์์๊ฒ ์์ ์ด ์ ํธํ๋ ์์ดํ
์ ํน์ง์ ๋ช
์์ ์ผ๋ก ์ง์ ํ๋๋ก ํ๋ ๋ฐฉ๋ฒ
- ์๋น์ค ๊ฐ์ ์งํ ์จ๋ณด๋ฉ์ด๋ ๋ง์ดํ์ด์ง ๋ฑ์์ ์ํ
4.3 ํ์กฐํํฐ๋ง
- ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ
- ์ฌ์ฉ์-์ฌ์ฉ์ ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ(user-user memory-based method) : ์ถ์ฒ๋ฐ์ ์ฌ์ฉ์์ ์ ํธ๋๊ฐ ๋น์ทํ ์ฌ์ฉ์์ ์ฐฉ์ํ์ฌ ์ถ์ฒ์ ์ํ
- ์์ดํ -์์ดํ ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ(item-item memory-based method) : ์ถ์ฒ๋ฐ์ ์ฌ์ฉ์๊ฐ ์ ํธํ๋ ์์ดํ ๊ณผ ๋น์ทํ ์์ดํ ์ ์ฐฉ์ํ์ฌ ์ถ์ฒ
- ์ด ์ฑ ์์๋ ์ฌ์ฉ์-์ฌ์ฉ์ ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ ์ด์ ์ ๋ง์ถฐ ์ค๋ช ํ๋ค.
4.3.1 ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ ์๊ณ ๋ฆฌ์ฆ ๊ฐ์
- ์ถ์ฒ๋ฐ์ ์ฌ์ฉ์์ ์์ดํ ์ ํธ๋๊ฐ ๋น์ทํ ๋ค๋ฅธ ์ฌ์ฉ์๋ฅผ ์ฐพ๊ณ , ๊ทธ ์ฌ์ฉ์๊ฐ ์ ํธํ๋ ์์ดํ ์ ์ถ์ฒํ๋ค.
- ๊ทธ๋ ๋ค๋ฉด ์ถ์ฒ๋ฐ์ ์ฌ์ฉ์์ ์ ํธ๋๊ฐ ๋น์ทํ ์ฌ์ฉ์๋ฅผ ์ด๋ป๊ฒ ์ฐพ์๋ด๋?
- ์ฌ์ฉ์์ ๊ตฌ๋งค ์ด๋ ฅ์์ ์์ดํ ์ ํธ๋๋ฅผ ์ถ์ธกํด ์ ํธ๋ ๊ฒฝํฅ์ด ๋น์ทํ ์ฌ์ฉ์๋ฅผ ์ฐพ์๋ธ๋ค.
- ์์ดํ ์ ๊ตฌ์ฒด์ ์ธ ์์ฑ ์ ๋ณด๋ฅผ ์ฌ์ฉํ์ง ์๋ ๊ฒ์ด ํ์กฐ ํํฐ๋ง์ ํฐ ํน์ง์ด๋ค.
4.3.2 ๊ธฐํธ ๋ฐ์ดํฐ ํ๋๊ณผ ํ๊ฐ๊ฐ ํ๋ ฌ
- ๊ธฐํธ ๋ฐ์ดํฐ(preference data): ์ฌ์ฉ์๋ก๋ถํฐ ์ป์ ์์ดํ ์ ๋ํ ์ ํธ๋ ์ ๋ณด
- ๊ธฐํธ ๋ฐ์ดํฐ๋ฅผ ํ๋ํ๋ ๋ฐฉ๋ฒ
- ๋ช
์์ ํผ๋๋ฐฑ(explicit feedback): ์ฌ์ฉ์์๊ฒ ์์ดํ
์ ์ข๊ณ ์ซ์์ด๋ ๊ด์ฌ ์ฌ๋ถ์ ๊ดํด ์ง๋ฌธํ๊ณ ๋ต๋ณ์ ๋ฐ์ ๊ธฐํธ ๋ฐ์ดํฐ๋ฅผ ํ๋ํ๋ ๋ฐฉ๋ฒ
- ex ) ์์ดํ ๋ฆฌ๋ทฐ, ์ ํธํ๋ ์์ดํ ์ ๋ฌผ์ด์ ์ฌ์ฉ์๊ฐ ์ง์ ๋๋ต
- ์๋ฌต์ ํผ๋๋ฐฑ(implicit feedback) : ์ฌ์ฉ์๊ฐ ์์ดํ ์ ๊ตฌ์ ํ๊ฑฐ๋ ์ฐ์ผ๋ก ๋ฑ๋กํ๊ณ ์ด๋ํ๋ ๋ฑ ์๋น์ค ๋ด ์ฌ์ฉ์์ ํ๋ ์ด๋ ฅ์ผ๋ก๋ถํฐ ์์ดํ ์ ๋ํ ๊ด์ฌ์ ์ถ์ ํด ๊ธฐํธ ๋ฐ์ดํฐ๋ก ๊ฐ์ฃผํ๋ ๋ฐฉ๋ฒ
- ๋ช
์์ ํผ๋๋ฐฑ(explicit feedback): ์ฌ์ฉ์์๊ฒ ์์ดํ
์ ์ข๊ณ ์ซ์์ด๋ ๊ด์ฌ ์ฌ๋ถ์ ๊ดํด ์ง๋ฌธํ๊ณ ๋ต๋ณ์ ๋ฐ์ ๊ธฐํธ ๋ฐ์ดํฐ๋ฅผ ํ๋ํ๋ ๋ฐฉ๋ฒ
- ํ๊ฐ๊ฐ(rating): ์์งํ ๊ธฐํธ ๋ฐ์ดํฐ ๋ฑ์ ๊ธฐ๋ฐํด ์ฌ์ฉ์๊ฐ ํด๋น ์์ดํ ์ ์ ํธ๋ ์ ๋๋ฅผ ์ ๋์ ์ผ๋ก ๋ํ๋ธ ๊ฒ
- ํ๊ฐ๊ฐ ํ๋ ฌ(rating matrix): ๊ทธ ํ๊ฐ๊ฐ์ ์ฑ๋ถ์ผ๋ก ํ๋ ์ฌ์ฉ์X ์์ดํ ์ ํ๋ ฌ
- ํ๊ฐ๊ฐ ํ๋ ฌ์ด ์ฃผ์ด์ง ์ํ์์ ๋์ ์ฌ์ฉ์์ ํน์ ์์ดํ ์ ๋ํ ๋ฏธ์ง์ ํ๊ฐ๊ฐ์ ์์ธกํด ๊ณ์ฐ
4.3.3 ๋ชจ๋ธ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ ์๊ณ ๋ฆฌ์ฆ ๊ฐ์
- ์ด๋ฏธ ์๊ณ ์๋ ๋ฐ์ดํฐ์ ๊ท์น์ฑ์ ํ์ตํ ๋ชจ๋ธ์ ๋ฏธ๋ฆฌ ๋ง๋ค์ด๋ ์ผ๋ก์จ ๋ชจ๋ฅด๋ ์์ดํ ์ ํ๊ฐ๊ฐ์ ์์ธกํ์ฌ ์ถ์ฒํ๋ ๋ฐฉ๋ฒ
- ๋ชจ๋ธ ์ข
๋ฅ
- ํด๋ฌ์คํฐ๋ง ์ฌ์ฉ
- ํ๊ท, ๋ถ๋ฅ ๋ฌธ์ ๋ก ํ๊ฐ๊ฐ์ ์ง์ ์์ธก
- ํ ํฝ ๋ชจ๋ธ์ ์ฌ์ฉ - LDA(Latent Dirichlet Allocation) ๋ฑ์ ๋ฐฉ๋ฒ์ ์ ์ฉํด์ ํ๊ฐ๊ฐ ํ๋ ฌ์ ์ฐจ์ ์์ถ
- ํ๋ ฌ ๋ถํด๋ฅผ ์ฌ์ฉ - ํ๊ฐ๊ฐ ํ๋ ฌ์ ๊ทธ ๊ณฑ์ด ์๋์ ํ๋ ฌ์ ์ต๋ํ ์ฌํํ๋ ํํ๋ก ํไฝ ์ฌ์ฉ์ ํ๋ ฌ๊ณผ ์์ดํ ํ๋ ฌ๋ก ๋ถํด → ๋ถํด๋ ํ๋ ฌ์์ ์ป์ ์ฌ์ฉ์ ๋ฒกํฐ์ ์์ดํ ๋ฒกํฐ์ ์ ์ฌ๋ ๊ณ์ฐ์ ํตํด ์์์ ์์ดํ ์ ๋ํ ์์ธก ํ๊ฐ๊ฐ์ ๊ณ์ฐ
4.3.4 ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๊ณผ ๋ชจ๋ธ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ ํ์กฐ ํํฐ๋ง ๋น๊ต
'์ถ์ฒ์ ๊ฑธ๋ฆฌ๋ ์๊ฐ’ ๊ด์
- ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ: ์ถ์ฒ ์ ๋งค๋ฒ ๋ชจ๋ ๋ฐ์ดํฐ์์ ๋น์ทํ ์ฌ์ฉ์๋ ์์ดํ ์ ์ฐพ์ ๋ค ์์ธกํ๋ฏ๋ก ์๊ฐ ์์
- ๋ชจ๋ธ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ: ๋ฐ์ดํฐ์ ๊ท์น์ฑ์ ๋ฐํ์ผ๋ก ๋ชจ๋ธ์ ๋ฏธ๋ฆฌ ๋ง๋ค์ด๋๊ณ ๋ง๋ค์ด์ง ๋ชจ๋ธ๋ง ์ฌ์ฉํ์ฌ ์์ธกํ๋ฏ๋ก ๊ณง๋ฐ๋ก ์ถ์ฒ์ ์ํํ ์ ์์ด ์๊ฐ ์์ ์ ์
'์ด์ฉ์ฑ' ๊ด์
- ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ: ์ฌ์ฉ์๋ ์์ดํ ๋ฐ์ดํฐ๊ฐ ๋ณ๊ฒฝ๋ผ๋ ์ถ์ฒํ ๋๋ง๋ค ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ๋ฏ๋ก ํญ์ ์ต์ ๋ฐ์ดํฐ๋ฅผ ๋ฐ์ํด ์ถ์ฒํ ์ ์๋ค.
- ๋ชจ๋ธ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ: ์ฌ์ฉ์๋ ์์ดํ ๋ฐ์ดํฐ๊ฐ ๋ณ๊ฒฝ๋๊ณ ๊ทธ ๋ณ๊ฒฝ์ ๋ฐ์ํด ์ถ์ฒํ๋ ค๋ฉด ๋ชจ๋ธ์ ์๋ก ๋ง๋ค์ด์ผ ํ๋ฏ๋ก ๋ชจ๋ธ ์ ๋ฐ์ดํธ ์์ ์ด๋ ์ฌํ์ต์ ๊ฑธ๋ฆฌ๋ ๊ณ์ฐ ๋น์ฉ ๋ฑ์ ๊ณ ๋ คํด์ผ ํ๊ธฐ ๋๋ฌธ์ ์ด์ฉ์ด ๋น๊ต์ ์ด๋ ต๋ค.
4.4 ๋ด์ฉ๊ธฐ๋ฐ ํํฐ๋ง vs ํ์กฐํํฐ๋ง
4.4.1 ๋ค์์ฑ ํฅ์
- ๋ค์์ฑ: ์ถ์ฒ ๊ฒฐ๊ณผ์ ํฌํจ๋ ์์ดํ ์ด ์๋ก ๋น์ทํ์ง ์์ ๊ฒ
- ๋ด์ฉ๊ธฐ๋ฐ ํํฐ๋ง << ํ์กฐ ํํฐ๋ง
- ๋ด์ฉ๊ธฐ๋ฐ ํํฐ๋ง์ ํด๋น ์ฌ์ฉ์๊ฐ ๋ชจ๋ฅด๋ ์๊ฐ๋ ์ฅ๋ฅด ์ ๋ณด๋ฅผ ๋ฐ์ํ ์ ์์ง๋ง, ํ์กฐ ํํฐ๋ง์์๋ ์๋น์ค ๋ด ๋ค๋ฅธ ์ฌ์ฉ์๊ฐ ์๋ ๋ค๋ฅธ ์ฑ ์ ์ถ์ฒํ ์ ์๋ค.
4.4.2 ๋๋ฉ์ธ ์ง์ ์ทจ๊ธ ๋น์ฉ
- ๋ด์ฉ๊ธฐ๋ฐ ํํฐ๋ง << ํ์กฐ ํํฐ๋ง
- ํ์กฐ ํํฐ๋ง์ ์์ดํ ์์ฒด์ ๊ดํ ์ ๋ณด๋ ์ฌ์ฉ์ ์์ฒด์ ์์ฑ ์ ๋ณด ๋ฑ์ ๊ธฐ๋ณธ์ ์ผ๋ก ํ์ํ์ง ์๋ค.
- ํํธ ๋ด์ฉ ๊ธฐ๋ฐ ํํฐ๋ง์ ์์ดํ ํน์ง์ด๋ ์ฌ์ฉ์ ํ๋กํ ์์ฑ ์ ๋๋ฉ์ธ ์ง์์ ์ ์ ํ๊ฒ ์ฌ์ฉํด์ผ ํ๋ค. ๋๋ฉ์ธ ์ง์์ ๊ด๋ฆฌํ๊ธฐ ์ํด ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ฅผ ์ ์ง ๋ฐ ๊ด๋ฆฌํ๋ ๋ฐ ๋น์ฉ์ด ๋ง์ด ๋ ๋ค.
4.4.3 ์ฝ๋ ์คํํธ ๋ฌธ์ ์ ๋ํ ๋์
- ์ฝ๋ ์คํํธ : ์๋น์ค์ ์ฌ์ฉ์๋ ์์ดํ ์ ๊ดํ ์ ๋ณด๊ฐ ์ ์ ๊ฒฝ์ฐ ํนํ ์ ๊ท ์ฌ์ฉ์๋ ์ ๊ท ์์ดํ ์ ๊ดํด ์ ์ ํ ๊ฒ์ ์ถ์ฒํ๊ธฐ ์ด๋ ค์ด ๋ฌธ์
- ๋ด์ฉ๊ธฐ๋ฐ ํํฐ๋ง >> ํ์กฐ ํํฐ๋ง
- ํ์กฐ ํํฐ๋ง์ ์ฌ์ฉ์์ ๊ณผ๊ฑฐ ๊ธฐํธ ๋ฐ์ดํฐ๊ฐ ์์ผ๋ฉด ์ถ์ฒํ ์ ์์ผ๋ ๋ด์ฉ ๊ธฐ๋ฐ ํํฐ๋ง์์๋ ์์ดํ ํน์ง์ด๋ ์ฌ์ฉ์ ํ๋กํ์ ์ป์ ์ ์๋ค๋ฉด ์ถ์ฒ์ด ๊ฐ๋ฅํ๋ค.
4.4.4 ์ฌ์ฉ์ ์๊ฐ ์ ์ ์๋น์ค์์์ ์ถ์ฒ
- ๋ด์ฉ๊ธฐ๋ฐ ํํฐ๋ง >> ํ์กฐ ํํฐ๋ง
- ํ์กฐ ํํฐ๋ง์์๋ ์์ฉ์ ์๊ฐ ์ ์ ๊ฒฝ์ฐ ๋น์ทํ ์ฌ์ฉ์์ ํ๋ ์ด๋ ฅ์ผ๋ก๋ถํฐ ์ถ์ฒ ํ๊ธฐ๊ฐ ์ด๋ ต๋ค.
- ๋ด์ฉ ๊ธฐ๋ฐ ํํฐ๋ง์์๋ ์์ดํ ์ ํน์ง์ด๋ ์ฌ์ฉ์ ํ๋กํ๋ง ํ๋ํ๋ฉด ์ถ์ฒํ ์ ์์ผ๋ฏ๋ก ์ฌ์ฉ์ ์๊ฐ ์ผ๋ง๋ ๋๋์ง๋ ์ถ์ฒ์ ํฐ ์ํฅ์ ์ฃผ์ง ์๋๋ค.
4.4.5 ์ปค๋ฒ๋ฆฌ์ง ํฅ์
- ์ปค๋ฒ๋ฆฌ์ง: ์๋น์ค์ ์๋ ๋ชจ๋ ์์ดํ
์ค ์ถ์ฒ ์์คํ
์ผ๋ก ์ฌ์ฉ์์๊ฒ ์ถ์ฒํ ์ ์๋ ์์ดํ
์ ๋น์จ
- ์ปค๋ฒ๋ฆฌ์ง๊ฐ ๋ฎ๋ค=์ผ๋ถ ์์ดํ ์ ์น์ฐ์ณ ์ถ์ฒ๋๋ ๊ฒ
- ๋ด์ฉ๊ธฐ๋ฐ ํํฐ๋ง >> ํ์กฐ ํํฐ๋ง
- ํ์กฐ ํํฐ๋ง์์๋ ๋น์ทํ ์ฌ์ฉ์๊ฐ ํ๊ฐํ์ง ์์ ์์ดํ ์ ์ถ์ฒํ ์ ์๋ค. ๋ฐ๋ผ์ ์ถ์ฒํ ์ ์๋ ์์ดํ ์ด ์ ํ๋๋ค.
4.4.6 ์์ดํ ํน์ง ํ์ฉ
- ๋ด์ฉ๊ธฐ๋ฐ ํํฐ๋ง >> ํ์กฐ ํํฐ๋ง
- ๋๋ฉ์ธ ์ง์์ ์ฌ์ฉํ์ง ์๊ณ ์ฌ์ฉ์์ ๊ณผ๊ฑฐ ๊ธฐํธ ๋ฐ์ดํฐ์๋ง ๊ธฐ์ดํด ์ถ์ฒํ๋ ํ์กฐ ํํฐ๋ง์์๋ ์์ดํ ์์ฑ ์ ๋ณด๋ฅผ ๊ณ ๋ คํ ์ ์๋ค.
- ๋ด์ฉ ๊ธฐ๋ฐ ํํฐ๋ง์์๋ ์์ดํ ์ ๋ค์ํ ํน์ง์ ๋ช ์์ ์ผ๋ก ๊ณ ๋ คํด ์ถ์ฒํ๋ฏ๋ก ์๋ง ๋ค๋ฅธ ๊ฐ์ ์ท์ ๋์์ ์ถ์ฒํ์ง ์์ผ๋ฉฐ ์ฌ์ฉ์๊ฐ ์ ํธํ๋ ์์์ ์๊ฒ ๋๋ฉด ๋ง์ถค์ผ๋ก ์ถ์ฒํ ์ ์๋ค.
4.4.7 ์์ธก ์ ํ๋
- ๊ท๋ชจ๊ฐ ์๋ ์๋น์ค์์ ์ผ๋ฐ์ ์ธ ์ ํธ๋ฅผ ๊ฐ์ง ์ฌ์ฉ์: ๋ด์ฉ๊ธฐ๋ฐ ํํฐ๋ง << ํ์กฐ ํํฐ๋ง
- ํ์กฐ ํํฐ๋ง ์ชฝ์ด ๋ณต์กํ ์ฌ์ฉ์์ ๊ธฐํธ๋ฅผ ๊ณ ๋ คํ ์ ์๋ค๊ณ ์๊ฐ๋๊ธฐ ๋๋ฌธ
- ์ฌ์ฉ์๊ฐ ์๋น์ค๋ฅผ ๊ณ์ ์ฌ์ฉํ ์๋ก ํ์ฉํ ์ ์๋ ๋ฐ์ดํฐ๊ฐ ๋์ด๋ ์์ธก ์ ํ๋ ํฅ์
์ ๋ฆฌ
๋ค์์ฑ ํฅ์๊ณผ ๋๋ฉ์ธ ์ง์์ ๋ค๋ฃจ๋ ๋น์ฉ ๋ฐ ์ผ๋ฐ์ ์ธ ์์ธก ์ ํ๋ ๊ด์ ์์๋ ํ์กฐ ํํฐ๋ง ์ชฝ์ด ์ ์ ํฉ
์ฝ๋ ์คํํธ ๋ฌธ์ ์ ๋ํ ๋์๊ณผ ์ฌ์ฉ ์๊ฐ ์ ์ ์๋น์ค์์์ ์ถ์ฒ ๋ฐ ์ปค๋ฒ๋ฆฌ์ง ํฅ์๊ณผ ์์ดํ ํน์ง ํ์ฉ ๊ด์ ์์๋ ๋ด์ฉ ๊ธฐ๋ฐ ํํฐ๋ง ์ชฝ์ด ๋ฐ๋์ง ์๊ณ ๋ฆฌ์ฆ์ ์ ํํ ๋๋ 2๊ฐ์ง๋ฅผ ์กฐํฉํด์ ์ฅ์ ๋ง ์ทจํ ์๋ ์๋ค.
4.5 ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ ์ ํ
- ์๋น์ค ๋ด์ ๋ฐ์ดํฐ ์์ด ์ ์ ์ ๊ท ์๋น์ค, ์ ๊ท ์ฌ์ฉ์) ๋ด์ฉ ๊ธฐ๋ฐ
- ์ฌ์ฉ์ ๋ฐ ์์ดํ ๋ณ ๋ฐ์ดํฐ ์ถ์ ) ํ์กฐ ํํฐ๋ง
- ๊ฐ์ ์ถ์ฒ) ๋ด์ฉ ๊ธฐ๋ฐ ํํฐ๋ง
- ์ฐ๊ด ์์ดํ ์ถ์ฒ) ์์ดํ -์์ดํ ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ํ์กฐ ํํฐ๋ง
- ์๋ฆผ ์๋น์ค, ๊ฐ์ธํ) ์ฌ์ฉ์-์ฌ์ฉ์ ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ํ์กฐ ํํฐ๋ง, ๊ฐ์ ์ง์ ํ ๋ด์ฉ ๊ธฐ๋ฐ ํํฐ๋ง
4.6 ๊ธฐํธ ๋ฐ์ดํฐ์ ํน์ง
4.6.1 ๋ช ์์ ํ๋๊ณผ ์๋ฌต์ ํ๋ ๋น๊ต
4.6.2 ๊ธฐํธ ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃฐ ๋์ ์ฃผ์์
- ๋ฐ์ดํฐ์ ํฌ๋ฐํจ: ์๋น์ค์ ์ฑ์ง์ ๊ณ ๋ คํด ์ ์ ํ ๊ธฐํธ ๋ฐ์ดํฐ ํ๋ ๋ฐฉ๋ฒ์ ์ค๊ณํด์ผ ํจ.
- ํ๊ฐ๊ฐ์ ๋ณ๋์ด๋ ํธํฅ: ์ฌ์ฉ์์ ๊ธฐํธ์ฑ์ ์๊ฐ์ด ์ง๋๋ฉด์ ๋ฌ๋ผ์ง๋ค. ํธํฅ์๋ ์ธ๊ธฐ ํธํฅ, ์ฌ์ฉ์๊ฐ ์ข์ํ๋ ๊ฒ์๋ง ํ๊ฐ๋ฅผ ๋จ๊ธฐ๋ ํธํฅ๋ฑ์ด ์์ ์ ์๋ค.
4.7 ์ ๋ฆฌ
- ์ฒ ์์คํ ์ผ๋ก ๋ฌ์ฑํ๊ณ ์ ํ๋ ๋ชฉ์ ์ด๋ ์๋น ์ค ์์ฑ, ์ํฉ ๋ฑ ๋ค์ํ ์์๋ฅผ ๊ฐ๋ฏธํด ๊ฐ์ค์ ์ธ์ฐ๊ณ ๊ณผ๊ฑฐ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํด ์คํ๋ผ์ธ์์ ๊ฒ ์ฆ ์คํ์ ํ๊ฑฐ๋ ์ค์ ๋ก ์จ๋ผ์ธ์์ ์ผ๋ถ ์ฌ์ฉ์์๊ฒ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉํด ์คํํจ์ผ๋ก์จ ๊ฒ์ฆ ์ ๋ฐ๋ณตํ ๋ค ์ ์ ํ ๊ฒ์ ์ ํํฉ๋๋ค.
'๐ญ Study > : Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
๋๊ธ