-
์ถ์ฒ์์คํ ์ด๋?, ์ถ์ฒ์์คํ ์ ๋ฌธ๊ณผ ์ข ๋ฅ [RecSys]
2024. 3. 18.
์ฌํด ๋์ ์ฒซ ๋์ ์ด์๋.. ๋ฐ์ดํฐ๋ถ์ & AI ๋์๋ฆฌ KHUDA์์ ๋ง์ ๊ณ ๋ฏผ ๋์ ์ ํํ ์ฌํํธ๋ ์ถ์ฒ ์์คํ !
๋ฐ์ดํฐ๋ถ์๊ณผ AI ์ชฝ์ผ๋ก ์ง๋ก๋ฅผ ์ก๊ธฐ๋ณด๋ค๋ ์๋น์ค์ AI๋ฅผ ํ์ฉํ๊ณ , ์ข ์๋ก์ด ๋ถ์ผ์ ๊ณต๋ถ๋ฅผ ์๋ํด๋ณด๋ ค๊ณ ๋์๋ฆฌ๋ฅผ ์ง์ํ์๋ ๊ฑฐ๋ผ ๋ง์ ๊ณ ๋ฏผ ๋์ CV, NLP, ๋ฐ์ดํฐ์์ง๋์ด๋ง ์ฌ๋ฌ ํธ๋ ์ค ์ถ์ฒ ์์คํ ์ ์ ํํ์๋๋ฐ ์์ฃผ ๋ง์กฑํ๊ณ ์๋ค.
์๋น์ค์ ํ์ฉ๋ ํ ์ ์๊ณ , ๋จธ์ ๋ฌ๋ ์ชฝ์ด ๊ทธ๋ ๊ฒ ๊น์ง ์์์ ํ๋ก์ ํธ์ ํ์ฉํ ์ ์๋ ์ ๋๋ก ๋ฐฐ์ฐ๊ธฐ ๋ฑ ์ข์ ๊ฒ ๊ฐ๋ค.
๊ทธ๋ฆฌ๊ณ ์ผ๋จ.. ์ฌ๋ฐ๋ค! (์์ง๊น์ง๋)
์ฌ์ค์ด ๊ธธ์๋๋ฐ ์ด์จ๋ ์์ผ๋ก ์ถ์ฒ์์คํ ์ ๋ฌธ ์ฑ ์ ํ์ตํ๊ณ ๋ธ๋ก๊ทธ์ ๊พธ์คํ(์ ๋ฐ) ๊ธฐ๋กํ๋๋ก ํ๊ฒ ์๋๋ค.
1์ฅ์ ์ถ์ฒ ์์คํ ์ ๋ํ ์๊ฐ, ์์, ์ญ์ฌ์ ์ข ๋ฅ, ๊ฒ์ ์์คํ ๊ณผ ์ถ์ฒ์์คํ ์ ๋น๊ต๋ก ์ด๋ฃจ์ด์ ธ ์๋ค.
Chapter 1 ์ถ์ฒ ์์คํ
1.1 ์ถ์ฒ ์์คํ
๐ก ์ถ์ฒ ์์คํ ์ ์ฐ๋ฆฌ๊ฐ ๋ค์์ ๋ฌด์์ ํ๋ฉด ์ข์์ง ์์ฌ ๊ฒฐ์ ์ ์ง์ํ๋ ๊ธฐ์
⇒ '์ฌ๋ฌ ํ๋ณด ๊ฐ์ด๋ฐ ๊ฐ์น ์๋ ๊ฒ์ ์ ์ ํด์ ์์ฌ ๊ฒฐ์ ์ ์ง์ํ๋ ์์คํ - ์ ํ๋ธ ๋ง์ถค ๋์์
- ์คํฌํฐํ์ด ์ถ์ฒ ํ๋ ์ด๋ฆฌ์คํธ ๋ฑ
- ๋ทํ๋ฆญ์ค ์์ ์ถ์ฒ
- ์ฌ๋ฌ ํ๋ณด ๊ฐ์ด๋ฐ ๊ฐ์น ์๋ ๊ฒ์ ์ ์ ํ๋ค๋ ๊ฒ์?
- ๊ฐ์น๋ฅผ ์ ์ํ๋ ๋ฐฉ๋ฒ์ ๋ฐ๋ผ ๋ค์ํ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ด ์ ์ ex) ์ธ๊ธฐ์, ์ฌ์ฉ์ ๊ฐ์ธ ๋ฐ์ดํฐ ๊ธฐ๋ฐ.. ๋ฑ
- ๋น์ฆ๋์ค ๋ชฉ์ ์ ๋ง์ถฐ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ ํ๊ฒ ์ ํํด์ ์ฌ์ฉํ๋ค.
- ์์ฌ ๊ฒฐ์ ์ ์ง์ ํ๋ค๋ ๊ฒ์?
- ์ ํํ ์์ดํ ์ ์ฌ์ฉ์๊ฐ ์ค์ ๋ก ์ด๋ ๋๋ ๊ตฌ์ ํ๋๋ก ์ ์ํ๋ ๊ฒ์ด ์ค์ํ๋ค.
- ์์ดํ ์ ์ด๋ป๊ฒ ์ฌ์ฉ์์๊ฒ ๋๋ฌํ๋๋ก ํ๋๊ฐ?
1.2 ์ถ์ฒ ์์คํ ์ ์ญ์ฌ
- 1990๋ ๋ ์ธํฐ๋ท์ ๋ฐ์ ⇒ ์ ๋ก์ค ํ๋ก์ํ ์ฐ๊ตฌ์์ ์ฐ๊ตฌ์ ๊ณจ๋๋ฒ๊ทธ๋ ๋ํ์ ์ธ ์ถ์ฒ ์๊ณ ๋ฆฌ ์ฆ์ ํ๋์ธ ํ์กฐ ํํฐ๋ง์ ์ฒ์์ผ๋ก ์กฐํฉํ ์ถ์ฒ ์์คํ (ํํผ์คํธ๋ฆฌ)์ ์ ์ํ๋ค.
- ์๋ง์กด ๊ฐ์ ์ ์ ์๊ฑฐ๋ ์ฌ์ดํธ์ ๋ฑ์ฅ ⇒ ๋ฐฉ๋ํ ์ํ์์ ์ฌ์ฉ์๊ฐ ์ํ๋ ์ํ์ ์ ๊ณตํ๋ ๊ธฐ์ ๋ก ์ถ์ฒ ์์คํ ์ด ํ์ฉ๋์๋ค.
- 2006๋ ์๋ ๋ทํ๋ฆญ์ค๊ฐ 10์ต ์ ์๋น์ ์๊ธ ์ ๊ฑธ๊ณ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ ๊ฒฝ์ ๋ํ๋ฅผ ๊ฐ์ต
- 2007๋ ์๋ The ACM Conference on Recommender Systems (ReeSys)๋ผ๋ ์ถ ์ฒ ์์คํ ๊ตญ์ ํ์๊ฐ ์ฒ์์ผ๋ก ๊ฐ์ต
- ํธ์ํฐ, ๋ทํ๋ฆญ์ค, ์๋ง์กด, ์ ํ๊ณผ ๊ฐ์ ๊ธฐ์ ์์๋ ์ถ์ฒ ์์คํ ์ ์ ๋ฌธ์ผ๋ก ๊ฐ๋ฐํ๋ ์ถ์ฒ ์ ์คํ ๊ฐ๋ฐ์๋ผ๋ ์ธ๋ ฅ๋ ์ฑ์ฉ
1.3 ์ถ์ฒ ์์คํ ์ ์ข ๋ฅ
- ์ ๋ ฅ : ์ด๋ค ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ ์ถ์ฒํ ๊ฒ์ธ๊ฐ?
- ํ๋ก์ธ์ค : ์ด๋ค ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ ๊ฒ์ธ๊ฐ?
- ์ถ๋ ฅ : ์ด๋ค ์ ์ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ ๊ฒ์ธ๊ฐ?
1.3.1 ์ ๋ ฅ
์ฝํ ์ธ ์ ์ธํฐ๋ ์ , ๋ ์ข ๋ฅ๊ฐ ์๋ค.
์ฝํ ์ธ ์ ๋ณด
- ์ฌ์ฉ์์ ์ฝํ
์ธ ์ ๋ณด๋ ๋์ด, ์ฑ๋ณ, ์ฃผ์ ๋ฑ ํ๋กํ ์ ๋ณด
- ๋ง์ฝ ์ฌ์ฉ์์ ์ ํธ๋๋ฅผ ์ค๋ฌธ์ผ๋ก ์์งํ๋ค๋ฉด ์ด๋ฌํ ์ ๋ณด๋ ํฌํจ
- ์์ดํ ์ ์ฝํ ์ธ ์ ๋ณด๋ ์นดํ ๊ณ ๋ฆฌ, ์ํ ์ค๋ช ๋ฌธ, ๋ฐ๋งค์ผ, ๊ฐ๊ฒฉ, ์ ์์ ๋ฑ
- ์ฝํ ์ธ ์ ๋ณด๋ฅผ ์ด์ฉํ๋ ์ถ์ฒ์ ๋ด์ฉ ๊ธฐ๋ฐ ํํฐ๋ง(content-based filtering)์ด๋ผ๊ณ ํ๋ค.
์ธํฐ๋ ์ ์ ๋ณด
- ์ธํฐ๋์ ์ ๋ณด๋ ์ฌ์ฉ์๊ฐ ์๋น์ค ์์์ ํ๋ํ ์ด๋ ฅ ๋ฐ์ดํฐ๋ฅผ ๋งํ๋ค.
- ์์ดํ ์ ๋ํ ์ธํฐ๋์ ๋ฐ์ดํฐ๋ ์ด๋, ๊ตฌ์ , ๋ถ๋งํฌ,ํ๊ฐ ๋ฑ ⇒ ์ฌ์ฉ์๊ฐ ์๋น์ค ์์์ ํ๋ํ ์๋ก ์ถ์
- ์ธํฐ๋ ์ ์ ๋ณด๋ฅผ ์ด์ฉํ๋ ์ถ์ฒ์ ํ์กฐ ํํฐ๋ง(collaborative filtering)์ด๋ผ๊ณ ํ๋ค.
- ์ฝํ ์ธ ์ ๋ณด << ์ธํฐ๋ ์ ์ ๋ณด
- ์ธํฐ๋ ์ ๋ฐ์ดํฐ๋ ์ค์๊ฐ์ผ๋ก ์ ๋ฐ์ดํธ๋๋ฏ๋ก ์ฌ์ฉ์์ ๊ธฐํธ๋ฅผ ๋ ๋ฐ์ํ๋ ์ธก๋ฉด์ด ์๋ค.
- ๊ทธ๋ฌ๋, ์ ๊ท ์ฌ์ฉ์๋ ์์ดํ ์ ํ๋ ์ด๋ ฅ ๋ฐ์ดํฐ๊ฐ ์์ด ์ถ์ฒ์ด ์ด๋ ค์์ง๋ค. ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ์ฝ๋ ์คํํธ ๋ฌธ์ ๋ผ๊ณ ํ๋ค.
1.3.2 ํ๋ก์ธ์ค(์ถ์ฒ ์ค๊ณ)
์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํด ์ถ์ฒํ๋ ๋ฐฉ๋ฒ์ ๋ค์ 3๊ฐ์ง๊ฐ ์๋ค.
(1) ๊ฐ์ ์ถ์ฒ(๊ฐ์ธํ ์์)
- ์ ๊ท ์์ดํ ์, ๋ฎ์ ๊ฐ๊ฒฉ์, ๋์ ์ธ๊ธฐ์ ๋ฑ ๋ชจ๋ ์ฌ์ฉ์์๊ฒ ๋์ผํ ๋ด์ฉ์ ์ ์ํ๋ค.
- ๋ฏธ๋์ด, ๋ด์ค๊ฐ์ด ์ ์ข ์ ๋ฐ๋ผ์๋ ๊ฐ์ธํ๋ฅผ ์ ์ฉํ๋ ๊ฒ๋ณด๋ค ์ ์ ํ ์๋ ์์
- ์์ดํ ์ด ๋ฐ๋์ง ์๋ ๊ฒฝ์ฐ์๋ ํญ์ ๊ฐ์ ์์ดํ ์ด ์ธ๊ธฐ๋๋ ์ ๊ท ์์ดํ ์์ผ๋ก ๋ํ๋๊ธฐ ๋๋ฌธ์ ๋ณ๋ก ํจ๊ณผ์ ์ด์ง ์์
(2) ์ฐ๊ด ์์ดํ ์ถ์ฒ
- ์ฌ์ฉ์๊ฐ ์ฌ์ดํธ ์์์ ์ฒด๋ฅํ๋ ์๊ฐ์ ๋๋ฆฌ๊ณ ์ํ๋ ์์ดํ ์ ์ฝ๊ฒ ๋ง๋๊ฒ ํ๋ค.
- ์ฐ๊ด ์์ดํ ์ค๊ณ์๋ ๊ฐ ์์ดํ ์ฌ์ด์ ์ ์ฌ๋๋ฅผ ์ฌ์ฉํ๋ค.
- ํ์กฐ ํํฐ๋ง ๋ฐฉ๋ฒ์ด ์กฐ๊ธ ๋ ์ ํฉํ๋ค.
- ๊ฒฝ์ฐ์ ๋ฐ๋ผ ํด๋น ์์ดํ
๊ณผ ๊ด๋ จํด ํ์ํด์ผ ํ ์์ดํ
์ข
๋ฅ๊ฐ ๋ค๋ฅผ ์ ์๋ค.
- ํ๋ฆฐํฐ ์ฌ๊ณ ๋์ ํ๋ฆฐํฐ๋ฅผ ์ถ์ฒํด์ค๊ฑด์ง, ์ฐ๊ด ์๋ชจํ์ ์ถ์ฒํด์ค๊ฑด์ง
- ํด๋ฆฌ ํฌํฐ ๋ฌธ์ : ํน์ ์๊ธฐ์ ๋ง์ ์ฌ๋์ด ํด๋ฆฌ ํฌํฐ ์์ ์ ๋ค๋ฅธ ์์ดํ ๊ณผ ํจ๊ป ๊ตฌ์ ํ๋ฉด, ๋ชจ๋ ์์ดํ ์ ์ถ์ฒ ์์ดํ ์ผ๋ก ํญ์ ํด๋ฆฌ ํฌํฐ๊ฐ ์ถ์ฒ๋ ๊ฒ์ด๋ค. ์ด๋ด ๊ฒฝ์ฐ ์ธ๊ธฐ ์์ดํ ์ ์ํฅ์ ์ ๊ฑฐํด์ผ ํ๋ค.
(3) ๊ฐ์ธํ ์ถ์ฒ
- ์ฌ์ฉ์์ ํ๋กํ์ด๋ ํ๋ ์ด๋ ฅ์ ๊ธฐ๋ฐ์ผ๋ก ๊ฐ ์ฌ์ฉ์์ ๋ง์ถฐ ์ถ์ฒํ๋ ๊ฒ
- ์ฝํ ์ธ ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ ๋ฐฉ๋ฒ, ์ธํฐ๋์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ๋ ๋ฐฉ๋ฒ, ๋ ๊ฐ์ง๋ฅผ ๋ชจ๋ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ด ์๋ค.
- ์ธํฐ๋ ์
์ ํ์ฉํ ๊ฐ์ธํ ์ถ์ฒ ์์คํ
์ ์ฌ์ฉ์์ ํฅ๋ฏธ๋ ๊ธฐํธ๋ฅผ ์ค์๊ฐ์ผ๋ก ๋ฐ์ํ๊ธฐ ๋๋ฌธ์ ํด๋ฆญ์ด๋ ๊ตฌ์
์์ธก ์ฑ๋ฅ์ด ๋๋ค.
- ex) ์ด๋ ์ด๋ ฅ ๋ณด์ฌ์ฃผ๋ ์ถ์ฒ
1.3.3 ์ถ๋ ฅ(์ถ์ฒ ๊ฒฐ๊ณผ ์ ์)
- ๋น์ฆ๋์ค์์ ์ ์ ๋ฐฉ๋ฒ์ ๋งค์ฐ ์ค์ํ๋ฉฐ ์ข์ ์ถ์ฒ ์์ดํ
์ ์ค๊ณํด๋ ์ ์ ๋ฐฉ๋ฒ์ด ๋์๋ฉด ์ฌ์ฉ์์ ํ๋์ ์ด๋์ด๋ผ ์ ์๋ค.
- ์น ์ฌ์ดํธ์์ ์ ์, ๋ฉ์ผ ๋ฐ์ก, ์ฐํธ ๋ฑ… ๋ค์ํ ๋ฐฉ๋ฒ์ด ์๋ค.
1.4 ๊ฒ์ ์์คํ ๊ณผ ์ถ์ฒ ์์คํ
1.4.1 ๊ฒ์ ์์คํ
- ๊ฒ์ ์์คํ ์ ๋ค์ํ ๋ฌธ์ฅ์ด ๋์งํธํ๋จ์ ๋ฐ๋ผ ๊ฐ๋ฐ๋, ํค์๋๋ฅผ ์ ๋ ฅํด์ ์ํ๋ ๋ฌธ์ฅ์ ์ฐพ์๋ด๋ ๊ธฐ์ ์ด๋ค.
- ์น ์ฌ์ดํธ ๊ฒ์์ ์ฌ์ฉ๋๋ค.
- ์ด๊ธฐ์๋ ๊ฒ์ ํค์๋์ ์์ ํ ์ผ์นํ๋ ํค์๋ → ์ ์ฌ์ด ํฌํจ → ํค์๋์์ ์ฌ์ฉ์ ์๋๋ฅผ ํ์ ํด์ ๊ฒ์ ๊ฒฐ๊ณผ๋ฅผ ์ฐ๊ด์์ผ๋ก ์ ๋ ฌํ๋ ๋ฐฉ์์ผ๋ก ๋ณํํด์๋ค.
- ํ์ด์ง ๋ญํฌ ์๊ณ ๋ฆฌ์ฆ
- ๋ฌธ์ฅ์ ๋จ์ด ์ ๋ณด๋ฟ๋ง ์๋๋ผ ์น ์ฌ ์ดํธ์ ํ์ด์ง ์ฌ์ด์ ์กด์ฌํ๋ ๋งํฌ ์ ๋ณด๋ฅผ ์ฌ์ฉํด ์ค์ํ ๋งํฌ๊ฐ ๋ ๋ง์ด ๋ชจ์ธ ์น ์ฌ์ดํธ์ผ ์๋ก ์ค์๋๊ฐ ๋๋ค๊ณ ํ๋จํ๋ ๊ฒ
1.4.2 ๊ฒ์ ์์คํ ๊ณผ ์ถ์ฒ ์์คํ ๋น๊ต
- ๊ฒ์ (Pull ํ์
) : ์ฌ์ฉ์๊ฐ ์ํ๋ ๊ฒ์ ๋ฏธ๋ฆฌ ํ์
ํ๊ณ ์์ผ๋ฉฐ ๊ฒ์ ํค์๋(์ฟผ๋ฆฌ)๋ฅผ ์
๋ ฅํด ๋ฅ๋์ ์ผ๋ก ์๊ณ ์ ํ๋ ์ ๋ณด๋ ์ํ์ ๋ง์ ํ๋ณด ๊ฐ์ด๋ฐ ๋์ด๋ธ๋ค.
- ์ต๊ทผ์๋ ๊ฒ์ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ์ธํํ๊ธฐ๋ ํ๋ค. (์ฌ์ฉ์์ ๋ฐ๋ผ ๊ฐ์ ํค์๋ ๊ฒ์ํด๋ ๊ฒฐ๊ณผ๊ฐ ๋ฌ๋ผ์ง)
- ์ถ์ฒ (Pushํ์ ) : ์ฌ์ฉ์๊ฐ ์ํ๋ ๊ฒ์ ๋ฏธ๋ฆฌ ๋ช ํํ๊ฒ ํ์ ํ๊ณ ์์ง ์๋๋ผ๋ ์ฌ์ฉ์๋ ๊ฒ์ํค์๋ ๋ฑ์ ์ ๋ ฅํ์ง ์์ผ๋ฉฐ ์ฌ์ฉ์๊ฐ ์ข์ํ๋ ์ํ์ ์์คํ ์ด ์ ์ํ๋ค.
- ์์
, ํจ์
๊ฐ์ ์ธ์ด๋ก ์ ํํํ ์ ์๋ ๊ฒฝ์ฐ ) ํ
์คํธ ํ์์ ๊ฒ์์์๋ ์ฌ์ฉ์๊ฐ ์ข์ํ๋ ์์ดํ
์ ์ฐพ๊ธฐ๊ฐ ์ด๋ ต๋ค.
- ์ฌ์ฉ์์ ๋น์ทํ ์ทจํฅ์ ๊ฐ์ง ์ฌ๋์ ์์ดํ ๋ค์ ์ถ์ฒํ๋ค!
- ๋ณดํต ๊ฒ์๊ณผ ์ถ์ฒ์ ๋ ๋ค ์ฌ์ฉํ๋ค. ์ด๋ป๊ฒ ๋น์ค์ ์กฐํฉํ ๊ฒ์ธ์ง๋ ๋น์ฆ๋์ค ๋ชจ๋ธ์ด๋ UX ์ค๊ณ์ ๋ฐ๋ผ์ ๋ค๋ฅด๋ค.
'๐ญ Study > : Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
๋๊ธ