STUDY ๐Ÿ“–/ํŒจ์ŠคํŠธ ์บ ํผ์Šค ์ฑŒ๋ฆฐ์ง€ - 2022.04~

ํŒจ์ŠคํŠธ์บ ํผ์Šค ์บ์‹œ๋ฐฑ ์ฑŒ๋ฆฐ์ง€ 03์ผ์ฐจ - ์ถ”์ฒœ์‹œ์Šคํ…œ[Part2]

ํž˜ํžˆํž˜ 2022. 4. 20. 22:54
๋ฐ˜์‘ํ˜•

๐Ÿ‘‰๐Ÿป ์ฐธ์—ฌ ์ธ๊ฐ• : ๋”ฅ๋Ÿฌ๋‹์„ ํ™œ์šฉํ•œ ์ถ”์ฒœ์‹œ์Šคํ…œ ๊ตฌํ˜„ ์˜ฌ์ธ์› ํŒจํ‚ค์ง€ Online.
๋ฐ์ผ๋ฆฌ ๋ฏธ์…˜ ์ง„ํ–‰ ๊ธฐ๊ฐ„(66์ผ)์ผ ๋™์•ˆ ์ง„ํ–‰๋œ๋‹ค. ์ œ๋ฐœ ์ด๋ฒˆ์—๋Š” ๊ผญ ์„ฑ๊ณตํ•˜๊ธฐ๋ฅผ ๐Ÿ™๐Ÿป Plz

 

์˜ค๋Š˜ ๋“ค์€ ์ธ๊ฐ•

[Part2] 03-05. ๋‚˜์ด๋ธŒ ๋ฒ ์ด์ฆˆ ์ถ”์ฒœ ์•Œ๊ณ ๋ฆฌ์ฆ˜

 

์˜ค๋Š˜ ๋ฐฐ์šด ๋‚ด์šฉ

[Part2] 03-05. ๋‚˜์ด๋ธŒ ๋ฒ ์ด์ฆˆ ์ถ”์ฒœ ์•Œ๊ณ ๋ฆฌ์ฆ˜

 

 

: ์กฐ๊ฑด๋ถ€ ํ™•๋ฅ 

- ์‚ฌ๊ฑด B๊ฐ€ ๋ฐœ์ƒํ–ˆ์„ ๋•Œ, ์‚ฌ๊ฑด A๊ฐ€ ๋ฐœ์ƒํ•  ํ™•๋ฅ 

 

 

https://angeloyeo.github.io/2020/01/09/Bayes_rule.html

: ๋ฒ ์ด์ฆˆ ์ •๋ฆฌ : ์‚ฌ๊ฑด B๊ฐ€ ์‚ฌ๊ฑด A๋กœ๋ถ€ํ„ฐ ๋ฐœ์ƒํ–ˆ๋‹ค๋Š ๊ฐ€์ •ํ•˜์— ์‚ฌ๊ฑด A์˜ ํ™•๋ฅ  ์—…๋ฐ์ดํŠธ

- P(H) : ์‚ฌ์ „ ํ™•๋ฅ (prior), P(H|E) : ์‚ฌํ›„ํ™•๋ฅ (posterior)

- ์‚ฌ์ „ํ™•๋ฅ : ํ˜„์žฌ ์ •๋ณด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์ •ํ•œ ํ™•๋ฅ (๋™์ „ ์•ž๋ฉด ๋‚˜์˜ฌํ™•๋ฅ  =1/2)

- ์‚ฌํ›„ํ™•๋ฅ  : ์‚ฌ๊ฑด E๊ฐ€ ์‚ฌ๊ฑด H๋กœ๋ถ€ํ„ฐ ๋ฐœ์ƒํ–ˆ๋‹ค๋Š” ๊ฐ€์ •ํ•˜์— ์‚ฌ๊ฑด H์˜ ํ™•๋ฅ  ์—…๋ฐ์ดํŠธ

 

 

: ๋‚˜์ด๋ธŒ๋ฒ ์ด์ฆˆ ๋ถ„๋ฅ˜๊ธฐ(Naive Bayes Classifier)

- ๋ฒ ์ด์ฆˆ ์ •๋ฆฌ์— ์˜ํ•œ ํ†ต๊ณ„๊ธฐ๋ฐ˜ ๋ถ„๋ฅ˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜, ์ง€๋„ํ•™์Šต

<ํŠน์ง•>

- ์•„์ดํ…œ์˜ ํŠน์ง•(feature, attribute) ๋ผ๋ฆฌ ์„œ๋กœ ๋…๋ฆฝ

- ์˜ํ™” ์žฅ๋ฅด์™€ ์˜ํ™” ๊ฐ๋…์ด ์„œ๋กœ ์—ฐ๊ด€์ด ์—†๋Š” ํŠน์ง•์ด์–ด์•ผ ํ•จ.

- ๋ฐ์ดํ„ฐ ์…‹์ด ์ปค๋„ ๋ชจ๋ธ ์˜ˆ์ธก์— ๊ด€๊ณ„ ์—†์Œ.
- ์—ฐ์†ํ˜• ๋ณด๋‹ค ๋ฒ”์ฃผํ˜• ๋ฐ์ดํ„ฐ์— ๋” ์ž˜ ๋งž์Œ
- ๋ฐ์ดํ„ฐ์˜ ์ฐจ์›์ด ๋†’์•„์งˆ์ˆ˜๋ก ๋ชจ๋“  class์— ๋Œ€ํ•ด ํ™•๋ฅ ์ด 0์œผ๋กœ ์ˆ˜๋ ด ๊ฐ€๋Šฅ
=> Laplace Smoothing ํ™œ์šฉ : ํ™•๋ฅ ๊ฐ’์ด 0์ด ๋˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ์—†๋„๋ก ์กฐ์ ˆ ํ•ด์คŒ (+1 ๋“ฑ)

 

 

:๋‚˜์ด๋ธŒ ๋ฒ ์ด์ฆˆ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ํ™œ์šฉ 

์ถœ์ฒ˜ : ๋‚˜๋ฌด์œ„ํ‚ค

๋‚˜์ด๋ธŒ ๋ฒ ์ด์ง€์•ˆ ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ์ŠคํŒธ๋ฉ”์ผ ํ•„ํ„ฐ, ํ…์ŠคํŠธ ๋ถ„์„๊ธฐ, ์ถ”์ฒœ ์‹œ์Šคํ…œ, ์˜ํ•™์  ์งˆ๋ณ‘ ์ง„๋‹จ ๋“ฑ์˜ ๊ด‘๋ฒ”์œ„ํ•œ ๋ถ„์•ผ์—์„œ ์˜ˆ์ธก๊ณผ ์ถ”๋ก ์„ ์œ„ํ•œ ๋ถ„๋ฅ˜๊ธฐ๋กœ ๋งŽ์ด ํ™œ์šฉ๋˜๊ณ  ์žˆ๋‹ค.

๋‚˜์ด๋ธŒ ๋ฒ ์ด์ฆˆ ๋ถ„๋ฅ˜๊ธฐ(Naive Bayes Classifier)๋Š” ํŠน์„ฑ๋“ค ์‚ฌ์ด์˜ ๋…๋ฆฝ์  ๊ฐ€์ •์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ…์ŠคํŠธ ๋ฌธ์„œ๋ฅผ ์—ฌ๋Ÿฌ ๋ฒ”์ฃผ๋กœ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋Œ€ํ‘œ์ ์ธ ๋ถ„๋ฅ˜๊ธฐ๋กœ ์‚ฌ์šฉ๋˜๊ณ  ์žˆ๋‹ค. ๋‚˜์ด๋ธŒ ๋ฒ ์ด์ฆˆ ๋ถ„๋ฅ˜๊ธฐ๋Š” ์ง€๋„ ํ•™์Šต(supervised learning) ํ™˜๊ฒฝ์—์„œ ๋งค์šฐ ํšจ์œจ์ ์œผ๋กœ ํ›ˆ๋ จ๋  ์ˆ˜ ์žˆ๊ณ , ๋ถ„๋ฅ˜์— ํ•„์š”ํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ถ”์ •ํ•˜๊ธฐ ์œ„ํ•œ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์˜ ์–‘์ด ๋งค์šฐ ์ ๋‹ค๋Š” ์žฅ์ ์ด ์žˆ๋‹ค. ํŠนํžˆ, ์ด๋ฆ„์—์„œ ๋ณผ ์ˆ˜ ์žˆ๋“ฏ์ด, ๋งค์šฐ ์ˆœ์ง„ํ•œ(naive) ๊ฐ€์ •์„ ํ•˜๊ณ  ์žˆ์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ์ŠคํŒธ ํ•„ํ„ฐ์™€ ๊ฐ™์€ ๋ณต์žกํ•œ ๋ฌธ์ œ์˜ ํ•ด๊ฒฐ์—์„œ๋„ ์•„์ฃผ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ธ๋‹ค.

 

 

๐Ÿ“Œ ์ฐธ๊ณ ํ•˜๋ฉด ์ข‹์€ 

๋‚˜์ด๋ธŒ๋ฒ ์ด์ฆˆ ๋ถ„๋ฅ˜๋ชจ๋ธ๊ณผ ํ˜‘์—…ํ•„ํ„ฐ๋ง ๊ธฐ๋ฐ˜ ์ง€๋Šฅํ˜• ํ•™์ˆ ๋…ผ๋ฌธ ์ถ”์ฒœ์‹œ์Šคํ…œ ์—ฐ๊ตฌ

https://www.koreascience.or.kr/article/JAKO201006159731627.pdf

 

1) ๋ฒ ์ด์ฆˆ์˜ ์ •๋ฆฌ(Bayes' theorem)๋ฅผ ์ด์šฉํ•œ ๋ถ„๋ฅ˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜  ๊ตฌํ˜„ 

https://wikidocs.net/22892

 




Knn, ๋‚˜์ด๋ธŒ ๋ฒ ์ด์ฆˆ ์ •๋ฆฌ์˜ ํŠน์ง•์„ ๋‹ค์‹œ ํ•œ๋ฒˆ ๋ฆฌ๋งˆ์ธ๋“œ ํ•ด๋ณด์ž!



๋‚ด์ผ์„ ์œ„ํ•œ ๋‹ค์ง

๋‚ด์ผโ‹ฏ ๋ฏธ๋ผํด ๋ชจ๋‹ ๋„์ „ ใ…œ_ใ…œ โ‹ฏ + ์ถ”์ฒœ ์‹œ์Šคํ…œ ํ•ด๋‹น ์ฑ…์„ ์ฝ์–ด๋ณด์ž! ๋‹น๋ถ„๊ฐ„ ๊ฐ•์˜ ํ•˜๋‚˜์”ฉ๋งŒ ๋“ค์œผ๋ฉด์„œโ‹ฏ
๋‚˜์ด๋ธŒ ๋ฒ ์ด์ฆˆ์— ๋Œ€ํ•œ ์ˆ˜์—…๋‚ด์šฉ์€ ๊ฐ„๋žตํ•˜๊ฒŒ ์ž˜ ์„ค๋ช…ํ•ด์ฃผ์…จ๋‹ค. ๊ทธ์— ๋Œ€ํ•ด ์ถ”๊ฐ€์ ์œผ๋กœ ๊ณต๋ถ€๋ฅผ ํ•˜๋ ค๋ฉด, ์ฐธ๊ณ ํ•˜๋ฉด ์ข‹์€ ์‚ฌ์ดํŠธ๋ฅผ ํ™œ์šฉํ•˜๊ฑฐ๋‚˜, ๊ตฌ๊ธ€๋งํ•œ ๊ฒฝ์šฐ์— ๋‚˜์ด๋ธŒ ๋ฒ ์ด์ง€ ๋‰ด์Šค ๊ธฐ์‚ฌ ๋ถ„๋ฅ˜ ๋“ฑ ๋‹ค์–‘ํ•œ ์˜ˆ์ œ ๋ฐ ๊ตฌํ˜„ ๋“ฑ์ด ๋งŽ์ด ์žˆ์œผ๋ฏ€๋กœ ๊ทธ๋Ÿฐ ๋ถ€๋ถ„๋“ค์„ ์ถ”๊ฐ€๋กœ ํ™•์ธํ•˜๋ฉด ์ข‹์„ ๊ฒƒ ๊ฐ™๋‹ค!





https://bit.ly/3L3avNW

๋ณธ ํฌ์ŠคํŒ…์€ ํŒจ์ŠคํŠธ์บ ํผ์Šค ํ™˜๊ธ‰ ์ฑŒ๋ฆฐ์ง€ ์ฐธ์—ฌ๋ฅผ ์œ„ํ•ด ์ž‘์„ฑ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.