2025๋…„ 8์›” 24์ผ ์ผ์š”์ผ

AI๊ฐ€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ํƒ๊ตฌํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก 

์„ธ์ƒ์—์„œ AI๊ฐ€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์— ๋Œ€ํ•œ ์—ฐ๊ตฌ๋Š” ๋‹จ์ˆœํžˆ ์ด๋ก ์  ํ˜ธ๊ธฐ์‹ฌ์—์„œ ๋ฒ—์–ด๋‚˜, ์‹ค์งˆ์ ์ด๊ณ  ๋™์ ์ธ ๋ฌธ์ œ ํ•ด๊ฒฐ๋กœ ๋‚˜์•„๊ฐ€๊ณ  ์žˆ๋‹ค. AI์˜ ๋Šฅ๋ ฅ์€ ์ ์ฐจ ์ •๊ตํ•ด์ง€๊ณ  ์žˆ์œผ๋ฉฐ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ํ†ตํ•œ ํ•™์Šต ๋ฐฉ๋ฒ•๊ณผ ๊ทธ ๊ฒฐ๊ณผ๊ฐ€ ํ˜์‹ ์ ์ธ ๋ณ€ํ™”๋ฅผ ๊ฐ€์ ธ์˜ค๊ณ  ์žˆ๋‹ค. ์ด๋Ÿฌํ•œ ์—ฐ๊ตฌ์˜ ์ผํ™˜์œผ๋กœ, ์ •์ฑ… ํ•™์Šต ๋ฐ ์ƒํ˜ธ์ž‘์šฉ์ด ์—†๋Š” ๋ฐ์ดํ„ฐ์—์„œ์˜ ๊ต์œก ๋ฐฉ์‹์ด ์ฃผ๋ชฉ๋ฐ›๊ณ  ์žˆ๋‹ค.

๊ธฐ์ˆ ์  ๋ฐฐ๊ฒฝ

์ •์ฑ… ํ•™์Šต์˜ ๊ธฐ์ดˆ๋Š” ์ƒํ˜ธ์ž‘์šฉ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜์ง€ ์•Š๊ณ ๋„ ํŠน์ • ์ƒํ™ฉ์—์„œ ์–ด๋–ค ํ–‰๋™์„ ์ทจํ•  ๊ฒƒ์ธ์ง€์— ๋Œ€ํ•œ ํ•™์Šต์ด๋‹ค. ์ตœ๊ทผ ์—ฐ๊ตฌ ์ค‘ ํ•˜๋‚˜์ธ "POLICY LEARNING FROM TUTORIAL BOOKS(PLFB)"์—์„œ๋Š” ํ…์ŠคํŠธ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์ •์ฑ… ๋„คํŠธ์›Œํฌ๋ฅผ ํ•™์Šตํ•˜๋Š” ๋ฐฉ์‹์„ ์ œ์•ˆํ•˜์˜€๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ๋„ ์‹ค์šฉ์ ์œผ๋กœ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋Š” ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค€๋‹ค. PLFB์—์„œ ์–ธ๊ธ‰๋œ ์„ธ ๊ฐ€์ง€ ๋‹จ๊ณ„, ์ฆ‰ ์ดํ•ด, ๋ณต๊ธฐ, ์„ฑ์ฐฐ์˜ ์ˆœ์ฐจ์  ์ ‘๊ทผ์€ AI๊ฐ€ ์‹ค์ƒํ™œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐ ๊ธฐ์—ฌํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ์ดˆ๊ฐ€ ๋œ๋‹ค.

AI์˜ ์ •์ฑ… ํ•™์Šต ๊ณผ์ •์—์„œ ๊ฐ€์žฅ ํฐ ๊ณผ์ œ ์ค‘ ํ•˜๋‚˜๋Š” ๋ฐ์ดํ„ฐ์˜ ํšจ์œจ์„ฑ์ด๋‹ค. PLFB๋Š” ์ •์  ํ…์ŠคํŠธ, ์ฆ‰ ๊ต๋ณธ์ด๋‚˜ ๋งค๋‰ด์–ผ์˜ ์ง€์‹์„ ํ–‰๋™ ์ •์ฑ…์œผ๋กœ “์ปดํŒŒ์ผ”ํ•˜๋Š” ์ ˆ์ฐจ๋ฅผ ์ œ์•ˆํ•˜์—ฌ ๋น„์šฉ์„ ์ ˆ๊ฐํ•˜๊ณ  ๋น ๋ฅธ ํ•™์Šต์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•œ๋‹ค. ์ด ๊ณผ์ •์—์„œ๋Š” CIQL(Conservative Imaginary Q-Learning)์„ ํ†ตํ•ด ๋ถˆํ™•์‹ค์„ฑ์„ ์–ต์ œํ•จ์œผ๋กœ์จ ์‹ ์†ํ•˜๊ณ  ์•ˆ์ •์ ์ธ ์ •์ฑ… ๊ฒฐ์ •์ด ๊ฐ€๋Šฅํ•ด์ง„๋‹ค.

์‚ฐ์—…์  ์ ์šฉ์˜ ๊ธฐํšŒ

AI์™€ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•œ ํ•™์Šต์˜ ๊ฐ€๋Šฅ์„ฑ์€ ๋‹ค์–‘ํ•˜๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ œ์กฐ์—…์—์„œ๋Š” ๋กœ๋ด‡ ๊ณต์ •์˜ ํšจ์œจ์„ฑ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด PLFB์™€ ๊ฐ™์€ ๊ธฐ๋ฒ•์„ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. ๋กœ๋ด‡์€ ๊ต๋ณธ์—์„œ ์–ป์€ ๊ทœ์น™์„ ๋ฐ”ํƒ•์œผ๋กœ ์ž์œจ์ ์œผ๋กœ ์ž‘์—…ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ์‹ค์‹œ๊ฐ„์œผ๋กœ ํšจ์œจ์ ์ธ ์ƒ์‚ฐ์„ฑ์„ ์œ ์ง€ํ•  ์ˆ˜ ์žˆ๋‹ค.

๋˜ํ•œ, ๊ฒŒ์ž„ ์‚ฐ์—…์—์„œ๋„ AI ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•จ์œผ๋กœ์จ ๋”์šฑ ํฅ๋ฏธ๋กœ์šด ๊ฒŒ์ž„ ์‹œ๋‚˜๋ฆฌ์˜ค์™€ ์ƒํ™ฉ์„ ์ฐฝ์ถœํ•  ์ˆ˜ ์žˆ๋‹ค. Tic-Tac-Toe ๋ฐ Google Research Football ๊ฐ™์€ ๊ฐ„๋‹จํ•œ ๊ฒŒ์ž„๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜์—ฌ ๋ณต์žกํ•œ ์‹œ๋‚˜๋ฆฌ์˜ค์— ์ด๋ฅด๊ธฐ๊นŒ์ง€ AI๋Š” ๋น ๋ฅด๊ฒŒ ์ตœ์ ์˜ ํ•ด๊ฒฐ์ฑ…์„ ์ฐพ์„ ์ˆ˜ ์žˆ๋‹ค.

๋น„๊ต ๋ถ„์„ ๋ฐ ์žฅ๋‹จ์ 

๊ธฐ์กด์˜ ๋ฐฉ๋ฒ•๋ก ๊ณผ PLFB ๋ฐฉ์‹์„ ๋น„๊ตํ•  ๋•Œ, ์ „ํ†ต์ ์ธ RL(๊ฐ•ํ™” ํ•™์Šต) ๊ธฐ๋ฐ˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์€ ์ฃผ์–ด์ง„ ํ™˜๊ฒฝ์—์„œ ๋งŽ์€ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•ด์•ผ ํ•˜์ง€๋งŒ, PLFB๋Š” ์ •์  ํ…์ŠคํŠธ์—์„œ ์ง์ ‘์ ์œผ๋กœ ์ •์ฑ…์„ ๋„์ถœํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ ์—์„œ ํฐ ์žฅ์ ์ด ์žˆ๋‹ค. ํ•˜์ง€๋งŒ, PLFB์˜ ๊ฒฝ์šฐ ํ…์ŠคํŠธ์˜ ํ’ˆ์งˆ์ด ์ •์ฑ… ํ•™์Šต์˜ ์„ฑํŒจ๋ฅผ ์ขŒ์šฐํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ์ˆ˜์ค€์ด ๋‚ฎ์€ ๊ต๋ณธ์ด๋‚˜ ๋งค๋‰ด์–ผ์—์„œ๋Š” ํ•œ๊ณ„๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋‹ค.

๋‹จ์ ์œผ๋กœ๋Š” ํ™˜๊ฐ ๋ฌธ์ œ์™€ ๋ถˆ์™„์ „ํ•œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์„ ์–ด๋–ป๊ฒŒ ๊ทน๋ณตํ•  ๊ฒƒ์ธ์ง€์— ๋Œ€ํ•œ ๋ช…ํ™•ํ•œ ํ•ด๊ฒฐ์ฑ…์ด ๋ถ€์กฑํ•˜๋‹ค๋Š” ์ ์ด๋‹ค. PLFB์˜ ๊ฒฝ์šฐ, ์ƒ์ƒ๋œ ๋ฐ์ดํ„ฐ์˜ ํ’ˆ์งˆ์ด ๋‚ฎ๊ฑฐ๋‚˜ ๊ธฐ๋Œ€ํ•˜๋Š” ์ •๋ฐ€์„ฑ์ด ๊ฒฐ์—ฌ๋  ๊ฒฝ์šฐ, ์‹ค์ œ ์„ฑ๊ณต ํ™•๋ฅ ์— ์•…์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ๋‹ค.

๋ฏธ๋ž˜ ์ „๋ง

์•ž์œผ๋กœ์˜ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ์€ PLFB์™€ ๊ฐ™์€ ์ ‘๊ทผ ๋ฐฉ์‹์„ ๋ฐ”ํƒ•์œผ๋กœ ๋ฐ์ดํ„ฐ์˜ ํšจ์œจ์„ฑ์„ ๋”์šฑ ๋†’์ด๊ณ , ๋‹ค์–‘ํ•œ ์ƒํ™ฉ์— ๋งž์ถฐ ๋ฐœ์ „ํ•  ๊ฐ€๋Šฅ์„ฑ์„ ์‹œ์‚ฌํ•œ๋‹ค. AI์™€ ์ธ๊ฐ„์˜ ์ƒํ˜ธ์ž‘์šฉ์„ ํ†ตํ•ด ๋” ๋‚˜์€ ์ •์ฑ…์„ ์ƒ์‚ฐํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์ด ์žˆ๊ฒ ์œผ๋ฉฐ, ์ƒ์ƒ์˜ ํž˜์„ ๋นŒ๋ ค ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์„ ๋”์šฑ ์šฉ์ดํ•˜๊ฒŒ ๋งŒ๋“ค์–ด ๋‚˜๊ฐˆ ์ˆ˜ ์žˆ๋‹ค. ํŠนํžˆ, ์ตœ๊ทผ์˜ AI ํ˜์‹ ์€ ๋ฏธ๋ž˜์˜ ์—ฌ๋Ÿฌ ์ง๊ตฐ์—์„œ ๊ทธ ํ™œ์šฉ๋„๋ฅผ ๋†’์ผ ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ๋œ๋‹ค. ํŠนํžˆ, AI์˜ ํ…์ŠคํŠธ ๋ฐ ์˜ˆ์ธก ์ •ํ™•์„ฑ์ด ํ–ฅ์ƒ๋˜๋ฉด ๋” ๋‚˜์€ ๊ฒฐ๊ณผ๋ฅผ ๋„์ถœํ•˜๋Š” ๋ฐ ๊ธฐ์—ฌํ•  ๊ฒƒ์ด๋‹ค.

๊ฒฐ๋ก ์ ์œผ๋กœ, AI๊ฐ€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ ๋‚ด์—์„œ ์ •์ฑ…์„ ํ•™์Šตํ•˜๋Š” ๊ฒƒ์€ ๋‹จ์ˆœํ•œ ๊ธฐ์ˆ ์  ๋ฐœ์ „์„ ๋„˜์–ด, ์ด๋ก ์  ํƒ๊ตฌ์— ๋Œ€ํ•œ ์ ‘๊ทผ ๋ฐฉ์‹์—๋„ ํฐ ๋ณ€ํ™”๋ฅผ ๊ฐ€์ ธ์˜ค๊ณ  ์žˆ๋‹ค. PLFB ์—ฐ๊ตฌ๋Š” ๋‹ค์–‘ํ•œ ์‹ ๊ธฐ์ˆ ๊ณผ ์ ‘๊ทผ ๋ฐฉ์‹์„ ํ†ตํ•ด ํ˜์‹ ์ ์ธ ๊ฒฐ๊ณผ๋ฅผ ๋‚ด๋†“์„ ์ˆ˜ ์žˆ๋Š” ๊ธฐ์ดˆ๊ฐ€ ๋  ๊ฒƒ์ด๋ฉฐ, ์•ž์œผ๋กœ์˜ AI ์‹œ๋Œ€์— ํ•ต์‹ฌ์ ์ธ ์—ญํ• ์„ ํ•  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋œ๋‹ค. AI๊ฐ€ ์ธ๊ฐ„ ์‚ฌํšŒ์— ๊ธ์ •์ ์ธ ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๋‚˜์•„๊ฐ€์•ผ ํ•  ํ•„์š”์„ฑ์ด ๋”์šฑ ์ปค์ง€๋Š” ์‹œ์ ์ด๋‹ค.

AGI ์‹œ๋Œ€์˜ ์ธ๋ฅ˜ ๋ณด์กด ๋ชจ๋ธ: ์†Œ์ˆ˜ ๋ณด์กด vs ๋‹ค์ˆ˜ ์†Œ๋ฉธ

AGI(Artificial General Intelligence)์˜ ๋“ฑ์žฅ์€ ์ธ๋ฅ˜ ์—ญ์‚ฌ์— ์ค‘๋Œ€ํ•œ ๋ณ€ํ™”๋ฅผ ๊ฐ€์ ธ์˜ฌ ๊ฒƒ์ด๋‹ค. ์ธ๋ฅ˜์˜ ๋…ธ๋™, ์ƒ์‚ฐ, ์ž๋ณธ์ด๋ผ๋Š” ๊ธฐ์กด์˜ ๊ฐ€์น˜ ์ฒด๊ณ„๋Š” AGI์˜ ๋ฐœ์ „์— ๋”ฐ๋ผ ๋ฌด์˜๋ฏธํ•ด์งˆ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ธ๊ฐ„์˜ ์กด์žฌ ๊ฐ€์น˜ ์—ญ์‹œ ์žฌํ‰๊ฐ€๋  ๊ฒƒ์ด...