ํ•œ ์ฃผ ์š”์•ฝยถ

๋งค์ฃผ ์ปค๋ฎค๋‹ˆํ‹ฐ ๋ฆฌ๋ทฐ๋ฅผ ๊ฑฐ์นœ, ์ด๋ฒˆ ์ฃผ ๊ฐ€์žฅ ๊ฐ€์น˜์žˆ๋Š” ์†Œ์‹ ๋ชจ์Œ์ž…๋‹ˆ๋‹ค. ๋งค์ฃผ ์ˆ˜์š”์ผ ์—…๋ฐ์ดํŠธ ๋ฉ๋‹ˆ๋‹ค.

5์ ยถ

1. Model context protocol (MCP)ยถ

(์š”์•ฝ) AI ๋ด‡, ์—์ด์ „ํŠธ๋“ค ๊ฐ„์˜ interface์— ๋Œ€ํ•œ ํ‘œ์ค€์„ ์ œ์•ˆํ•จ. ์ธ๊ฐ„์„ ์œ„ํ•œ html css, code/bot์„ ์œ„ํ•œ json api graphql grpc, AI/LLM bot์„ ์œ„ํ•œ interface ํ‘œ์ค€: ???

Why it matters: ํ•ด๋‹น proposal ์ค‘ ๊ฐ€์žฅ novelํ•จ. ํ•„์š”์„ฑ์ด ํฌ๊ณ , ์„ฑ๊ณต์ ์œผ๋กœ ecosystem์„ ๊ตฌ์ถ•ํ•œ๋‹ค๋ฉด ์ž ์žฌ์ ์œผ๋กœ ๋งค์šฐ ์ค‘์š”ํ•จ.

4์ ยถ

1. ์—์ด์ „ํŠธ ๋‚ด ์ž์—ฐ์–ด ๊ฒ€์ƒ‰ ํ’ˆ์งˆ ํ–ฅ์ƒ ๊ธฐ๋ฒ• : Entity RAG, Knowledge-aware retrievalยถ

์ž์—ฐ์–ด ๊ฒ€์ƒ‰์€ LLM ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•ด ์‚ฌ์šฉ์ž์˜ ์งˆ์˜๋ฅผ ๋ฌธ๋งฅ๊ณผ ์˜๋„์— ๋งž๊ฒŒ ๋ถ„์„, ์ตœ์ ์˜ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณตํ•˜๋Š” ๊ธฐ์ˆ ์ž„. Entity RAG๋Š” LLM์˜ ์ตœ์‹  ๋ฐ์ดํ„ฐ ๋ถ€์กฑ ๋ฌธ์ œ๋ฅผ ๋ณด์™„ํ•˜๊ธฐ ์œ„ํ•ด ๊ฒฝ๋Ÿ‰๊ฒ€์ƒ‰์œผ๋กœ ์ถ”์ถœ๋œ ์ •๋ณด๋ฅผ ํ”„๋กฌํ”„ํŠธ์— ์‚ฝ์ž…ํ•˜์—ฌ ๊ฐœ์ฒด ์ธ์‹ ์ •ํ™•๋„๋ฅผ ๋†’์ž„. Knowledge-aware retrieval์€ ์‚ฌ์šฉ์ž์™€ ์—์ด์ „ํŠธ๊ฐ€ ์ดํ•ดํ•˜๋Š” ํ‚ค์›Œ๋“œ ๋ฐ ํ…Œ๋งˆ ๊ฐ„ ์ฐจ์ด๋ฅผ ์‹œ๋งจํ‹ฑ ๊ฒ€์ƒ‰์„ ํ†ตํ•ด ์—ฐ๊ฒฐ, ์ ์ ˆํ•œ ๊ฒ€์ƒ‰๊ฒฐ๊ณผ๋ฅผ ๋ฐ˜ํ™˜ํ•จ. ๋‘ ๊ธฐ๋ฒ• ๋ชจ๋‘ ๊ธฐ์กด ํ‚ค์›Œ๋“œ ๊ฒ€์ƒ‰์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๋ฉฐ, ๋ณต์žกํ•˜๊ฑฐ๋‚˜ ๋ชจํ˜ธํ•œ ์งˆ์˜์— ๋Œ€ํ•ด ๋” ์ •ํ™•ํ•œ ๊ฒฐ๊ณผ ์ œ๊ณต์— ๊ธฐ์—ฌํ•จ. ํ–ฅํ›„ ๋ฏธ๋””์–ด, ๋ฎค์ง ๋“ฑ ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ์— ์ ์šฉ ํ™•๋Œ€ ๋ฐ ๊ฐœ์ธํ™”, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ธฐ์ˆ ๊ณผ ์œตํ•ฉํ•˜์—ฌ ๊ฒ€์ƒ‰์ถ”์ฒœ ๊ฒฝํ—˜์„ ๋”์šฑ ๊ฐœ์„ ํ•  ๊ณ„ํš.

**Why it matters:

  • ์ตœ์‹  ๋ฐ์ดํ„ฐ ์ธ์‹ ๋ณด์™„:** Entity RAG ๊ธฐ๋ฒ•์„ ํ†ตํ•ด LLM์ด ์ตœ์‹  ๋ฐ์ดํ„ฐ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์ธ์‹ํ•  ์ˆ˜ ์žˆ์–ด, ์‹ค์ œ ์„œ๋น„์Šค ํ™˜๊ฒฝ์—์„œ ๋ฐœ์ƒํ•˜๋Š” ์ตœ์‹  ์ด์Šˆ๋‚˜ ์‹ ๊ทœ ๊ฐœ์ฒด์— ๋Œ€ํ•ด ๋ณด๋‹ค ์ •ํ™•ํ•œ ์‘๋‹ต์„ ์ œ๊ณต - ์˜๋„ ๋ฐ ๊ฐœ์ฒด ์ธ์‹ ๊ฐœ์„ : ์‚ฌ์šฉ์ž ์งˆ์˜์˜ ๋ฌธ๋งฅ๊ณผ ์˜๋„๋ฅผ ์ •๊ตํ•˜๊ฒŒ ๋ถ„์„ํ•˜์—ฌ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ์˜ ํ’ˆ์งˆ์„ ๋†’์ด๋Š” ๊ธฐ์ˆ ์€ LLM์„ ํ™œ์šฉํ•˜๋Š” ๋ชจ๋“  ๋ถ„์•ผ์—์„œ ํ•ต์‹ฌ์ ์ธ ์—ญํ• ์„ ํ•จ - ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ: ๋ฏธ๋””์–ด, ๋ฎค์ง, ์ฆ๊ถŒ ๋“ฑ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์— ์ ์šฉํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ํŠนํžˆ ๋ณต์žกํ•˜๊ฑฐ๋‚˜ ๋ชจํ˜ธํ•œ ์งˆ์˜์— ๋Œ€ํ•ด ๊ธฐ์กด ๋ฐฉ์‹๋ณด๋‹ค ๊ฐœ์„ ๋œ ๊ฒฐ๊ณผ๋ฅผ ๋„์ถœํ•  ์ˆ˜ ์žˆ์Œ - ์‹œ๋งจํ‹ฑ ๊ฒ€์ƒ‰๊ณผ์˜ ์œตํ•ฉ: Knowledge-aware retrieval์„ ํ†ตํ•ด ์‚ฌ์šฉ์ž๊ฐ€ ์ดํ•ดํ•˜๋Š” ํ‚ค์›Œ๋“œ์™€ ์‹œ์Šคํ…œ ๋‚ด๋ถ€์˜ ๋ฐ์ดํ„ฐ ์ฒด๊ณ„ ๊ฐ„์˜ ์ฐจ์ด๋ฅผ ๊ทน๋ณต, ์˜๋ฏธ ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰์„ ํšจ๊ณผ์ ์œผ๋กœ ์ง€์›

3์ ยถ

1. MoA(Mixture-of-Agents, ์—์ด์ „ํŠธ ํ˜ผํ•ฉ ๊ธฐ๋ฒ•)ยถ

MoA(Mixture-of-Agents)๋Š” LLM ์ž์ฒด๋ฅผ ๋ณ€๊ฒฝํ•˜์ง€ ์•Š๊ณ  ํ”„๋กฌํ”„ํŠธ์™€ sampling options(์˜ˆ: temperature)๋งŒ ์กฐ์ •ํ•˜์—ฌ ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•˜๋Š” ๊ธฐ๋ฒ•์ด๋‹ค. ์—ฌ๋Ÿฌ LLM ์—์ด์ „ํŠธ๋ฅผ ๊ณ„์ธต์ ์œผ๋กœ ๊ตฌ์„ฑํ•˜๋ฉฐ, ์ด์ „ ๊ณ„์ธต์˜ ์ถœ๋ ฅ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์ ์ง„์ ์œผ๋กœ ์‘๋‹ต์„ ๋ฐœ์ „์‹œํ‚จ๋‹ค. ๊ฐ ๊ณ„์ธต์—๋Š” ์ œ์•ˆ์ž(Proposer)์™€ ์ง‘๊ณ„์ž(Aggregator)๊ฐ€ ์กด์žฌํ•˜๋ฉฐ, ์ œ์•ˆ์ž๋Š” ์ดˆ๊ธฐ ์‘๋‹ต์„ ์ƒ์„ฑํ•˜๊ณ  ์ง‘๊ณ„์ž๋Š” ์ด๋ฅผ ์ข…ํ•ฉํ•˜์—ฌ ๊ฐœ์„ ๋œ ์‘๋‹ต์„ ๋ฐ˜ํ™˜ํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐ˜๋ณต์  ๊ฐœ์„  ๊ณผ์ •์„ ํ†ตํ•ด ๋ณด๋‹ค ์ •๊ตํ•œ ์ตœ์ข… ์ถœ๋ ฅ์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋‹ค. MoA๋Š” ๋‹ค์–‘ํ•œ ๋ชจ๋ธ์„ ํ™œ์šฉํ•˜์—ฌ ํ˜‘์—…์ ์ด๊ณ  ํšจ์œจ์ ์ธ AI ์‘๋‹ต ์ƒ์„ฑ์„ ๋ชฉํ‘œ๋กœ ํ•œ๋‹ค.

**Why it matters:

  1. ๋‹จ์ผ LLM์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณต** ์—ฌ๋Ÿฌ ๊ฐœ์˜ LLM์„ ๊ณ„์ธต์ ์œผ๋กœ ์กฐํ•ฉํ•˜์—ฌ ๊ฐœ๋ณ„ ๋ชจ๋ธ์ด ๊ฐ€์ง„ ์•ฝ์ ์„ ๋ณด์™„ํ•˜๊ณ , ๋” ์ •๊ตํ•œ ์‘๋‹ต์„ ์ƒ์„ฑ

  2. ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง๋งŒ์œผ๋กœ ์„ฑ๋Šฅ ํ–ฅ์ƒ ๊ฐ€๋Šฅ ๋ชจ๋ธ ์ž์ฒด๋ฅผ ๋ณ€๊ฒฝํ•˜๊ฑฐ๋‚˜ ์ถ”๊ฐ€์ ์ธ fine-tuning ์—†์ด, ํ”„๋กฌํ”„ํŠธ์™€ ์ƒ˜ํ”Œ๋ง ์˜ต์…˜(์˜ˆ: temperature)์„ ์กฐ์ •ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ ๋ชจ๋ธ ํ›ˆ๋ จ ์—†์ด๋„ ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์žฅ์ ์ด ์žˆ์ง€๋งŒ ์—ฌ๋Ÿฌ LLM์„ ๊ณ„์ธต์ ์œผ๋กœ ์‚ฌ์šฉํ•˜๊ธฐ์— ๋ฐœ์ƒํ•˜๋Š” latency๊ฐ€ ๋ถˆ๊ฐ€ํ”ผํ•  ๊ฒƒ์œผ๋กœ ๋ณด์ž„

2. Agentic Document Extractionยถ

Agentic ๋ฌธ์„œ ์ถ”์ถœ ๊ธฐ์ˆ ์€ ๋ฌธ์„œ์—์„œ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•˜๋Š” ์ƒˆ๋กœ์šด ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ OCR ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•์ด๋‚˜ ํ…์ŠคํŠธ ๋ณ€ํ™˜(text2text) ๋ฐฉ์‹๊ณผ ๋‹ฌ๋ฆฌ, ์ด ๊ธฐ์ˆ ์€ ํ…์ŠคํŠธ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์ฒดํฌ๋ฐ•์Šค, ๊ทธ๋ž˜ํ”„, ์ฐจํŠธ, ๋‹ค์ด์–ด๊ทธ๋žจ, ํ‘œ์™€ ๊ฐ™์€ ์‹œ๊ฐ์  ์š”์†Œ๊นŒ์ง€ ๋ถ„์„ํ•˜์—ฌ ๋ฌธ์„œ์˜ ์˜๋ฏธ๋ฅผ ํฌ์ฐฉํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ํ๋ฆ„๋„์—์„œ ์š”์†Œ ๊ฐ„์˜ ์—ฐ๊ฒฐ ๊ด€๊ณ„๋ฅผ ์ดํ•ดํ•˜๊ฑฐ๋‚˜ ์ฐจํŠธ์—์„œ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•˜๋Š” ๋ฐ ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ๋ฌธ์„œ ๋‚ด ๊ตฌ์„ฑ ์š”์†Œ๋ฅผ ํ™œ์šฉํ•ด ๋…ผ๋ฆฌ์ ์œผ๋กœ ํ•ด์„ํ•จ์œผ๋กœ์จ ๋…์ž๊ฐ€ ์ €์ž๊ฐ€ ์ „๋‹ฌํ•˜๋ ค๋Š” ๋‚ด์šฉ์„ ๋” ์‰ฝ๊ฒŒ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋„๋ก ๋•์Šต๋‹ˆ๋‹ค.

Why it matters: ์˜ค๋Š˜๋‚ ์˜ ๋ฌธ์„œ๋Š” ๋‹จ์ˆœํ•œ ํ…์ŠคํŠธ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๋‹ค์–‘ํ•œ ์‹œ๊ฐ์  ์š”์†Œ๋ฅผ ํฌํ•จํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, ์ด๋Ÿฌํ•œ ์‹œ๊ฐ์  ์š”์†Œ์—๋Š” ์ค‘์š”ํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ๋งŽ์ด ๋‹ด๊ฒจ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๊ธฐ์กด ๋ฐฉ์‹์œผ๋กœ๋Š” ์‹œ๊ฐ์  ์š”์†Œ๋ฅผ ๋ฐฐ์ œํ•œ ์ฑ„ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋ถˆ์™„์ „ํ•œ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์ด ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Agentic ๋ฌธ์„œ ์ถ”์ถœ ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•˜๋ฉด ๋ณด๋‹ค ์ •ํ™•ํ•œ ๋ฐ์ดํ„ฐ ์ถ”์ถœ์ด ๊ฐ€๋Šฅํ•˜๋ฉฐ, ๋‚˜์•„๊ฐ€ ๋…์ž์˜ ์ดํ•ด๋„๋ฅผ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐ์—๋„ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

2์ ยถ

1.Why canโ€™t ChatGPT Draw full glass of wine?ยถ

GPT๋Š” ์‹ค์กดํ•˜์ง€ ์•Š๋Š” ์œ ๋‹ˆ์ฝ˜์„ ๊ทธ๋ ค๋ƒˆ์ง€๋งŒ ์‹ค์กดํ•˜๋Š” ๊ฐ€๋“์ฐฌ ์™€์ธ์ž”์„ ๊ทธ๋ ค๋‚ด์ง€๋ชปํ–ˆ๋‹ค. ํ•ด๋‹น ์˜์ƒ์€ ๊ฒฝํ—˜์ฃผ์˜ ์ฒ ํ•™์„ ๊ธฐ๋ฐ˜์œผ๋กœ, ์ƒ์ƒ๊ฐ€๋Šฅํ•œ๊ฒƒ๊ณผ ๋ถˆ๊ฐ€๋Šฅํ•œ ๊ฒƒ์„ ๊ตฌ๋ถ„ํ•œ๋‹ค. GPT๊ฐ€ ์—ฐ์†๋˜๋Š” ์ƒ‰์˜ ๋นˆ๊ณต๊ฐ„์„ ์ฑ„์šฐ๋Š” ์˜ˆ์‹œ๋ฅผ ํ†ตํ•ด ์™œ ์œ ๋‹ˆ์ฝ˜์€ ๊ฐ€๋Šฅํ•˜์ง€๋งŒ ๊ฐ€๋“์ฐฌ ์™€์ธ์ž”์€ ๋ถˆ๊ฐ€๋Šฅํ•œ์ง€ ์ด์œ ๋ฅผ ์„ค๋ช…ํ•œ๋‹ค.

Why it matters:

โ€™AI์˜ ์ฐฝ์˜๋ ฅ์ด ๋ฌด์—‡์ธ๊ฐ€?โ€™ ์— ๋Œ€ํ•ด ๊ฐ€๋ณ๊ฒŒ ๋ณด๊ธฐ ์ข‹์Œ

1์ ยถ

1. ํšจ์œจ์ ์ธ ๋ฒกํ„ฐ ๊ฒ€์ƒ‰ ์•Œ๊ณ ๋ฆฌ์ฆ˜ HNSW ์•Œ์•„๋ณด๊ธฐยถ

HNSW๋Š” ANN(Approximate Nearest Neighbor)์„ ์œ„ํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ, KNN๊ณผ ๋‹ค๋ฅด๊ฒŒ ์™„๋ฒฝํ•˜๊ฒŒ ์ •ํ™•ํ•˜์ง€ ์•Š์ง€๋งŒ ๋น ๋ฅธ ๋ฒกํ„ฐ ๊ฒ€์ƒ‰์„ ์œ„ํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ž…๋‹ˆ๋‹คHNSW ์ œ์™ธํ•˜๋”๋ผ๊ณ  Annoy, LSH, Faiss์™€ ๊ฐ™์€ ๋‹ค๋ฅธ ANN ๋ฐฉ๋ฒ•๋ก ์ด ์กด์žฌํ•˜์ง€๋งŒ, HNSW๋Š” ์‹ค์‹œ๊ฐ„ ๋ฐ์ดํ„ฐ ์‚ฝ์ž…์ด ๊ฐ€๋Šฅํ•˜๊ณ , ์ƒ๋Œ€์ ์œผ๋กœ ๋‚ฎ์€ ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰์„ ๊ฐ€์ง€๊ณ  ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ๋‹ค๋ฅธ ANN ๋ฐฉ๋ฒ•์— ๋น„ํ•ด ๋ฒ”์šฉ์ ์œผ๋กœ ์‚ฌ์šฉํ•˜๊ธฐ ์ข‹๋‹ค. HNSW์˜ ์›๋ฆฌ๋Š” ๊ณ„์ธต์  ๊ทธ๋ž˜ํ”„ ๊ตฌ์กฐ๋ฅผ ํ†ตํ•ด ์ตœ์ƒ์œ„์—์„œ ํ•˜์œ„๋กœ ๋‚ด๋ ค๊ฐˆ ์ˆ˜๋ก ๋” ๋งŽ์€ ๋…ธ๋“œ๋ฅผ ์œ ์ง€ํ•˜์—ฌ, ๋‹จ๊ณ„์ ์œผ๋กœ ๊ฒ€์ƒ‰์„ ์ง„ํ–‰ํ•ด ๋น ๋ฅด๊ฒŒ ํƒ์ƒ‰ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•œ๋‹ค.

Why it matters

RAG๋ฅผ ์œ„ํ•ด ํ•ต์‹ฌ์ ์ธ ์š”์†Œ์ธ Vector database๊ฐ€ ์‚ฌ์šฉํ•˜๋Š” ๋Œ€ํ‘œ์ ์ธ ๋ฐฉ๋ฒ•๋“ค(HNSW, Annoy, LSH, FAISS)์˜ ์žฅ๋‹จ์ ์„ ๋น„๊ตํ•˜๊ณ , ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๊ณผ ๋น„๊ตํ•˜์—ฌ HNSW๊ฐ€ ๋” ์ ํ•ฉํ•œ ์ด์œ ์™€ HNSW์˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋Œ€ํ•œ ๊ฐœ๋…์ ์ธ ์„ค๋ช…์„ ํ•˜๊ณ  ์žˆ๋‹ค