ํ ์ฃผ ์์ฝ
Contents
ํ ์ฃผ ์์ฝยถ
๋งค์ฃผ ์ปค๋ฎค๋ํฐ ๋ฆฌ๋ทฐ๋ฅผ ๊ฑฐ์น, ์ด๋ฒ ์ฃผ ๊ฐ์ฅ ๊ฐ์น์๋ ์์ ๋ชจ์์ ๋๋ค. ๋งค์ฃผ ์์์ผ ์ ๋ฐ์ดํธ ๋ฉ๋๋ค.
5์ ยถ
1. Model context protocol (MCP)ยถ
(์์ฝ) AI ๋ด, ์์ด์ ํธ๋ค ๊ฐ์ interface์ ๋ํ ํ์ค์ ์ ์ํจ. ์ธ๊ฐ์ ์ํ html css, code/bot์ ์ํ json api graphql grpc, AI/LLM bot์ ์ํ interface ํ์ค: ???
Why it matters: ํด๋น proposal ์ค ๊ฐ์ฅ novelํจ. ํ์์ฑ์ด ํฌ๊ณ , ์ฑ๊ณต์ ์ผ๋ก ecosystem์ ๊ตฌ์ถํ๋ค๋ฉด ์ ์ฌ์ ์ผ๋ก ๋งค์ฐ ์ค์ํจ.
4์ ยถ
1. ์์ด์ ํธ ๋ด ์์ฐ์ด ๊ฒ์ ํ์ง ํฅ์ ๊ธฐ๋ฒ : Entity RAG, Knowledge-aware retrievalยถ
์์ฐ์ด ๊ฒ์์ LLM ๊ธฐ์ ์ ํ์ฉํด ์ฌ์ฉ์์ ์ง์๋ฅผ ๋ฌธ๋งฅ๊ณผ ์๋์ ๋ง๊ฒ ๋ถ์, ์ต์ ์ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํ๋ ๊ธฐ์ ์. Entity RAG๋ LLM์ ์ต์ ๋ฐ์ดํฐ ๋ถ์กฑ ๋ฌธ์ ๋ฅผ ๋ณด์ํ๊ธฐ ์ํด ๊ฒฝ๋๊ฒ์์ผ๋ก ์ถ์ถ๋ ์ ๋ณด๋ฅผ ํ๋กฌํํธ์ ์ฝ์ ํ์ฌ ๊ฐ์ฒด ์ธ์ ์ ํ๋๋ฅผ ๋์. Knowledge-aware retrieval์ ์ฌ์ฉ์์ ์์ด์ ํธ๊ฐ ์ดํดํ๋ ํค์๋ ๋ฐ ํ ๋ง ๊ฐ ์ฐจ์ด๋ฅผ ์๋งจํฑ ๊ฒ์์ ํตํด ์ฐ๊ฒฐ, ์ ์ ํ ๊ฒ์๊ฒฐ๊ณผ๋ฅผ ๋ฐํํจ. ๋ ๊ธฐ๋ฒ ๋ชจ๋ ๊ธฐ์กด ํค์๋ ๊ฒ์์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๋ฉฐ, ๋ณต์กํ๊ฑฐ๋ ๋ชจํธํ ์ง์์ ๋ํด ๋ ์ ํํ ๊ฒฐ๊ณผ ์ ๊ณต์ ๊ธฐ์ฌํจ. ํฅํ ๋ฏธ๋์ด, ๋ฎค์ง ๋ฑ ๋ค์ํ ๋๋ฉ์ธ์ ์ ์ฉ ํ๋ ๋ฐ ๊ฐ์ธํ, ๋ฉํฐ๋ชจ๋ฌ ๊ธฐ์ ๊ณผ ์ตํฉํ์ฌ ๊ฒ์์ถ์ฒ ๊ฒฝํ์ ๋์ฑ ๊ฐ์ ํ ๊ณํ.
**Why it matters:
์ต์ ๋ฐ์ดํฐ ์ธ์ ๋ณด์:** Entity RAG ๊ธฐ๋ฒ์ ํตํด LLM์ด ์ต์ ๋ฐ์ดํฐ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ธ์ํ ์ ์์ด, ์ค์ ์๋น์ค ํ๊ฒฝ์์ ๋ฐ์ํ๋ ์ต์ ์ด์๋ ์ ๊ท ๊ฐ์ฒด์ ๋ํด ๋ณด๋ค ์ ํํ ์๋ต์ ์ ๊ณต - ์๋ ๋ฐ ๊ฐ์ฒด ์ธ์ ๊ฐ์ : ์ฌ์ฉ์ ์ง์์ ๋ฌธ๋งฅ๊ณผ ์๋๋ฅผ ์ ๊ตํ๊ฒ ๋ถ์ํ์ฌ ๊ฒ์ ๊ฒฐ๊ณผ์ ํ์ง์ ๋์ด๋ ๊ธฐ์ ์ LLM์ ํ์ฉํ๋ ๋ชจ๋ ๋ถ์ผ์์ ํต์ฌ์ ์ธ ์ญํ ์ ํจ - ๋ค์ํ ๋๋ฉ์ธ ์ ์ฉ ๊ฐ๋ฅ์ฑ: ๋ฏธ๋์ด, ๋ฎค์ง, ์ฆ๊ถ ๋ฑ ๋ค์ํ ๋ถ์ผ์ ์ ์ฉํ ์ ์์ผ๋ฉฐ, ํนํ ๋ณต์กํ๊ฑฐ๋ ๋ชจํธํ ์ง์์ ๋ํด ๊ธฐ์กด ๋ฐฉ์๋ณด๋ค ๊ฐ์ ๋ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ ์ ์์ - ์๋งจํฑ ๊ฒ์๊ณผ์ ์ตํฉ: Knowledge-aware retrieval์ ํตํด ์ฌ์ฉ์๊ฐ ์ดํดํ๋ ํค์๋์ ์์คํ ๋ด๋ถ์ ๋ฐ์ดํฐ ์ฒด๊ณ ๊ฐ์ ์ฐจ์ด๋ฅผ ๊ทน๋ณต, ์๋ฏธ ๊ธฐ๋ฐ ๊ฒ์์ ํจ๊ณผ์ ์ผ๋ก ์ง์
3์ ยถ
1. MoA(Mixture-of-Agents, ์์ด์ ํธ ํผํฉ ๊ธฐ๋ฒ)ยถ
MoA(Mixture-of-Agents)๋ LLM ์์ฒด๋ฅผ ๋ณ๊ฒฝํ์ง ์๊ณ ํ๋กฌํํธ์ sampling options(์: temperature)๋ง ์กฐ์ ํ์ฌ ์ฑ๋ฅ์ ๊ฐ์ ํ๋ ๊ธฐ๋ฒ์ด๋ค. ์ฌ๋ฌ LLM ์์ด์ ํธ๋ฅผ ๊ณ์ธต์ ์ผ๋ก ๊ตฌ์ฑํ๋ฉฐ, ์ด์ ๊ณ์ธต์ ์ถ๋ ฅ์ ๊ธฐ๋ฐ์ผ๋ก ์ ์ง์ ์ผ๋ก ์๋ต์ ๋ฐ์ ์ํจ๋ค. ๊ฐ ๊ณ์ธต์๋ ์ ์์(Proposer)์ ์ง๊ณ์(Aggregator)๊ฐ ์กด์ฌํ๋ฉฐ, ์ ์์๋ ์ด๊ธฐ ์๋ต์ ์์ฑํ๊ณ ์ง๊ณ์๋ ์ด๋ฅผ ์ข ํฉํ์ฌ ๊ฐ์ ๋ ์๋ต์ ๋ฐํํ๋ค. ์ด๋ฌํ ๋ฐ๋ณต์ ๊ฐ์ ๊ณผ์ ์ ํตํด ๋ณด๋ค ์ ๊ตํ ์ต์ข ์ถ๋ ฅ์ ์์ฑํ ์ ์๋ค. MoA๋ ๋ค์ํ ๋ชจ๋ธ์ ํ์ฉํ์ฌ ํ์ ์ ์ด๊ณ ํจ์จ์ ์ธ AI ์๋ต ์์ฑ์ ๋ชฉํ๋ก ํ๋ค.
**Why it matters:
๋จ์ผ LLM์ ํ๊ณ๋ฅผ ๊ทน๋ณต** ์ฌ๋ฌ ๊ฐ์ LLM์ ๊ณ์ธต์ ์ผ๋ก ์กฐํฉํ์ฌ ๊ฐ๋ณ ๋ชจ๋ธ์ด ๊ฐ์ง ์ฝ์ ์ ๋ณด์ํ๊ณ , ๋ ์ ๊ตํ ์๋ต์ ์์ฑ
ํ๋กฌํํธ ์์ง๋์ด๋ง๋ง์ผ๋ก ์ฑ๋ฅ ํฅ์ ๊ฐ๋ฅ ๋ชจ๋ธ ์์ฒด๋ฅผ ๋ณ๊ฒฝํ๊ฑฐ๋ ์ถ๊ฐ์ ์ธ fine-tuning ์์ด, ํ๋กฌํํธ์ ์ํ๋ง ์ต์ (์: temperature)์ ์กฐ์ ํ๋ ๋ฐฉ์์ผ๋ก ์ฑ๋ฅ์ ํฅ์ ๋ชจ๋ธ ํ๋ จ ์์ด๋ ์ฑ๋ฅ์ ๊ฐ์ ํ ์ ์๋ค๋ ์ฅ์ ์ด ์์ง๋ง ์ฌ๋ฌ LLM์ ๊ณ์ธต์ ์ผ๋ก ์ฌ์ฉํ๊ธฐ์ ๋ฐ์ํ๋ latency๊ฐ ๋ถ๊ฐํผํ ๊ฒ์ผ๋ก ๋ณด์
2. Agentic Document Extractionยถ
Agentic ๋ฌธ์ ์ถ์ถ ๊ธฐ์ ์ ๋ฌธ์์์ ์ ๋ณด๋ฅผ ์ถ์ถํ๋ ์๋ก์ด ๋ฐฉ์์ ๋๋ค. ๊ธฐ์กด์ OCR ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ด๋ ํ ์คํธ ๋ณํ(text2text) ๋ฐฉ์๊ณผ ๋ฌ๋ฆฌ, ์ด ๊ธฐ์ ์ ํ ์คํธ๋ฟ๋ง ์๋๋ผ ์ฒดํฌ๋ฐ์ค, ๊ทธ๋ํ, ์ฐจํธ, ๋ค์ด์ด๊ทธ๋จ, ํ์ ๊ฐ์ ์๊ฐ์ ์์๊น์ง ๋ถ์ํ์ฌ ๋ฌธ์์ ์๋ฏธ๋ฅผ ํฌ์ฐฉํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ํ๋ฆ๋์์ ์์ ๊ฐ์ ์ฐ๊ฒฐ ๊ด๊ณ๋ฅผ ์ดํดํ๊ฑฐ๋ ์ฐจํธ์์ ์ ๋ณด๋ฅผ ์ถ์ถํ๋ ๋ฐ ์ ์ฉํฉ๋๋ค. ๋ํ, ๋ฌธ์ ๋ด ๊ตฌ์ฑ ์์๋ฅผ ํ์ฉํด ๋ ผ๋ฆฌ์ ์ผ๋ก ํด์ํจ์ผ๋ก์จ ๋ ์๊ฐ ์ ์๊ฐ ์ ๋ฌํ๋ ค๋ ๋ด์ฉ์ ๋ ์ฝ๊ฒ ์ดํดํ ์ ์๋๋ก ๋์ต๋๋ค.
Why it matters: ์ค๋๋ ์ ๋ฌธ์๋ ๋จ์ํ ํ ์คํธ๋ฟ๋ง ์๋๋ผ ๋ค์ํ ์๊ฐ์ ์์๋ฅผ ํฌํจํ๊ณ ์์ผ๋ฉฐ, ์ด๋ฌํ ์๊ฐ์ ์์์๋ ์ค์ํ ๋ฐ์ดํฐ๊ฐ ๋ง์ด ๋ด๊ฒจ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ๊ธฐ์กด ๋ฐฉ์์ผ๋ก๋ ์๊ฐ์ ์์๋ฅผ ๋ฐฐ์ ํ ์ฑ ์ ๋ณด๋ฅผ ์ถ์ถํ๊ธฐ ๋๋ฌธ์ ๋ถ์์ ํ ๋ฐ์ดํฐ ์์ง์ด ๋ฐ์ํ ์ ์์ต๋๋ค. Agentic ๋ฌธ์ ์ถ์ถ ๊ธฐ์ ์ ํ์ฉํ๋ฉด ๋ณด๋ค ์ ํํ ๋ฐ์ดํฐ ์ถ์ถ์ด ๊ฐ๋ฅํ๋ฉฐ, ๋์๊ฐ ๋ ์์ ์ดํด๋๋ฅผ ํ๊ฐํ๋ ๋ฐ์๋ ํ์ฉํ ์ ์์ต๋๋ค.
2์ ยถ
1.Why canโt ChatGPT Draw full glass of wine?ยถ
GPT๋ ์ค์กดํ์ง ์๋ ์ ๋์ฝ์ ๊ทธ๋ ค๋์ง๋ง ์ค์กดํ๋ ๊ฐ๋์ฐฌ ์์ธ์์ ๊ทธ๋ ค๋ด์ง๋ชปํ๋ค. ํด๋น ์์์ ๊ฒฝํ์ฃผ์ ์ฒ ํ์ ๊ธฐ๋ฐ์ผ๋ก, ์์๊ฐ๋ฅํ๊ฒ๊ณผ ๋ถ๊ฐ๋ฅํ ๊ฒ์ ๊ตฌ๋ถํ๋ค. GPT๊ฐ ์ฐ์๋๋ ์์ ๋น๊ณต๊ฐ์ ์ฑ์ฐ๋ ์์๋ฅผ ํตํด ์ ์ ๋์ฝ์ ๊ฐ๋ฅํ์ง๋ง ๊ฐ๋์ฐฌ ์์ธ์์ ๋ถ๊ฐ๋ฅํ์ง ์ด์ ๋ฅผ ์ค๋ช ํ๋ค.
Why it matters:
โAI์ ์ฐฝ์๋ ฅ์ด ๋ฌด์์ธ๊ฐ?โ ์ ๋ํด ๊ฐ๋ณ๊ฒ ๋ณด๊ธฐ ์ข์
1์ ยถ
1. ํจ์จ์ ์ธ ๋ฒกํฐ ๊ฒ์ ์๊ณ ๋ฆฌ์ฆ HNSW ์์๋ณด๊ธฐยถ
HNSW๋ ANN(Approximate Nearest Neighbor)์ ์ํ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก, KNN๊ณผ ๋ค๋ฅด๊ฒ ์๋ฒฝํ๊ฒ ์ ํํ์ง ์์ง๋ง ๋น ๋ฅธ ๋ฒกํฐ ๊ฒ์์ ์ํ ์๊ณ ๋ฆฌ์ฆ์ ๋๋คHNSW ์ ์ธํ๋๋ผ๊ณ Annoy, LSH, Faiss์ ๊ฐ์ ๋ค๋ฅธ ANN ๋ฐฉ๋ฒ๋ก ์ด ์กด์ฌํ์ง๋ง, HNSW๋ ์ค์๊ฐ ๋ฐ์ดํฐ ์ฝ์ ์ด ๊ฐ๋ฅํ๊ณ , ์๋์ ์ผ๋ก ๋ฎ์ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ๊ฐ์ง๊ณ ์๊ธฐ ๋๋ฌธ์ ๋ค๋ฅธ ANN ๋ฐฉ๋ฒ์ ๋นํด ๋ฒ์ฉ์ ์ผ๋ก ์ฌ์ฉํ๊ธฐ ์ข๋ค. HNSW์ ์๋ฆฌ๋ ๊ณ์ธต์ ๊ทธ๋ํ ๊ตฌ์กฐ๋ฅผ ํตํด ์ต์์์์ ํ์๋ก ๋ด๋ ค๊ฐ ์๋ก ๋ ๋ง์ ๋ ธ๋๋ฅผ ์ ์งํ์ฌ, ๋จ๊ณ์ ์ผ๋ก ๊ฒ์์ ์งํํด ๋น ๋ฅด๊ฒ ํ์ํ ์ ์๊ฒ ํ๋ค.
Why it matters
RAG๋ฅผ ์ํด ํต์ฌ์ ์ธ ์์์ธ Vector database๊ฐ ์ฌ์ฉํ๋ ๋ํ์ ์ธ ๋ฐฉ๋ฒ๋ค(HNSW, Annoy, LSH, FAISS)์ ์ฅ๋จ์ ์ ๋น๊ตํ๊ณ , ๋ค๋ฅธ ๋ฐฉ๋ฒ๊ณผ ๋น๊ตํ์ฌ HNSW๊ฐ ๋ ์ ํฉํ ์ด์ ์ HNSW์ ์๊ณ ๋ฆฌ์ฆ์ ๋ํ ๊ฐ๋ ์ ์ธ ์ค๋ช ์ ํ๊ณ ์๋ค