ํ ์ฃผ ์์ฝ
Contents
ํ ์ฃผ ์์ฝยถ
๋งค์ฃผ ์ปค๋ฎค๋ํฐ ๋ฆฌ๋ทฐ๋ฅผ ๊ฑฐ์น, ์ด๋ฒ ์ฃผ ๊ฐ์ฅ ๊ฐ์น์๋ ์์ ๋ชจ์์ ๋๋ค. ๋งค์ฃผ ์์์ผ ์ ๋ฐ์ดํธ ๋ฉ๋๋ค.
[2025/07/07 ~ 2025/07/13] ์ฃผ๊ฐ ์์ยถ
5์ ยถ
1. Claude Code๊ฐ ์ด์ ํ (hooks)์ ์ง์ํจยถ
โข Claude Code์ ์ฌ์ฉ์ ์ ์ ํ ย ๊ธฐ๋ฅ์ด ๋์ . LLM์ ์ ํ์ ์์กดํ์ง ์๊ณ , ์ฑ์ ํ๋์ ๋์ฑย ์ ํํ๊ณ ๋ฐ๋ณต์ ์ผ๋ก ์ ์ดํ ์ ์์ โข ์๋ฆผ ์ปค์คํฐ๋ง์ด์ง, ์ฝ๋ ์๋ ํฌ๋งทํ ,ย ๋ช ๋ น ๋ก๊ทธ ์ถ์ ๊ณผ ๊ฐ์ ๋ค์ํ ์๋ํ๊ฐ ๊ฐ๋ฅ โข ๋ช ๋ น์ด ์คํ ์ /ํ, ์๋ฆผ ๋ฐ์, ์๋ต ์๋ฃ ์์ ย ๋ฑ์์ ๋์ํ๋ฉฐ,ย ์ค์ ํ์ผ์ ํตํด ํ๋ก์ ํธยท์ฌ์ฉ์ยท์ํฐํ๋ผ์ด์ฆ ๋ ๋ฒจ๋ก ๊ด๋ฆฌํ ์ ์์ โข ์ค์ ํ์ผ ๊ตฌ์กฐ์ ๋งค์ฒ(matcher) ๋ฐฉ์์ ํตํด,ย ํน์ ๋๊ตฌ ํธ์ถ ์์ ์ ํน์ ํ ๋ง ์คํํ ์ ์์ โข ์ ๋ ฅ์ JSON ํฌ๋งท์ผ๋ก ์ ๋ฌ๋๊ณ ,ย ์ถ๋ ฅ์ exit code ๋๋ JSON์ผ๋ก ๊ฒฐ๊ณผยทํผ๋๋ฐฑ์ ์ ์ดํจ โข ํ ์ย ์ ธ ๋ช ๋ น์ด๋ฅผ ์ฌ์ฉ์์ ์ ์ฒด ๊ถํ์ผ๋ก ์๋ ์คํํ๋ฏ๋ก, ๋ณด์ ๋ฐ ์์ ์ ๋ํ ์ฃผ์ ํ์ํจ
Why it matters: ๋ด์ฉ ์์
2. Firestarter - ์น์ฌ์ดํธ ์ฝํ ์ธ ๋ฅผ ๋ฐํ์ผ๋ก AI Chatbot์ ๋ง๋ค์ด์ฃผ๋ ์คํ์์ค ํ๋ก์ ํธยถ
Firestarter๋ URL๋ง ์ ๋ ฅํ๋ฉด ์น์ฌ์ดํธ๋ฅผ ์๋์ผ๋ก ํฌ๋กค๋งยท๋ฒกํฐํํด ๊ณง๋ฐ๋ก RAG ๊ธฐ๋ฐ AI ์ฑ๋ด์ ๋ฐฐํฌํด ์ฃผ๋ MIT ์คํ์์ค ํ๋ก์ ํธ๋ค. Firecrawl๋ก ์ฝํ ์ธ ๋ฅผ Markdown ํํ๋ก ๊ธ์ด์ค๊ณ , Upstash Search์ ์๋ฒ ๋ฉยท์ธ๋ฑ์ฑํ ๋ค Next.js 15ยทVercel AI SDK๋ฅผ ์ด์ฉํด ์คํธ๋ฆฌ๋ฐ ์ธํฐํ์ด์ค์ OpenAI ํธํ REST ์๋ํฌ์ธํธ๋ฅผ ์ ๊ณตํ๋ค. ์ฌ์ฉ์๋ ๋ณต์กํ ์ธํ๋ผ ์์ด๋ /create API๋ก ์ฑ๋ด์ ๋ง๋ค๊ณ /query๋ก ์ง์๋ฅผ ๋ณด๋ผ ์ ์์ผ๋ฉฐ, ์์ฑ๋ ์ฑ๋ด์ OpenAIยทAnthropicยทGroq ์ ์ฐ์ ์์์ ๋ฐ๋ผ LLM์ ํธ์ถํ๋ค. ํฌ๋กค๋ง ๊น์ดยทLLM ์ฐ์ ์์ยท์ฑ๋ด ์์ฑ ํ์ฑํ ์ฌ๋ถ ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ firestarter.config.ts์์ ๊ฐ๋จํ ์กฐ์ ํ ์ ์์ด ์๊ฐ ํธ์คํ ์ด๋ ๊ธฐ๋ฅ ํ์ฅ์ด ์ฉ์ดํ๋ค. DocsGPTโ/โLangChain ๊ฐ์ ๊ธฐ์กด RAG ํด๊ณผ ๋ฌ๋ฆฌ Firestarter๋ **โ์ฆ์ ์ฌ์ฉ ๊ฐ๋ฅโ**๊ณผ OpenAI-ํธํ API๋ฅผ ๊ฐ์ ์ผ๋ก ๋ด์ธ์ด๋ค. ๊ฐ๋ฐ์ ๋ฌธ์, FAQ, ๊ณ ๊ฐ ์ง์ ์ฌ์ดํธ๋ฅผ ๋น ๋ฅด๊ฒ โ๋ํํ ๋ฐ์ดํฐ ์์คโ๋ก ์ ํํ ์ ์์ด ์ปค๋ฎค๋ํฐยท๊ธฐ์ ์ฑํ์ด ๋น ๋ฅด๊ฒ ๋๊ณ ์๋ค.
Why it matters: ๋๊ท๋ชจ ํ๋ผ๋ฏธํฐ LLM์ โ์ธ๋ถ ์ง์๊ณผ ๊ฒฐํฉโํด ์ฐ๋ RAG ํธ๋ ๋๊ฐ ํญ๋ฐํ๋ ๊ฐ์ด๋ฐ, Firestarter๋ โURL โ ์ฑ๋ดโ ์ํฌํ๋ก๋ฅผ 1๋ถ์ผ๋ก ๋จ์ถํด ์ง์ ์ฅ๋ฒฝ์ ํฌ๊ฒ ๋ฎ์ท๋ค. OpenAI-ํธํ API๋ฅผ ๊ทธ๋๋ก ๋ด์ฃผ๋ฏ๋ก ๊ธฐ์กด ์ฑยท์ฌ๋๋ดยทํ๋ฌ๊ทธ์ธ์ ๊ฑฐ์ ์์ ์์ด ๋ถ์ผ ์ ์๊ณ , ๋ค์ค LLMยท์๋ฒ๋ฆฌ์ค ๋ฒกํฐ DBยท์คํธ๋ฆฌ๋ฐ UI ์กฐํฉ์ ํํ ์์ฐ์ฑ ํด ์คํ๊ณผ ์ ๋ง๋ฌผ๋ฆฐ๋ค. ๋ฐ๋๋ก ๋จ์ ๋ ๋๋ ทํ๋ค:
FirecrawlยทUpstashยทLLM ํธ์ถ ๋น์ฉ ๋ฐ ๊ฐ์ธ์ ๋ณด ์ด์๊ฐ ์ธ๋ถ ์๋น์ค ์ข ์์ฑ์ ๋จ๊ธด๋ค.
๋์ SPAยท๋ก๊ทธ์ธ ๋ฒฝ ๋ฑ ๋ณต์กํ ์ฌ์ดํธ๋ ํฌ๋กค๋ง ํ์ง์ด ๋จ์ด์ง ์ ์๋ค.
๊ธฐ๋ณธ ์ฐ์ ์์๊ฐ GPT-4o ์ค์ฌ์ด๋ผ ํ ํฐ ๋น์ฉ์ด ๊ธ์ฆํ ์ ์๊ณ , ์ ํ์ ํฌ๋กค๋ง ๊น์ด(๊ธฐ๋ณธ 10 ํ์ด์ง)๋ ๋ํ ์ฌ์ดํธ ์ง์ ์ ์ถ๊ฐ ํ๋์ด ํ์ํ๋ค. ๊ทธ๋ผ์๋ ์คํ์์คยท๊ตฌ์ฑ ๋จ์ํ๋ผ๋ ๊ฐ์ ๋๋ถ์, LLM ์ ๋ชฉ ์ฑ๋ดยท๊ฒ์ ์๋น์ค ๋ถ์ผ์์ ๋น๋ถ๊ฐ ํ์ค ํดํท ์ญํ ์ ํ ๊ฐ๋ฅ์ฑ์ด ๋๋ค.
3. MCPJam Inspector: MCP Server์ ์๊ฐ์ ๋๋ฒ๊น ์ ์ํ Web UI ๊ธฐ๋ฐ ๋๊ตฌยถ
์์ฝ ์์
Why it matters: ๋ด์ฉ ์์
4์ ยถ
1. OpenAI Agents SDK๋ฅผ ์ฌ์ฉํ์ฌ ๊ฐ๋ฐํ ๊ณ ๊ฐ ์๋น์ค(CS) Agents Demo ํ๋ก์ ํธ ๊ณต๊ฐยถ
OpenAI ์์ ๋ฐํํ LLM Agents Demo GPT API๋ฅผ ํ์ฉํด์ ์๋น์ค๋ฅผ ๋ง๋ค๊ธฐ ์ฝ๊ฒ ํด์ค ํ์ด์ฌ, next.js ๊ธฐ๋ฐ์ ๋ฐ๋ชจ ํ๋ก๊ทธ๋ ์ ๋ฐฐํฌ์ค (์ค์ ์๋ด์ฌ ์๋๋ฆฌ์ค์ ๊ธฐ๋ฐํ ๋ค์ค ์์ด์ ํธ ์ค์ผ์คํธ๋ ์ด์ , ์ค์๊ฐ ์ฑํ , guardrail(๊ฐ๋๋ ์ผ, ์ฃผ์ ์ดํ ๋ฐ ๋ณด์ ํ์ง) ๊ธฐ๋ฅ ํฌํจ)
Why it matters: ์๋น์ค์ AI๋ฅผ ์ ๋ชฉ์ํค๊ณ ์ถ์ ๋ ์ฌ์ฉํ ๋งํ ์ฐธ๊ณ ์๋ฃ
3์ ยถ
1. Can We Improve Llama 3โs Reasoning Through Post-Training Alone? ASTRO Shows +16% to +20% Benchmark Gainsยถ
ํ์ธํ๋ ํ๋ ์์ํฌ Astro์ ๋ํ ๋ด์ฉ ๋ ผ๋ฆฌ์ ์ผ๋ก ๋ณต์กํ ๋ฌธ์ ๋ฅผ ๋ง๋ฌ์๋ MCTS(๋ชฌํ ์นด๋ฅผ๋ก ํธ๋ฆฌ ํ์)๊ณผ ๊ฐ์ ๊ณผ์ ์ ํตํด ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ํ์ํ๊ณ , CoT ๋ก ์ถ๋ก ๊ณผ์ ์ ํ๋จ(์ถ๋ก ์ฑ๊ณต? ์คํจ? ์คํจํ๋ค๋ฉด ๊ทธ ์์ธ?) ํด๋น ๊ณผ์ ์ ๊ธฐ๋กํ์ฌ ์๋ก์ด ํ์ต ๋ฐ์ดํฐ๋ก ์ฌ์ฉ. ๋ณต์กํ ๋ฌธ์ ์ ๋ํด์ ๊ฐ๋จํ ์์์ด ์๋ ๋ ผ๋ฆฌ์ ์ด๊ณ ์ฒด๊ณ์ ์ธ ์์์ ์ฌ์ฉํ๊ฒ๋จ MATH 500, AMC 2023, AIME 2024๋ฑ์ ๋ฐด์น๋งํฌ์์ 16~20%์ ์ ์๊ฐ ์์นํจ
Why it matters: ๋ ผ๋ฆฌ์ ์์น์ ์ํด ์ํคํ ์ณ ๋ณ๊ฒฝ์ด ์๋ ํ์ธํ๋ ๋ฐ์ดํฐ ์๋์์ฑ์ ํ๊ณ , ์ ์๋ฏธํ ์ฑ๊ณผ๋ฅผ ๊ฑฐ๋
2. LMCache: LLM ์๋น ํจ์จ์ฑ์ ๋์ฌ์ฃผ๋ ์บ์ ์์คํ ยถ
LMCache๋ ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ ํ ์คํธ์ KV ์บ์๋ฅผ GPU, CPU, ๋์คํฌ์ ์ ์ฅํ๊ณ ์ด๋ฅผ ๋ค์ํ LLM ์๋น ์ธ์คํด์ค์์ ํจ์จ์ ์ผ๋ก ๊ณต์ ํ ์ ์๋๋ก ํฉ๋๋ค.
Why it matters: ๋ด์ฉ ์์
3. Cairn: GitHub ์ ์ฅ์์ ์ฐ๋ํ๋ ์คํ์์ค S/W ์์ง๋์ด๋ง ์๋ํ ์์ด์ ํธ(End-to-End SWE Agent)ยถ
์์ฝ ์์
Why it matters: ๋ด์ฉ ์์
4. SmolVLA: ์ปค๋ฎค๋ํฐ ๋ฐ์ดํฐ๋ก ํ์ตํ ์๊ท๋ชจ(450M) ์คํ์์ค ์๊ฐ-์ธ์ด-ํ๋(Vision-Language-Action) ๋ก๋ด ๋ชจ๋ธ (feat. Hugging Face)ยถ
ํ๊น ํ์ด์ค LeRobot ํ์ 2025๋ 6์ 3์ผ SmolVLA-450M์ ๊ณต๊ฐํ๋ค. ์ด ๋ชจ๋ธ์ 4.5์ต ํ๋ผ๋ฏธํฐ๋ก ๊ตฌ์ฑ๋ ๋น์ -์ธ์ด-์ก์ (VLA) ๋ชจ๋ธ๋ก, ๊ณต๊ฐ ๋ผ์ด์ ์ค(์ํ์น 2.0)์ ๊ฐ๋ฒผ์ด ๊ท๋ชจ ๋๋ถ์ ๋งฅ๋ถยท์๋น์-GPU์์๋ ์ค์๊ฐ ์ ์ด๊ฐ ๊ฐ๋ฅํ๋ค. ์ฌ์ ํ์ต๊ณผ ์ถ๋ก ์ ๊ณผ์ ์ ์คํ-์์ค๋ก ์ ๊ณตํด ๋ก๋ด ์ฐ๊ตฌยท๊ต์ก์ ์ง์ ์ฅ๋ฒฝ์ ๋ฎ์ท๋ค. SmolVLA๋ SmolVLM-2 ๋ฐฑ๋ณธ(์๊ทธLIP ๋น์ ์ธ์ฝ๋ + SmolLM-2 ์ธ์ด ๋์ฝ๋) ์์ ์ฝ 1์ต ํ๋ผ๋ฏธํฐ์ Flow-Matching ํธ๋์คํฌ๋จธ ์ก์ ์ ๋ฌธ๊ฐ๋ฅผ ์น์๋ค. ์๊ฐ ํ ํฐ์ 64๊ฐ๋ก ์ค์ด๊ณ VLM ์์ ์ ๋ฐ ๋ ์ด์ด๋ฅผ ์๋ตํด ์ง์ฐ์ ์ ๋ฐ์ผ๋ก ์ค์์ผ๋ฉฐ, ๋น๋๊ธฐ ์ถ๋ก ์คํ์ผ๋ก ๋ก๋ด ์คํ๊ณผ ์์ธก์ ๋ณ๋ ฌํํด 30 % ๋ ๋น ๋ฅธ ์์ ์๋ฃ์ 2๋ฐฐ ์ฒ๋ฆฌ๋์ ๋ฌ์ฑํ๋ค. ๋ชจ๋ธ์ **487๊ฐ ์ปค๋ฎค๋ํฐ ๋ฐ์ดํฐ์ (์ฝ 1,000๋ง ํ๋ ์)**์ผ๋ก ์ฌ์ ํ์ต๋์ผ๋ฉฐ, ์ด ๋จ๊ณ๋ง์ผ๋ก SO100 ์ค์ ์์ ์ฑ๊ณต๋ฅ ์ด 51.7 %โ78.3 %๋ก 26.6 %p ์์นํ๋ค. ๊ทธ ๊ฒฐ๊ณผ, ์๋ฎฌ๋ ์ด์ (LIBEROยทMeta-World)๊ณผ ์ค์ ๋ก๋ด(SO100ยทSO101) ๋ชจ๋์์ ํจ์ฌ ํฐ ACT ๋ชจ๋ธ์ ๋ฅ๊ฐํ๊ณ , ์๋ก์ด ๋ก๋ด ํํ๋ก์ ์ผ๋ฐํ ํ ์คํธ์์๋ ๋์ ์ฑ๊ณต๋ฅ ์ ๊ธฐ๋กํ๋ค.
Why it matters: ๋ํ VLA ๋ชจ๋ธ์ด ์ฐ๊ตฌ์ค ์ ์ฉ GPU์ ์ฌ์ ๋ฐ์ดํฐ์ ๋ฌถ์ฌ ์๋ ํ๋ฆ์ โ์ํยท์คํยท์ปค๋ฎค๋ํฐ ๋ฐ์ดํฐโ ์ถ์ผ๋ก ์ ํํ๋ค๋ ์ . SmolVLA๋ 1 GPUยท๊ณต๊ฐ ๋ฐ์ดํฐ๋ง์ผ๋ก ACT-๊ธ ์ฑ๋ฅ์ ์ ์ฆํด โ๋ก๋ด ํ์ด๋ฐ์ด์ ๋ชจ๋ธ=์ด๋ํโ์ด๋ผ๋ ํต๋ ์ ๊นจ๋จ๋ ธ๊ณ , ๋น๋๊ธฐ ์ถ๋ก ยท๋ ์ด์ด ์คํต ๋ฑ LLM ํจ์จํ ์์ด๋์ด๋ฅผ ๋ก๋ด ์ ์ด๋ก ํ์ฅ. ์ด๋ ์ ๋น์ฉยท์ค์๊ฐ ๋ก๋ด ์์ด์ ํธ์ ๋์คํ๋ฅผ ์๋น๊ธฐ๋ฉฐ, ์คํ ๋ฐ์ดํฐ ๊ธฐ์ฌ๊ฐ ๊ณง ๋ชจ๋ธ ์ฑ๋ฅ์ผ๋ก ์ด์ด์ง๋ ์ํ๊ณ ์ ์ํ์ ์ด๋ฐํ ๊ฐ๋ฅ์ฑ์ด ์ปค๋ณด์.
5. C.O.R.E: ์ฌ์ฉ์์ ์ง์๊ณผ ์ํธ์์ฉํ ์ ์๋, LLM์ ์ํ ๊ณต์ ๊ฐ๋ฅํ ๋ฉ๋ชจ๋ฆฌ ์์คํ ยถ
C.O.R.E๋ ์ฌ์ฉ์๊ฐ ์์ ํ ์์ ๊ถ์ ๊ฐ๋ ๊ณต์ ๊ฐ๋ฅํ ๋ฉ๋ชจ๋ฆฌ ์์คํ . ์ฌ์ฉ์์ ์ง์๊ณผ ์ํธ์์ฉ์ย ์๊ณ์ด ๊ธฐ๋ฐ์ ์ง์ ๊ทธ๋ํ๋ก ๊ตฌ์ฑ. Cursor, Claude ๋ฑ์ ํด๊ณผ ์ฐ๋์ด ๊ฐ๋ฅํ๋ฉฐ, ํนํ SOL์ด๋ผ๋ ๊ฐ์ธ AI ์ด์์คํดํธ์ ๊ฒฐํฉํ์ฌ ์ฌ์ฉ์์ ์ ํธ, ์ฌ์ค ์ ๋ณด, ๋งฅ๋ฝ์ ๊ธฐ๋ฐ์ผ๋ก ๋ ์ ํํ๊ณ ๋ง์ถคํ ์๋ต์ ์ ๊ณตํ ์ ์๋๋ก ์ง์ํฉ๋๋ค.
Why it matters: ์ธ๋ถ์ ์ข ์๋์ง ์์ผ๋ฉฐ, ์ฌ์ฉ์์ ์ฌ์ ์ธ ๊ณต๊ฐ์์ ๋งฅ๋ฝ ๊ธฐ๋ฐ์ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๊ณ ํ์ฉํ ์ ์๊ฒ ํฉ๋๋ค. ์ฌ์ฉ์์ ๋งฅ๋ฝ ๋ฐ ์ทจํฅ์ ํ์ตํ ์ ์๋๋ก ์ง์. ๊ณ ๊ธ ๊ฐ์ธ ๋น์ ๋ฐ ํ์ ํด์์ ํนํ ์ ์ฉํฉ๋๋ค.
2์ ยถ
1. Eion: AI ์์ด์ ํธ์ฉ ๊ณต๋ ๋ฉ๋ชจ๋ฆฌ ๋ฐ ์ง์ ๊ทธ๋ํ ์ ์ฅ์ยถ
์์ฝ ์์
Why it matters: ๋ด์ฉ ์์
2. Context: macOS์์ MCP ์๋ฒ ๋๋ฒ๊น ์ ์ํ ๋ค์ดํฐ๋ธ ํด๋ผ์ดยถ
MCP์ ๊ฐ๋จํ ๋๋ฒ๊น , ๋ชจ๋ํฐ๋ง์ GUI์์ ๋ค๋ฃจ๊ฒ ํด์ฃผ๋ โContextโ ์๊ฐ 2025_03 ์ ๋ฒ์ ๊น์ง ํธํ ์ง์ ๊ธฐ๋ฅ: stdio / HTTP+SSE / Streamable HTTP, OAuth ์ธ์ฆ ๋ฐ ๋ฉํ๋ฐ์ดํฐ ํ์, ํด / ๋ฆฌ์์ค / ํ๋กฌํํธ / ๋ก๊ทธ, ๋ฏธ์ง์: Roots / Sampling / Completion ๋ฑ ๊ณ ๊ธ ๊ธฐ๋ฅ
Why it matters: Mcp์ ๋ํ ์ ๊ทผ์ฑ์ ๋ํ์ค
3. Wrinkl: AI๊ฐ ํ๋ก์ ํธ์ ๋งฅ๋ฝ์ ํ์ ํ๊ณ , ์ฝ๋ ๋ฐ ๋ฌธ์๋ฅผ ์ผ๊ด์ฑ์๊ฒ ์์ฑํ๋๋ก ๋๋ AI ๋งฅ๋ฝ ๊ด๋ฆฌ ์์คํ ยถ
์์ฝ ์์
Why it matters: ๋ด์ฉ ์์
1์ ยถ
5์ ยถ
1. Model context protocol (MCP)ยถ
(์์ฝ) AI ๋ด, ์์ด์ ํธ๋ค ๊ฐ์ interface์ ๋ํ ํ์ค์ ์ ์ํจ. ์ธ๊ฐ์ ์ํ html css, code/bot์ ์ํ json api graphql grpc, AI/LLM bot์ ์ํ interface ํ์ค: ???
Why it matters: ํด๋น proposal ์ค ๊ฐ์ฅ novelํจ. ํ์์ฑ์ด ํฌ๊ณ , ์ฑ๊ณต์ ์ผ๋ก ecosystem์ ๊ตฌ์ถํ๋ค๋ฉด ์ ์ฌ์ ์ผ๋ก ๋งค์ฐ ์ค์ํจ.
4์ ยถ
1. ์์ด์ ํธ ๋ด ์์ฐ์ด ๊ฒ์ ํ์ง ํฅ์ ๊ธฐ๋ฒ : Entity RAG, Knowledge-aware retrievalยถ
์์ฐ์ด ๊ฒ์์ LLM ๊ธฐ์ ์ ํ์ฉํด ์ฌ์ฉ์์ ์ง์๋ฅผ ๋ฌธ๋งฅ๊ณผ ์๋์ ๋ง๊ฒ ๋ถ์, ์ต์ ์ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํ๋ ๊ธฐ์ ์. Entity RAG๋ LLM์ ์ต์ ๋ฐ์ดํฐ ๋ถ์กฑ ๋ฌธ์ ๋ฅผ ๋ณด์ํ๊ธฐ ์ํด ๊ฒฝ๋๊ฒ์์ผ๋ก ์ถ์ถ๋ ์ ๋ณด๋ฅผ ํ๋กฌํํธ์ ์ฝ์ ํ์ฌ ๊ฐ์ฒด ์ธ์ ์ ํ๋๋ฅผ ๋์. Knowledge-aware retrieval์ ์ฌ์ฉ์์ ์์ด์ ํธ๊ฐ ์ดํดํ๋ ํค์๋ ๋ฐ ํ ๋ง ๊ฐ ์ฐจ์ด๋ฅผ ์๋งจํฑ ๊ฒ์์ ํตํด ์ฐ๊ฒฐ, ์ ์ ํ ๊ฒ์๊ฒฐ๊ณผ๋ฅผ ๋ฐํํจ. ๋ ๊ธฐ๋ฒ ๋ชจ๋ ๊ธฐ์กด ํค์๋ ๊ฒ์์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๋ฉฐ, ๋ณต์กํ๊ฑฐ๋ ๋ชจํธํ ์ง์์ ๋ํด ๋ ์ ํํ ๊ฒฐ๊ณผ ์ ๊ณต์ ๊ธฐ์ฌํจ. ํฅํ ๋ฏธ๋์ด, ๋ฎค์ง ๋ฑ ๋ค์ํ ๋๋ฉ์ธ์ ์ ์ฉ ํ๋ ๋ฐ ๊ฐ์ธํ, ๋ฉํฐ๋ชจ๋ฌ ๊ธฐ์ ๊ณผ ์ตํฉํ์ฌ ๊ฒ์์ถ์ฒ ๊ฒฝํ์ ๋์ฑ ๊ฐ์ ํ ๊ณํ.
**Why it matters:
์ต์ ๋ฐ์ดํฐ ์ธ์ ๋ณด์:** Entity RAG ๊ธฐ๋ฒ์ ํตํด LLM์ด ์ต์ ๋ฐ์ดํฐ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ธ์ํ ์ ์์ด, ์ค์ ์๋น์ค ํ๊ฒฝ์์ ๋ฐ์ํ๋ ์ต์ ์ด์๋ ์ ๊ท ๊ฐ์ฒด์ ๋ํด ๋ณด๋ค ์ ํํ ์๋ต์ ์ ๊ณต - ์๋ ๋ฐ ๊ฐ์ฒด ์ธ์ ๊ฐ์ : ์ฌ์ฉ์ ์ง์์ ๋ฌธ๋งฅ๊ณผ ์๋๋ฅผ ์ ๊ตํ๊ฒ ๋ถ์ํ์ฌ ๊ฒ์ ๊ฒฐ๊ณผ์ ํ์ง์ ๋์ด๋ ๊ธฐ์ ์ LLM์ ํ์ฉํ๋ ๋ชจ๋ ๋ถ์ผ์์ ํต์ฌ์ ์ธ ์ญํ ์ ํจ - ๋ค์ํ ๋๋ฉ์ธ ์ ์ฉ ๊ฐ๋ฅ์ฑ: ๋ฏธ๋์ด, ๋ฎค์ง, ์ฆ๊ถ ๋ฑ ๋ค์ํ ๋ถ์ผ์ ์ ์ฉํ ์ ์์ผ๋ฉฐ, ํนํ ๋ณต์กํ๊ฑฐ๋ ๋ชจํธํ ์ง์์ ๋ํด ๊ธฐ์กด ๋ฐฉ์๋ณด๋ค ๊ฐ์ ๋ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ ์ ์์ - ์๋งจํฑ ๊ฒ์๊ณผ์ ์ตํฉ: Knowledge-aware retrieval์ ํตํด ์ฌ์ฉ์๊ฐ ์ดํดํ๋ ํค์๋์ ์์คํ ๋ด๋ถ์ ๋ฐ์ดํฐ ์ฒด๊ณ ๊ฐ์ ์ฐจ์ด๋ฅผ ๊ทน๋ณต, ์๋ฏธ ๊ธฐ๋ฐ ๊ฒ์์ ํจ๊ณผ์ ์ผ๋ก ์ง์
3์ ยถ
1. MoA(Mixture-of-Agents, ์์ด์ ํธ ํผํฉ ๊ธฐ๋ฒ)ยถ
MoA(Mixture-of-Agents)๋ LLM ์์ฒด๋ฅผ ๋ณ๊ฒฝํ์ง ์๊ณ ํ๋กฌํํธ์ sampling options(์: temperature)๋ง ์กฐ์ ํ์ฌ ์ฑ๋ฅ์ ๊ฐ์ ํ๋ ๊ธฐ๋ฒ์ด๋ค. ์ฌ๋ฌ LLM ์์ด์ ํธ๋ฅผ ๊ณ์ธต์ ์ผ๋ก ๊ตฌ์ฑํ๋ฉฐ, ์ด์ ๊ณ์ธต์ ์ถ๋ ฅ์ ๊ธฐ๋ฐ์ผ๋ก ์ ์ง์ ์ผ๋ก ์๋ต์ ๋ฐ์ ์ํจ๋ค. ๊ฐ ๊ณ์ธต์๋ ์ ์์(Proposer)์ ์ง๊ณ์(Aggregator)๊ฐ ์กด์ฌํ๋ฉฐ, ์ ์์๋ ์ด๊ธฐ ์๋ต์ ์์ฑํ๊ณ ์ง๊ณ์๋ ์ด๋ฅผ ์ข ํฉํ์ฌ ๊ฐ์ ๋ ์๋ต์ ๋ฐํํ๋ค. ์ด๋ฌํ ๋ฐ๋ณต์ ๊ฐ์ ๊ณผ์ ์ ํตํด ๋ณด๋ค ์ ๊ตํ ์ต์ข ์ถ๋ ฅ์ ์์ฑํ ์ ์๋ค. MoA๋ ๋ค์ํ ๋ชจ๋ธ์ ํ์ฉํ์ฌ ํ์ ์ ์ด๊ณ ํจ์จ์ ์ธ AI ์๋ต ์์ฑ์ ๋ชฉํ๋ก ํ๋ค.
**Why it matters:
๋จ์ผ LLM์ ํ๊ณ๋ฅผ ๊ทน๋ณต** ์ฌ๋ฌ ๊ฐ์ LLM์ ๊ณ์ธต์ ์ผ๋ก ์กฐํฉํ์ฌ ๊ฐ๋ณ ๋ชจ๋ธ์ด ๊ฐ์ง ์ฝ์ ์ ๋ณด์ํ๊ณ , ๋ ์ ๊ตํ ์๋ต์ ์์ฑ
ํ๋กฌํํธ ์์ง๋์ด๋ง๋ง์ผ๋ก ์ฑ๋ฅ ํฅ์ ๊ฐ๋ฅ ๋ชจ๋ธ ์์ฒด๋ฅผ ๋ณ๊ฒฝํ๊ฑฐ๋ ์ถ๊ฐ์ ์ธ fine-tuning ์์ด, ํ๋กฌํํธ์ ์ํ๋ง ์ต์ (์: temperature)์ ์กฐ์ ํ๋ ๋ฐฉ์์ผ๋ก ์ฑ๋ฅ์ ํฅ์ ๋ชจ๋ธ ํ๋ จ ์์ด๋ ์ฑ๋ฅ์ ๊ฐ์ ํ ์ ์๋ค๋ ์ฅ์ ์ด ์์ง๋ง ์ฌ๋ฌ LLM์ ๊ณ์ธต์ ์ผ๋ก ์ฌ์ฉํ๊ธฐ์ ๋ฐ์ํ๋ latency๊ฐ ๋ถ๊ฐํผํ ๊ฒ์ผ๋ก ๋ณด์
2. Agentic Document Extractionยถ
Agentic ๋ฌธ์ ์ถ์ถ ๊ธฐ์ ์ ๋ฌธ์์์ ์ ๋ณด๋ฅผ ์ถ์ถํ๋ ์๋ก์ด ๋ฐฉ์์ ๋๋ค. ๊ธฐ์กด์ OCR ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ด๋ ํ ์คํธ ๋ณํ(text2text) ๋ฐฉ์๊ณผ ๋ฌ๋ฆฌ, ์ด ๊ธฐ์ ์ ํ ์คํธ๋ฟ๋ง ์๋๋ผ ์ฒดํฌ๋ฐ์ค, ๊ทธ๋ํ, ์ฐจํธ, ๋ค์ด์ด๊ทธ๋จ, ํ์ ๊ฐ์ ์๊ฐ์ ์์๊น์ง ๋ถ์ํ์ฌ ๋ฌธ์์ ์๋ฏธ๋ฅผ ํฌ์ฐฉํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ํ๋ฆ๋์์ ์์ ๊ฐ์ ์ฐ๊ฒฐ ๊ด๊ณ๋ฅผ ์ดํดํ๊ฑฐ๋ ์ฐจํธ์์ ์ ๋ณด๋ฅผ ์ถ์ถํ๋ ๋ฐ ์ ์ฉํฉ๋๋ค. ๋ํ, ๋ฌธ์ ๋ด ๊ตฌ์ฑ ์์๋ฅผ ํ์ฉํด ๋ ผ๋ฆฌ์ ์ผ๋ก ํด์ํจ์ผ๋ก์จ ๋ ์๊ฐ ์ ์๊ฐ ์ ๋ฌํ๋ ค๋ ๋ด์ฉ์ ๋ ์ฝ๊ฒ ์ดํดํ ์ ์๋๋ก ๋์ต๋๋ค.
Why it matters: ์ค๋๋ ์ ๋ฌธ์๋ ๋จ์ํ ํ ์คํธ๋ฟ๋ง ์๋๋ผ ๋ค์ํ ์๊ฐ์ ์์๋ฅผ ํฌํจํ๊ณ ์์ผ๋ฉฐ, ์ด๋ฌํ ์๊ฐ์ ์์์๋ ์ค์ํ ๋ฐ์ดํฐ๊ฐ ๋ง์ด ๋ด๊ฒจ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ๊ธฐ์กด ๋ฐฉ์์ผ๋ก๋ ์๊ฐ์ ์์๋ฅผ ๋ฐฐ์ ํ ์ฑ ์ ๋ณด๋ฅผ ์ถ์ถํ๊ธฐ ๋๋ฌธ์ ๋ถ์์ ํ ๋ฐ์ดํฐ ์์ง์ด ๋ฐ์ํ ์ ์์ต๋๋ค. Agentic ๋ฌธ์ ์ถ์ถ ๊ธฐ์ ์ ํ์ฉํ๋ฉด ๋ณด๋ค ์ ํํ ๋ฐ์ดํฐ ์ถ์ถ์ด ๊ฐ๋ฅํ๋ฉฐ, ๋์๊ฐ ๋ ์์ ์ดํด๋๋ฅผ ํ๊ฐํ๋ ๋ฐ์๋ ํ์ฉํ ์ ์์ต๋๋ค.
2์ ยถ
1.Why canโt ChatGPT Draw full glass of wine?ยถ
GPT๋ ์ค์กดํ์ง ์๋ ์ ๋์ฝ์ ๊ทธ๋ ค๋์ง๋ง ์ค์กดํ๋ ๊ฐ๋์ฐฌ ์์ธ์์ ๊ทธ๋ ค๋ด์ง๋ชปํ๋ค. ํด๋น ์์์ ๊ฒฝํ์ฃผ์ ์ฒ ํ์ ๊ธฐ๋ฐ์ผ๋ก, ์์๊ฐ๋ฅํ๊ฒ๊ณผ ๋ถ๊ฐ๋ฅํ ๊ฒ์ ๊ตฌ๋ถํ๋ค. GPT๊ฐ ์ฐ์๋๋ ์์ ๋น๊ณต๊ฐ์ ์ฑ์ฐ๋ ์์๋ฅผ ํตํด ์ ์ ๋์ฝ์ ๊ฐ๋ฅํ์ง๋ง ๊ฐ๋์ฐฌ ์์ธ์์ ๋ถ๊ฐ๋ฅํ์ง ์ด์ ๋ฅผ ์ค๋ช ํ๋ค.
Why it matters:
โAI์ ์ฐฝ์๋ ฅ์ด ๋ฌด์์ธ๊ฐ?โ ์ ๋ํด ๊ฐ๋ณ๊ฒ ๋ณด๊ธฐ ์ข์
1์ ยถ
1. ํจ์จ์ ์ธ ๋ฒกํฐ ๊ฒ์ ์๊ณ ๋ฆฌ์ฆ HNSW ์์๋ณด๊ธฐยถ
HNSW๋ ANN(Approximate Nearest Neighbor)์ ์ํ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก, KNN๊ณผ ๋ค๋ฅด๊ฒ ์๋ฒฝํ๊ฒ ์ ํํ์ง ์์ง๋ง ๋น ๋ฅธ ๋ฒกํฐ ๊ฒ์์ ์ํ ์๊ณ ๋ฆฌ์ฆ์ ๋๋คHNSW ์ ์ธํ๋๋ผ๊ณ Annoy, LSH, Faiss์ ๊ฐ์ ๋ค๋ฅธ ANN ๋ฐฉ๋ฒ๋ก ์ด ์กด์ฌํ์ง๋ง, HNSW๋ ์ค์๊ฐ ๋ฐ์ดํฐ ์ฝ์ ์ด ๊ฐ๋ฅํ๊ณ , ์๋์ ์ผ๋ก ๋ฎ์ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ๊ฐ์ง๊ณ ์๊ธฐ ๋๋ฌธ์ ๋ค๋ฅธ ANN ๋ฐฉ๋ฒ์ ๋นํด ๋ฒ์ฉ์ ์ผ๋ก ์ฌ์ฉํ๊ธฐ ์ข๋ค. HNSW์ ์๋ฆฌ๋ ๊ณ์ธต์ ๊ทธ๋ํ ๊ตฌ์กฐ๋ฅผ ํตํด ์ต์์์์ ํ์๋ก ๋ด๋ ค๊ฐ ์๋ก ๋ ๋ง์ ๋ ธ๋๋ฅผ ์ ์งํ์ฌ, ๋จ๊ณ์ ์ผ๋ก ๊ฒ์์ ์งํํด ๋น ๋ฅด๊ฒ ํ์ํ ์ ์๊ฒ ํ๋ค.
Why it matters
RAG๋ฅผ ์ํด ํต์ฌ์ ์ธ ์์์ธ Vector database๊ฐ ์ฌ์ฉํ๋ ๋ํ์ ์ธ ๋ฐฉ๋ฒ๋ค(HNSW, Annoy, LSH, FAISS)์ ์ฅ๋จ์ ์ ๋น๊ตํ๊ณ , ๋ค๋ฅธ ๋ฐฉ๋ฒ๊ณผ ๋น๊ตํ์ฌ HNSW๊ฐ ๋ ์ ํฉํ ์ด์ ์ HNSW์ ์๊ณ ๋ฆฌ์ฆ์ ๋ํ ๊ฐ๋ ์ ์ธ ์ค๋ช ์ ํ๊ณ ์๋ค