Template example
Contents
Template exampleยถ
(ํ ํ๋ฆฟ ์์)
TL;DRยถ
Embedding model์ ์์ฐ์ด ์ฒ๋ฆฌ(NLP)์ ๊ฐ์ ์์ ์์ ๋จ์ด, ๋ฌธ์ฅ, ๋๋ ๋ฌธ์๋ฅผ ๊ณ ์ ๋ ํฌ๊ธฐ์ ๋ฒกํฐ ๊ณต๊ฐ์ผ๋ก ๋ณํํ๋ ๋ชจ๋ธ์ ๋๋ค. ์ด ๋ฒกํฐ ํํ์ ์ปดํจํฐ๊ฐ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ์์น์ ์ผ๋ก ์ดํดํ๊ณ ์ฒ๋ฆฌํ ์ ์๋๋ก ํ๋ ํต์ฌ์ ์ธ ์ญํ ์ ํฉ๋๋ค.
Introductionยถ
LLM(Large Language Model)์์ Embedding model์ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ๋ฒกํฐ๋ก ๋ณํํ๋ ์ค์ํ ์ญํ ์ ํฉ๋๋ค. LLM์ ๋งค์ฐ ํฐ ์ธ์ด ๋ชจ๋ธ์ ์๋ฏธํ๋ฉฐ, ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ฒ๋ฆฌํ๊ณ ๋ฌธ๋งฅ์ ์ดํดํ๊ธฐ ์ํด์๋ ์์ฐ์ด ํ ์คํธ๋ฅผ ์์น์ ํํ(๋ฒกํฐ)์ผ๋ก ๋ฐ๊พธ๋ ๊ณผ์ ์ด ํ์ํฉ๋๋ค. ์ด๋ Embedding model์ด ์ฌ์ฉ๋ฉ๋๋ค.
Embedding์ ๋ชฉ์ ยถ
ํ ์คํธ๋ฅผ ๋ฒกํฐ๋ก ๋ณํํ๋ฉด ๊ฐ ๋จ์ด ๋๋ ๋ฌธ์ฅ์ด ์ผ์ ํ ์ฐจ์์ ๊ฐ์ง๋ ์ค์ํ ๋ฒกํฐ๋ก ํํ๋ฉ๋๋ค. ์ด๋ ๊ฒ ๋ณํ๋ ๋ฒกํฐ๋ ํ ์คํธ ๊ฐ์ ์ ์ฌ์ฑ์ ๋น๊ตํ๊ฑฐ๋ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์ ๋ ฅ์ผ๋ก ์ฌ์ฉ๋ ์ ์์ต๋๋ค.
์๋ฅผ ๋ค์ด, ๋ค์ ๋ ๋ฌธ์ฅ์ด ์์ ๋:
โ๊ณ ์์ด๋ ๊ท์ฝ๋คโ
โ๊ฐ์์ง๋ ๊ท์ฝ๋คโ
Embedding model์ ๋ ๋ฌธ์ฅ์ ์๋ฏธ์ ์ ์ฌ์ฑ์ ๋ฐ์ํ์ฌ ์ด ๋ฌธ์ฅ๋ค์ ์๋ก ๊ฐ๊น์ด ๋ฒกํฐ๋ก ๋ณํํ๊ฒ ๋ฉ๋๋ค. ๋ฐ๋ฉด์ โ์๋์ฐจ๊ฐ ๋น ๋ฅด๋คโ์ ๊ฐ์ ๋ฌธ์ฅ์ ์ด๋ค๊ณผ ๋ฉ๋ฆฌ ๋จ์ด์ง ๋ฒกํฐ๋ก ๋ณํ๋ฉ๋๋ค. ์ด๋ฅผ ํตํด ๋ชจ๋ธ์ ๋ฌธ์ฅ ๊ฐ์ ์๋ฏธ์ ๊ด๊ณ๋ฅผ ๋ฒกํฐ ๊ณต๊ฐ์์ ํ์ตํ ์ ์์ต๋๋ค.
Embedding Model์ ํน์ง์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
๊ณ ์ ๋ ์ฐจ์: Embedding์ ๊ฐ๋ณ์ ์ธ ํฌ๊ธฐ์ ํ ์คํธ๋ฅผ ๊ณ ์ ๋ ์ฐจ์์ ๋ฒกํฐ๋ก ๋ณํํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ํ ๋จ์ด๋ฅผ 300์ฐจ์ ๋ฒกํฐ๋ก ํํํ๊ฑฐ๋, ํ ๋ฌธ์ฅ์ 768์ฐจ์ ๋ฒกํฐ๋ก ํํํ ์ ์์ต๋๋ค.
์๋ฏธ์ ์ ์ฌ์ฑ: Embedding ๋ฒกํฐ๋ ๋จ์ด ๋๋ ๋ฌธ์ฅ์ ์๋ฏธ์ ์ ์ฌ์ฑ์ ๋ํ๋ ๋๋ค. ์ ์ฌํ ์๋ฏธ๋ฅผ ๊ฐ์ง ๋จ์ด๋ค์ ๋ฒกํฐ ๊ณต๊ฐ์์ ์๋ก ๊ฐ๊น์ด ์์น์ ์กด์ฌํ๊ฒ ๋ฉ๋๋ค.
๊ณ ์ฐจ์ ๊ณต๊ฐ: Embedding ๋ฒกํฐ๋ ๊ณ ์ฐจ์ ๊ณต๊ฐ์์ ๋ฌธ๋งฅ์ ์ ๋ณด, ์๋ฏธ์ ์ ๋ณด๋ฅผ ํฌํจํฉ๋๋ค. ์ด ๋ฒกํฐ ๊ณต๊ฐ์์ ๋ฒกํฐ ๊ฐ์ ๊ฑฐ๋ฆฌ ๋๋ ๋ฐฉํฅ์ ์ด์ฉํด ๋จ์ด ๊ฐ ๋๋ ๋ฌธ์ฅ ๊ฐ์ ๊ด๊ณ๋ฅผ ํํํ ์ ์์ต๋๋ค.
๋ํ์ ์ธ Embedding ๋ชจ๋ธยถ
Word2Vec: Word2Vec์ ๊ฐ๋ณ ๋จ์ด๋ฅผ ๊ณ ์ ๋ ํฌ๊ธฐ์ ๋ฒกํฐ๋ก ๋ณํํ๋ ๋ชจ๋ธ์ ๋๋ค. ์ด ๋ชจ๋ธ์ ๋จ์ด์ ์๋ฏธ์ ์ ์ฌ์ฑ์ ๋ฐ์ํ์ฌ, ๋น์ทํ ์๋ฏธ๋ฅผ ๊ฐ์ง ๋จ์ด๋ค์ ๋ฒกํฐ ๊ณต๊ฐ์์ ๊ฐ๊น๊ฒ ๋ฐฐ์นํฉ๋๋ค.
GloVe: GloVe๋ Word2Vec๊ณผ ์ ์ฌํ์ง๋ง, ๋จ์ด์ ๋์ ๋ฑ์ฅ ํ๋ ฌ(co-occurrence matrix)์ ์ฌ์ฉํ์ฌ ๋จ์ด ๊ฐ ๊ด๊ณ๋ฅผ ํ์ตํ๋ ๋ชจ๋ธ์ ๋๋ค. BERT Embeddings:
BERT๋ ๋ฌธ๋งฅ์ ๊ณ ๋ คํ์ฌ ๋จ์ด๋ฅผ ๋ฒกํฐ๋ก ๋ณํํ๋ ๋ชจ๋ธ์ ๋๋ค. ์ด์ ์ Embedding ๋ชจ๋ธ๊ณผ๋ ๋ฌ๋ฆฌ, BERT๋ ๋จ์ด์ ๋ฌธ๋งฅ์ ์๋ฏธ๋ฅผ ๋ฐ์ํ ๋ฒกํฐ๋ฅผ ์์ฑํ๋ฏ๋ก, ๋์ผํ ๋จ์ด๋ผ๋ ๋ค๋ฅธ ๋ฌธ๋งฅ์์๋ ๋ค๋ฅธ ๋ฒกํฐ๋ก ํํ๋ ์ ์์ต๋๋ค. Sentence-BERT (SBERT):
๋ฌธ์ฅ์ ๋ฒกํฐ๋ก ๋ณํํ๋ ๋ชจ๋ธ๋ก, ํนํ ๋ฌธ์ฅ ๊ฐ์ ์ ์ฌ์ฑ์ ์ธก์ ํ๊ฑฐ๋ ์๋ฏธ์ ๋น๊ต๋ฅผ ํ ๋ ์ ์ฉํ๊ฒ ์ฌ์ฉ๋ฉ๋๋ค.
LLM์์ Embedding์ด ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒยถ
์ ๋ ฅ์ผ๋ก์์ Embedding: LLM์ ์ ๋ ฅ๋๋ ํ ์คํธ๋ ๋จผ์ Embedding model์ ํตํด ๋ฒกํฐ๋ก ๋ณํ๋ฉ๋๋ค. ์ด๋ ๊ฒ ๋ฒกํฐ๋ก ๋ณํ๋ ํ LLM์ ์ฒซ ๋ฒ์งธ ๋ ์ด์ด์ ์ ๋ฌ๋์ด ์ถ๊ฐ์ ์ธ ์ฒ๋ฆฌ(์: ์ดํ ์ ๋ฉ์ปค๋์ฆ)๋ฅผ ๋ฐ์ต๋๋ค.
์์ฉ: Embedding์ ๋ฌธ์ ๊ฒ์, ์ถ์ฒ ์์คํ , ๋ฌธ์ฅ ์ ์ฌ๋ ์ธก์ , ์์ฐ์ด ์์ฑ ๋ฑ์์ ์์ฃผ ์ฌ์ฉ๋ฉ๋๋ค. ์๋ฅผ ๋ค์ด, ๊ฒ์ ์์ง์ ๋ฌธ์์ ์ฟผ๋ฆฌ ๊ฐ์ ์ ์ฌ์ฑ์ ๋ฒกํฐ ๊ณต๊ฐ์์ ๊ณ์ฐํ์ฌ ๊ด๋ จ ๋ฌธ์๋ฅผ ๋ฐํํ ์ ์์ต๋๋ค.
OpenAI์ ์๋ฒ ๋ฉ ๋ชจ๋ธยถ
OpenAI๋ 3์ธ๋ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์ ๊ณตํฉ๋๋ค. ๋ณดํต ๋ชจ๋ธ ID์ โ-3โ์ ๋ถ์ฌ ๋ํ๋ ๋๋ค. ์ธํ ํ ํฐ๋น ๊ฐ๊ฒฉ์ ์๋ ์ ๊ฐ์ต๋๋ค.
# 1๋ถํฐ 5๊น์ง์ ํฉ์ ๊ณ์ฐํ๋ ์ฝ๋
total = 0
for i in range(1, 6):
total += i
print("1๋ถํฐ 5๊น์ง์ ํฉ์:", total)
Referencesยถ
Title |
์ค๋ช |
๋น๊ณ |
---|---|---|
์๋ฒ ๋ฉ์ ๋ํ ๊ธฐ์ด ๊ฐ๋ ์ค๋ช ํด์ฃผ๋ 5๋ถ์ง๋ฆฌ ์์ |
||
๋ชจ๋์ AI์์ ์ ๊ณตํ๋ Retrieval ๊ฐ์์ Text embedding ํํธ |