6. Deployment
Contents
6. Deploymentยถ
Summaryยถ
LLM์ ๋ฐฐํฌ๋ ๋จ์ํ ๊ฐ๋ ฅํ ์ธ์ด ๋ชจ๋ธ์ ์ ํ๋ฆฌ์ผ์ด์ ์ ํตํฉํ๋ ๊ฒ ์ด์์ ๋ณต์กํ ํ๋ก์ธ์ค์ ๋๋ค. ์ด๋ ๋ค์ํ ์์คํ ๊ณผ ๊ตฌ์ฑ ์์๋ฅผ ์กฐ์จํ๋ ๊ฒ์ ํฌํจํ๋ฉฐ, ๊ฐ ๋ถ๋ถ์ด ์ค์ํ ์ญํ ์ ํฉ๋๋ค. LLM ์ ํ๋ฆฌ์ผ์ด์ ์ ์ํคํ ์ฒ๋ ๋ฒกํฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค, ํ๋กฌํํธ ํ ํ๋ฆฟ, ์ค์ผ์คํธ๋ ์ด์ ๋ฐ ์ํฌํ๋ก์ฐ ๊ด๋ฆฌ, ์ธํ๋ผ ๋ฐ ํ์ฅ์ฑ, ๋ชจ๋ํฐ๋ง ๋ฐ ๋ก๊น , ๋ณด์ ๋ฐ ๊ท์ ์ค์, ๊ธฐ์กด ์์คํ ๊ณผ์ ํตํฉ ๋ฑ ์ฌ๋ฌ ํต์ฌ ์์๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
Key Conceptsยถ
๋ฒกํฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค : LLM์ด ์์ฑํ๋ ๊ณ ์ฐจ์ ๋ฐ์ดํฐ๋ฅผ ํจ์จ์ ์ผ๋ก ์ ์ฅํ๊ณ ๊ฒ์ํ๋ ๋ฐ ํ์์ ์ธ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๋๋ค. ์ด๋ ์๋ฏธ ๊ฒ์, ์ถ์ฒ ์์คํ , ๊ฐ์ธํ๋ ์ฌ์ฉ์ ๊ฒฝํ ๋ฑ์ไธๅฏๆฌ ํฉ๋๋ค.
ํ๋กฌํํธ ํ ํ๋ฆฟ : LLM๊ณผ์ ์ํธ์์ฉ์ ํ์คํํ๋ ์ฌ์ ์ ์๋ ๊ตฌ์กฐ๋ก, ๋ชจ๋ธ์ ์๋ต์ ์ผ๊ด์ฑ๊ณผ ์ ๋ขฐ์ฑ์ ๋ณด์ฅํฉ๋๋ค.
์ค์ผ์คํธ๋ ์ด์ ๋ฐ ์ํฌํ๋ก์ฐ ๊ด๋ฆฌ : ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ, ๋ชจ๋ธ ์ถ๋ก , ํ์ฒ๋ฆฌ ๋ฑ ๋ค์ํ ์์ ์ ์๋ํํ๊ณ ์คํธ๋ฆฌ๋ฐํ๋ ๋๊ตฌ์ ํ๋ ์์ํฌ์ ๋๋ค. Apache Airflow๋ Kubernetes์ ๊ฐ์ ๋๊ตฌ๊ฐ ์ด๋ฅผ ์ง์ํฉ๋๋ค.
์ธํ๋ผ ๋ฐ ํ์ฅ์ฑ : LLM ์ ํ๋ฆฌ์ผ์ด์ ์ ์ง์ํ๋ ์ธํ๋ผ๊ฐ ๊ฐ๋ ฅํ๊ณ ํ์ฅ ๊ฐ๋ฅํด์ผ ํฉ๋๋ค. ํด๋ผ์ฐ๋ ์๋น์ค, ํ๋์จ์ด ๊ฐ์๊ธฐ(GPU, TPU), ๋คํธ์ํน ๊ธฐ๋ฅ ๋ฑ์ด ํฌํจ๋ฉ๋๋ค.
๋ชจ๋ํฐ๋ง ๋ฐ ๋ก๊น : ์์คํ ์ฑ๋ฅ, ์ฌ์ฉ ํจํด, ์ ์ฌ์ ์ธ ๋ฌธ์ ์ ๋ํ ์ค์๊ฐ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ ๋ชจ๋ํฐ๋ง ๋๊ตฌ์ ๋ก๊น ๋ฉ์ปค๋์ฆ์ ๋๋ค.
๋ณด์ ๋ฐ ๊ท์ ์ค์ : LLM ๋ฐฐํฌ์๋ ๋ฏผ๊ฐํ ๋ฐ์ดํฐ ๋ณดํธ, ์ ๊ทผ ์ ์ด, GDPR ๋๋ HIPAA์ ๊ฐ์ ๊ด๋ จ ๊ท์ ์ค์๋ฅผ ํฌํจํ๋ ๋ณด์ ์๊ตฌ ์ฌํญ์ด ์์ต๋๋ค.
๊ธฐ์กด ์์คํ ๊ณผ์ ํตํฉ : LLM ์ ํ๋ฆฌ์ผ์ด์ ์ด ๊ธฐ์กด ์์คํ ๊ณผ ์ํฌํ๋ก์ฐ์ ์ํํ๊ฒ ํตํฉ๋์ด์ผ ํฉ๋๋ค.
Referencesยถ
URL ์ด๋ฆ |
URL |
---|---|
DataCamp - Deploying LLM Applications with LangServe |
https://www.datacamp.com/tutorial/deploying-llm-applications-with-langserve |
Lakera - The Ultimate Guide to Deploying Large Language Models Safely |
|
Reddit - Tools for LLM deployment and distribution |
https://www.reddit.com/r/mlops/comments/18p19lq/tools_for_llm_deployment_and_distribution/ |
HatchWorks - How to Deploy an LLM: More Control, Better Outputs |
|
Reddit - Building and Deploying LLM apps to production |
https://www.reddit.com/r/LLMDevs/comments/137g88l/question_building_and_deploying_llm_apps_to/ |