μλ²
Contents
μλ²ΒΆ
μμ½ΒΆ
LLM(λν μΈμ΄ λͺ¨λΈ)μμ μλ²λ μ¬μ©μ μμ²μ μ²λ¦¬νκ³ λͺ¨λΈμ μ λ¬νλ μν μ ν©λλ€. μλ²λ HTTP/gRPC μμ²μ κ΄λ¦¬νκ³ , μμ²μ νμ μ μ₯νμ¬ λͺ¨λΈμ΄ μ²λ¦¬ν μ μλλ‘ ν©λλ€. λν, μλ²λ λͺ¨λΈμ μ±λ₯μ μΈ‘μ νλ μ§νμΈ μ²λ¦¬λ(throughput)κ³Ό μ§μ° μκ°(latency)μ μ 곡ν©λλ€. μλ²λ λ€μν νλ μμν¬μ ν¨κ» μ¬μ©λ μ μμΌλ©°, λͺ¨λΈμ ν¨μ¨μ μΌλ‘ λ°°ν¬νκ³ κ΄λ¦¬νλ λ° μ€μν μν μ ν©λλ€.
μ£Όμ κ°λ ΒΆ
μλ² μν : μ¬μ©μ μμ²μ μ²λ¦¬νκ³ λͺ¨λΈμ μ λ¬νλ μν μ ν©λλ€.
μμ² ν : μ¬μ©μ μμ²μ μ μ₯νμ¬ λͺ¨λΈμ΄ μ²λ¦¬ν μ μλλ‘ ν©λλ€.
μ²λ¦¬λ(throughput) : λͺ¨λΈμ΄ μ²λ¦¬ν μ μλ μμ²μ μλ₯Ό λνλ λλ€.
μ§μ° μκ°(latency) : λͺ¨λΈμ΄ μμ²μ μ²λ¦¬νλ λ° κ±Έλ¦¬λ μκ°μ λνλ λλ€.
λ°°μΉ μ²λ¦¬ : μ¬λ¬ μμ²μ ν λ²μ μ²λ¦¬νμ¬ ν¨μ¨μ±μ λμ λλ€.
μ°Έκ³ μλ£ΒΆ
URL μ΄λ¦ |
URL |
---|---|
Run:ai |
|
AI on OpenShift |
|
LM Studio |
|
mariochavez/llm_server |
|
Puget Systems |
https://www.pugetsystems.com/labs/hpc/llm-server-setup-part-1-base-os/ |