llama-cpp

스킬명: llama-cpp
분류: mlops
공식 경로: mlops/inference/llama-cpp
공식 설명: llama.cpp local GGUF inference + HF Hub model discovery.
작성 순번: 041번
작성 기준: Hermes Agent 공식 Bundled Skills Catalog, 2026-06-24 확인

한 줄 요약

llama-cpp는 MLOps·모델 운용 영역에서 llama.cpp 로컬 추론·GGUF 운용을 안정적으로 수행하도록 Hermes Agent의 행동 기준, 도구 사용 순서, 검증 관점을 제공하는 번들 스킬입니다.

공식 설명 번역

공식 Bundled Skills Catalog의 설명은 다음과 같습니다.

llama.cpp local GGUF inference + HF Hub model discovery.

이를 한국어 실무 문맥으로 옮기면 다음과 같습니다.

llama.cpp 로컬 추론·GGUF 운용 스킬을 수행할 때 Hermes가 어떤 도구를 우선 확인하고, 어떤 순서로 작업하며, 결과를 어떻게 사용자에게 보고해야 하는지 알려주는 기본 스킬입니다.

공식 상세 문서에서 확인되는 주요 단서는 다음과 같습니다.

스킬 출처: Bundled, 설치 시 기본 제공
스킬 경로: mlops/inference/llama-cpp
분류: mlops / MLOps·모델 운용
관련 키워드 또는 도구 단서: llama, content, apple, autonomous-ai-agents, computer-use, creative

이 스킬이 해결하는 문제

에이전트는 같은 요청을 받아도 플랫폼, 도구, 권한, 산출물 형식에 따라 전혀 다른 접근을 해야 합니다. llama-cpp 스킬은 이 차이를 명시해, 일반적인 추측으로 처리하기 어려운 작업을 더 안정적으로 만듭니다.

이 스킬은 특히 다음 문제를 줄여줍니다.

MLOps·모델 운용 작업에서 어떤 도구나 절차를 먼저 써야 하는지 모호한 문제
사용자의 요청을 일반 답변으로만 처리하고 실제 작업·검증까지 이어가지 못하는 문제
플랫폼별 권한, 파일 위치, 출력 형식, 후속 보고 방식을 혼동하는 문제
반복 업무에서 매번 같은 운영 기준을 다시 설명해야 하는 문제
결과를 만들었지만 실제로 사용할 수 있는 상태인지 확인하지 않는 문제

핵심 동작 구조

flowchart TD
  A[사용자 요청 수신] --> B[스킬 적용 여부 판단]
  B --> C[공식 설명과 현재 환경 확인]
  C --> D[필요 도구·권한·입력값 점검]
  D --> E[작업 실행]
  E --> F[결과 검증]
  F --> G[사용자에게 요약 보고]

  D --> H{주의 조건}
  H -->|권한/입력 부족| I[명확한 추가 정보 요청]
  H -->|환경 불일치| J[대체 경로 또는 제한 사항 보고]

이 구조에서 중요한 점은 llama-cpp이 단순 지식 설명이 아니라 작업 순서와 판단 기준을 제공하는 실행 보조 문서라는 점입니다.

적합한 사용 상황

이 스킬은 다음 상황에 적합합니다.

사용자가 MLOps·모델 운용 영역의 구체적인 작업을 요청했을 때
공식 도구, 플랫폼, 파일, API, CLI 중 무엇을 써야 하는지 판단해야 할 때
단순 설명보다 실제 실행·검증·보고가 필요한 요청일 때
비슷한 작업을 여러 번 반복하며 품질을 일정하게 유지해야 할 때
결과물을 mdweb2 문서, 코드, 설정, 리포트, 메시지 등으로 남겨야 할 때

예를 들어 다음과 같은 요청에서 이 스킬이 유용합니다.

이 모델을 내려받아 로컬 추론 가능 여부를 확인해줘.

vLLM으로 서빙할 때 필요한 설정과 검증 절차를 정리해줘.

부적합하거나 주의해야 할 상황

다음 상황에서는 이 스킬만으로 충분하지 않거나 추가 판단이 필요합니다.

현재 Hermes 프로필에 필요한 도구가 설치되어 있지 않은 경우
외부 서비스 인증, API 키, OAuth, CLI 로그인이 필요한데 아직 준비되지 않은 경우
사용자가 요청한 작업이 다른 플랫폼이나 다른 스킬의 영역인 경우
결과에 개인정보, 토큰, 내부 경로, 비공개 문서가 포함될 가능성이 있는 경우
공식 문서와 현재 설치 버전의 동작이 달라 검증이 필요한 경우

특히 번들 스킬 문서를 읽을 때는 “공식적으로 제공되는 스킬”과 “현재 프로필에 설치·활성화된 스킬”을 구분해야 합니다. 공식 Bundled Skills Catalog에 있더라도 사용자의 로컬 프로필에서 삭제되었거나 수정되었을 수 있습니다.

실제 사용 예시

예시 1. 기본 작업 요청 처리

사용자가 이렇게 요청할 수 있습니다.

이 모델을 내려받아 로컬 추론 가능 여부를 확인해줘.

이때 Hermes는 다음 순서로 처리하는 것이 좋습니다.

요청이 llama-cpp 스킬의 범위에 들어가는지 판단합니다.
필요한 도구, 파일, 계정, 실행 환경이 있는지 확인합니다.
실제 작업을 수행합니다.
결과가 사용 가능한지 검증합니다.
사용자에게 “무엇을 했고, 어디에서 확인할 수 있고, 남은 제한은 무엇인지”를 짧게 보고합니다.

예시 2. 결과 검증이 필요한 요청

vLLM으로 서빙할 때 필요한 설정과 검증 절차를 정리해줘.

예상 처리 흐름:

입력값과 목표 산출물을 분리합니다.
스킬 문서의 권장 흐름에 따라 작업을 실행합니다.
가능하면 실제 명령, API 응답, 파일 존재 여부, 브라우저 렌더링 등으로 검증합니다.
검증하지 못한 부분은 “추정”이 아니라 “미검증”으로 명시합니다.

함께 쓰기 좋은 스킬

관련 스킬	함께 쓰는 이유
`mlops-llm-lifecycle`	모델 탐색·서빙·평가의 상위 흐름과 연결됩니다.
`jupyter-live-kernel`	실험과 분석을 반복합니다.
`software-delivery-lifecycle`	실험 산출물을 배포 가능한 형태로 정리합니다.

사용 흐름 마인드맵

# llama-cpp

## 적용 판단
- 공식 설명 확인
- 적용 상황 판단
- 필요 도구/권한 확인
- 작업 실행
- 결과 검증
- 사용자에게 간결히 보고

## 입력 확인
- 사용자 요청
- 대상 플랫폼/파일/서비스
- 인증과 권한
- 출력 형식

## 실행
- 공식 문서 기준 절차 확인
- 필요한 도구 호출
- 중간 결과 점검
- 오류 시 대체 경로 검토

## 검증
- 파일/응답/렌더링 확인
- 로그와 에러 확인
- 사용자가 바로 쓸 수 있는 형태인지 판단

## 보고
- 수행 결과
- 생성 위치
- 검증 결과
- 남은 제한 사항

실무적 해설

llama-cpp 스킬의 가치는 “이 분야를 설명한다”보다 에이전트가 작업을 잘못된 방식으로 시작하지 않게 한다는 데 있습니다. 기술 작업에서 가장 흔한 실패는 실행 자체가 아니라, 처음에 잘못된 도구나 잘못된 전제를 잡는 것입니다.

공식 상세 문서의 일부 단서는 다음과 같이 요약할 수 있습니다.

Llama Cpp — llama | Hermes Agent Skip to main content Hermes Agent Docs Skills Download English English 简体中文 Home GitHub Discord User Stories & Use Cases Getting Started Using Hermes Features Overview Tool Gateway Core Automation Media & Web Management Skills Bundled Skills Catalog Optional Skills Catalog Bundled apple autonomous-ai-agents computer-use creative data-science dogfood email github media mlops Audiocraft Audio Generation Huggingface Hub Llama Cpp Evaluating Llms Harness Segment Anyt

위 내용을 그대로 외우는 것보다 중요한 것은, 요청을 받았을 때 다음 질문을 빠르게 던지는 것입니다.

이 요청은 정말 llama-cpp 스킬의 범위인가?
필요한 인증, 파일, 도구, 플랫폼 접근 권한이 있는가?
결과물을 어디에 남겨야 하는가?
성공 여부를 어떻게 확인할 수 있는가?
사용자에게 보고할 때 불필요한 내부 절차를 노출하지 않아도 되는가?

운영 체크리스트

요청이 llama-cpp 요청이 `llama-cpp` 스킬의 적용 범위인지 확인했다.
공식 문서 기준 설명과 현재 로컬 환경의 차이를 구분했다.
필요한 도구, 인증, 파일, 네트워크 접근 가능성을 확인했다.
작업 결과를 실제로 검증했다.
검증하지 못한 부분은 명확히 표시했다.
사용자에게 최종 결과와 위치, 남은 제한 사항을 간결하게 보고했다.

이 스킬의 한계

llama-cpp는 MLOps·모델 운용 작업을 돕는 번들 스킬이지만, 모든 상황을 자동으로 해결하지는 않습니다. 특히 다음은 별도 확인이 필요합니다.

현재 설치된 Hermes 버전과 공식 문서의 차이
로컬 프로필에서 해당 스킬이 삭제·수정되었는지 여부
외부 서비스의 인증 상태와 권한 범위
사용자가 요구한 산출물의 공개 가능 여부
실행 결과의 보안·개인정보 영향

따라서 이 스킬은 “무조건 실행하라”는 명령이 아니라, 작업을 안전하고 일관되게 시작하기 위한 기준점으로 보는 것이 적절합니다.

문서 작성 체크리스트

공식 문서 또는 SKILL.md 원문을 확인했다.
공식 설명과 실무 해설을 분리했다.
사용 예시를 최소 2개 넣었다.
추천 대상과 비추천/주의 상황을 모두 적었다.
관련 스킬을 연결했다.
published `published` 값에 실제 작성 시각의 시분초가 포함되어 있다.
백그라운드 이미지가 hermes_bg.png 백그라운드 이미지가 `hermes_bg.png`로 지정되어 있다.
mdweb2에서 해석 가능한 Mermaid와 Markmap 문법을 필요한 범위에서 사용했다.