logo
다운로드
languageKRdown
menu
Octoparse CLI

Octoparse를,터미널에서 실행하세요.

팀이 노트북, CI 파이프라인 또는 다음 분기에 출시할 AI 에이전트 안에서 실행할 수 있는 웹 데이터 엔진입니다. 같은 바이너리, 같은 계약입니다.

문서 보기
  • 무료 체험 · 신용카드 불필요
  • 크로스 플랫폼
  • 안정적인 계약

세 팀. 하나의 바이너리

같은 CLI, 같은 종료 코드, 같은 JSON 계약입니다. 노트북, CI 또는 에이전트 루프 어디서 실행해도 동일합니다.

개발자

npm install 한 번이면 됩니다. 내장 엔진으로 로컬 실행하며, 추출된 행은 머신 밖으로 나가지 않습니다.

DevOps 팀

GitHub Actions, Docker, Airflow 또는 cron에 넣으세요. 안정적인 종료 코드와 디스크에 쓰지 않는 환경 변수 인증으로 보안 리뷰를 첫 라운드에 통과하기 쉽습니다.

AI 에이전트

CLI를 Claude, Cursor 또는 자체 에이전트 루프에 전달하세요. JSONL 스트리밍으로 실행이 끝나기 전에 에이전트가 다음 단계를 계획할 수 있습니다.

하나의 명령. 세 가지 배포 사례

노트북, CI 파이프라인 또는 에이전트 내부에서 같은 바이너리를 사용합니다. 온콜 로테이션에 넣을 만큼 예측 가능합니다.

“스탠드업 전에 이 CSV만 있으면 됩니다.”

그로스 애널리스트가 매일 아침 경쟁사 가격을 Jupyter notebook으로 가져옵니다. 한 번 실행하고 한 번 내보내면 커피 전에 최신 시트를 얻고 Selenium을 지켜볼 필요가 없습니다.

$ octoparse run lp-pricing
✓ 248 rows → pricing.csv
설정 시간약 90초
일일 실행 시간< 3분

“주간 데이터 수집에 연결하세요.”

리테일 데이터 팀이 매주 월요일 06:00 UTC에 CI에서 예약 추출을 실행합니다. 안정적인 종료 코드는 성공을 downstream으로, 실패를 온콜로 바로 라우팅하며 유지할 컨테이너가 없습니다.

# .github/workflows/pull.yml
- run: octoparse run $TASK --json
- run: dbt build
온콜 알림7 → 0 / 월
절감된 스택Selenium 플릿

“CLI를 내 에이전트의 도구로 주세요.”

Vertical AI 스타트업이 Claude / Cursor 안에서 CLI를 구조화 도구로 노출합니다. JSONL 스트리밍이 행 단위 피드백을 제공해 실행이 끝나기 전에 다음 단계를 계획할 수 있습니다.

tool: octoparse.run
stream: jsonl
next_action: enrich rows
안정성보장
설정 시간< 2초

팀이 계속 찾는 웹 데이터 엔진

고객이 Octoparse를 선택하고 계속 사용하는 여섯 가지 이유입니다.

바로 사용할 수 있는 글로벌 커버리지

Amazon, LinkedIn, Google Maps, YouTube, Yelp, HN, Reddit 등 200개 이상의 즉시 실행 가능한 템플릿을 제공합니다. 하나의 REST 구조와 동일한 표준 필드를 사용하며 XPath나 셀렉터 유지보수가 필요 없습니다.

8년간 축적된 스크래핑 인프라

브라우저 풀, 프록시 로테이션, anti-bot, 페이지네이션, 구조화 내보내기까지 2018년부터 실전에서 검증되었습니다.

내 데이터. 내 규칙.

실행 결과와 데이터는 모두 고객의 것입니다. 고객을 위해 추출한 데이터를 재판매, 재배포하거나 학습에 사용하지 않습니다. 보관 기간을 설정하고 삭제하면 끝입니다. 각 실행에는 감사하거나 재실행할 수 있는 trace_id가 부여됩니다.

모든 형식의 구조화된 출력

JSON, JSONL, CSV, XLSX, XML을 동일한 표준 구조로 제공합니다. Airbyte, dbt, Airflow 또는 자체 ETL을 통해 Snowflake로 바로 스트리밍할 수 있습니다.

처음부터 AI를 위해 설계

Claude, GPT, Cursor, Cline, Dify, LangChain과 자연스럽게 연동됩니다. JSONL 스트리밍을 통해 실행이 끝나기 전에 에이전트가 다음 단계를 계획할 수 있습니다.

카테고리 최고의 가치

무료 체험, 신용카드 불필요. 이후 투명한 사용량 기반 가격. 여러 팀이 내부 스크래핑 스택을 인건비의 1/18 수준으로 대체했다고 보고합니다.

알림으로 깨울 일이 없을 만큼 조용하게

8년간의 스크래핑 인프라와 이미 프로덕션에서 운영 중인 팀들의 피드백을 기반으로 구축되었습니다.

3M+클라우드 실행 시간
99,97%클라우드 가용성 · 90일
31OS 벤치마크
8년스크래핑 인프라

"세 대의 EC2에서 운영하던 Selenium 플릿을 GitHub Actions의 CLI 호출 하나로 바꿨습니다."

Ravi P. avatarRavi P.Staff DevOps · D2C 리테일 플랫폼

"에이전트 루프가 이를 도구로 호출합니다. JSONL 스트리밍 덕분에 실행이 끝나기 전에 다음 단계를 계획할 수 있습니다. 제품 UX에 큰 변화였습니다."

Elena N. avatarElena N.Founding engineer · vertical-AI 스타트업

"안정적인 종료 코드와 환경 변수 인증 덕분에 보안 리뷰를 첫 라운드에 통과했습니다. 스크래핑 도구에서는 거의 없는 일입니다."

Thomas K. avatarThomas K.보안 아키텍트 · Enterprise SaaS

다음 조직의 데이터 및 AI 팀을 지원합니다

Lumen LabsNorthwindQuanta AIDrift RetailHelio CapitalMosaic.ioPlurabankFieldNoteStride HealthArgon FoodsPivotsoftCobalt & Co.

자주 묻는 질문

스크래퍼는 줄이고 데이터는 유지하세요

무료 체험. 신용카드 불필요. 대부분의 팀은 일일 스탠드업 전에 CI에서 실행합니다.