ТВОЙ24/7AI АГЕНТ В ЭСТОНИИ.

Запускай Claude Code, OpenClaw, RAG-пайплайны и небольшие локальные языковые модели на собственном VPS. Тяжёлые вычисления берут на себя API-модели, а твои сессии, файлы и данные остаются полностью под твоим контролем на сервере.

ЛОКАЛЬНЫЙ VS API AI

Зачем переносить ИИ на сервер?

Ноутбук — для экспериментов. Сервер — для работы. VPS держит сессию агента активной и выполняет вебхуки, запланированные сценарии, RAG-базы и приватные инструменты даже тогда, когда твой компьютер выключен.

  • Стабильность: tmux/systemd держат агентов в работе
  • Доступ: SSH, Tailscale, Caddy, HTTPS
  • Контроль: файлы, векторные базы и логи на твоём сервере

Небольшие локальные модели

Экосистема открытых весов

Gemma 4 (E2B/E4B)Phi-4Qwen3Mistral

Небольшие модели с открытыми весами отлично подходят для приватности, RAG, классификации, суммаризации и внутренних инструментов. Большие модели уровня frontier (DeepSeek V4, Qwen3-235B, Llama 4 Maverick, Kimi K2.6) обычно требуют отдельной GPU-конфигурации или внешнего inference-сервиса.

  • Фиксированная ежемесячная стоимость — без сюрпризов
  • Данные остаются на 100% на твоём сервере
  • Настраиваемые модели (fine-tuning, LoRA)

Автономные агенты

На базе API

Claude CodeOpenClawHermes

Агенты на базе API, где тяжёлые вычисления выполняются на серверах провайдера (Anthropic, OpenAI, Google). Твой VPS хранит память агента, сценарии, файлы и сессии. tmux держит сессию живой, Tailscale делает соединение безопасным.

  • Агент работает круглосуточно, даже когда ты закрыл терминал
  • Pay-per-token — платишь только за использование
  • Frontier-модели 2026 года: GPT-5.5, Claude Opus 4.8 / Fable 5, Gemini 3.1 Pro — созданы для сложного анализа кода, агентных сценариев и работы с длинным контекстом.
ЧТО МОЖНО ЗАПУСКАТЬ

Твой сервер — твои правила.

Чистый Linux, root-доступ и полная свобода в выборе того, что запускать. Вот несколько примеров.

Локальные LLM

Локальные LLM

Небольшие модели с открытыми весами (Gemma 4, Phi-4, меньший Qwen3) идеальны для приватного RAG, классификации и внутренних инструментов. Большим моделям нужна отдельная GPU-конфигурация.

ПриватноФиксированная цена
RAG-пайплайны

RAG-пайплайны

Подключи к ИИ свои чувствительные документы, базы данных и внутреннюю вики. Данные остаются под твоим контролем, а не в облаке третьей стороны.

ChromaDBpgvector
Автономные агенты

Автономные агенты

Claude Code, Hermes и другие агенты в сессии tmux. Поставь задачу и дай агенту работать в фоне — обрыв SSH-соединения не помешает.

24/7tmux
LoRA, адаптеры и AI Lab

LoRA, адаптеры и AI Lab

Эксперименты с LoRA/адаптерами на небольших моделях возможны на сервере подходящего размера. Обучение больших моделей и более тяжёлый GPU-inference требуют отдельного железа или индивидуальной конфигурации AI Lab.

LoRAАдаптерыGGUF
Спросить про GPU-конфигурацию →
ТРИ ПРАКТИЧНЫХ AI-СЦЕНАРИЯ

Три самых полезных агента на твоём сервере.

Claude Code
Фокус 1 — Программирование

Твой виртуальный Senior-разработчик.

Платно Anthropic API (pay-per-token)

Claude Code — это CLI-агент, который читает твою кодовую базу, пишет тесты и делает Git-коммиты. На VPS он работает в сессии tmux. Ты даёшь ему задачу с телефона, кладёшь телефон в карман, а агент в фоне продолжает рефакторить файлы.

01

Открываешь Termius на телефоне → SSH на свой VPS

02

В сессии tmux даёшь Claude Code задачу

03

Убираешь телефон, агент работает в фоне

04

Через 2 часа — работа готова, ты проверяешь результат через Caddy

GitTestsRefactorDebug

Это vibe coding во всей красе.

OpenClaw
Фокус 2 — Автоматизация

Твой личный ИИ-ассистент 24/7.

Бесплатная платформа Открытый код

OpenClaw превращает твой VPS в личного ассистента, который живёт в твоём WhatsApp, Telegram или Slack. Он умеет искать в интернете, запускать скрипты, читать почту и отправлять напоминания. Состояние и память остаются на 100% на твоём сервере.

Софт бесплатный — ты платишь только за использование API выбранной модели

Выбирай модель сам: Claude Opus 4.8, GPT-5.5, Gemini 3.1 Pro, DeepSeek V4 — или используй локальную Ollama

Открытый код — адаптируй и расширяй под свои нужды

Интеграции
WhatsAppTelegramDiscordGitHubNotion

В отличие от SaaS-решений, ты сам контролируешь каждый слой — от модели до инфраструктуры.

Фокус 3 — Обучающийся агент

Агент, который учится на твоих сценариях.

Бесплатная платформа Открытый код (MIT)

Hermes Agent (Nous Research) — самый серьёзный конкурент OpenClaw: он не просто выполняет задачи, а учится на них. Агент сам создаёт себе навыки на ходу, оттачивает их в процессе работы и накапливает знания между сессиями. Состояние и память остаются на 100% на твоём сервере.

Замкнутый цикл обучения — сам создаёт и улучшает навыки, без ручного создания файлов

Постоянная память между сессиями (поиск FTS5) + семиуровневая модель безопасности

300+ провайдеров моделей (Anthropic, OpenAI, OpenRouter, локальные) + cron и суб-агенты

Интеграции
TelegramDiscordSlackWhatsAppSignalMCP

Одна команда — hermes claw migrate — переносит твои настройки OpenClaw. Тот же VPS, более мощный мозг.

УРОВЕНЬ И ЖЕЛЕЗО

Какой сервер тебе нужен?

Три уровня на выбор — в зависимости от того, запускаешь ли ты агентов на базе API, локальный RAG или более серьёзную AI-лабораторию.

Самый популярный
Уровень 1

Agent Starter

Сценарии на базе API

  • Claude Code, OpenClaw, Hermes
  • Боты Telegram/Discord, вебхуки, cron
  • Сессии tmux 24/7
  • Достаточно 2–4 ГБ RAM

Рекомендуется для

Соло-разработчик · Хобби-проект · Telegram-бот

VPS 2 / VPS 3 →
Уровень 2

Private AI Server

Локальный RAG и небольшие LLM

  • ChromaDB, pgvector, Ollama
  • Gemma 4, Phi-4, меньшие модели Qwen
  • Приватные документы и векторные базы
  • 8–32 ГБ RAM, в зависимости от модели

Рекомендуется для

Внутренний инструмент компании · Приватный RAG · Чувствительно к комплаенсу

Посмотреть тарифы →
Уровень 3

AI Lab

Индивидуальная GPU-конфигурация

  • Большие модели с открытыми весами (DeepSeek V4, Qwen3-235B, Llama 4 Maverick, Kimi K2.6)
  • Fine-tuning с LoRA и эксперименты с адаптерами
  • Более тяжёлые inference-нагрузки
  • GPU или отдельная договорённость — типового GPU-тарифа у нас нет, но мы делаем индивидуальные конфигурации

Рекомендуется для

Исследователь · ML-команда · Inference frontier-моделей

Запросить предложение →
ТРИ РЕАЛЬНЫХ РЕШЕНИЯ

Что ты реально делаешь с этим сервером?

Три примера того, как другие разработчики и компании выполняют реальную работу на своём AI-сервере.

Blueprint 01

Клиентская поддержка в Telegram

Клиент пишет Telegram-боту, OpenClaw принимает сообщение, через RAG достаёт ответ из документации компании и отвечает на естественном языке. Логи и переписка остаются на твоём сервере.

Stack

OpenClawTelegram Bot APIChromaDBClaude HaikuGemini 3.5 Flash

Стоимость

VPS + небольшая стоимость API, в зависимости от объёма запросов и модели.

Рекомендуемый уровень

AGENT STARTER (VPS 2/3)

Blueprint 02

Приватный поиск по компании

Внутренняя вики, NDA-документы, файлы проектов — всё векторизовано в ChromaDB или pgvector. Локальная модель (Gemma 4, Phi-4 или меньший Qwen) генерирует ответы. Данные не уходят во внешний AI-API, весь пайплайн работает локально.

Stack

OllamaChromaDB / pgvectorGemma 4 / Phi-4LangChain

Стоимость

Только стоимость VPS — внешних API-сборов нет, когда весь пайплайн работает локально.

Рекомендуемый уровень

PRIVATE AI SERVER (8–32 ГБ RAM)

Blueprint 03

Автономный разработчик

Claude Code работает в сессии tmux 24/7. Помогает ревьюить pull request-ы, пишет тесты и рефакторит код по твоей команде. Ты ставишь задачу с телефона через Termius, а агент работает в фоне до готовности.

Stack

Claude CodetmuxGitHub CLITailscaleCaddy

Стоимость

VPS + подписка Claude Max или оплата API.

Рекомендуемый уровень

AGENT STARTER (VPS 2/3)

НАСТРОЙКА И ЖЕЛЕЗО

Чистая ОС, полная свобода.

Практический гайд по первоначальной настройке VPS. Мы предоставляем unmanaged, чистую ОС (или твой собственный ISO) — а ты строишь поверх неё свою AI-среду.

Unmanaged VPS

Virtuaal.com

Virtuaal.com даёт тебе чистый Linux (Ubuntu, AlmaLinux, Debian — или загрузи свой ISO) и root-доступ. Никакого bloatware, никаких ограничивающих промежуточных слоёв. Благодаря чистой ОС не всегда нужен самый большой тариф — для агентов на базе API справится даже VPS 2 или отдельная индивидуальная конфигурация.

VirtFusion dashboard

Безопасность

How-to

По возможности не открывай SSH всему интернету. Используй Tailscale, фиксированный список разрешённых IP и вход только по SSH-ключу. Если публичный SSH временно нужен, ограничь его по IP и отключи вход по паролю.

1) Установка Tailscale

$ curl -fsSL https://tailscale.com/install.sh | sh
$ sudo tailscale up

2) UFW — SSH только через Tailscale

$ sudo ufw default deny incoming
$ sudo ufw default allow outgoing
$ sudo ufw allow in on tailscale0 to any port 22 proto tcp
$ sudo ufw enable

3) Проверка

$ sudo ufw status verbose
$ tailscale ip -4

Стабильность

Tmux · Systemd · RC

tmux и systemd гарантируют, что агенты продолжат работать, даже если твоё SSH-соединение оборвётся.

$ tmux new -s ai-agent
$ cd ~/projects/my-project
$ claude --remote-control
# detach: Ctrl+B, then D — or steer from phone
$ tmux attach -t ai-agent

Новое: Remote Control (claude --remote-control) позволяет управлять той же локальной сессией с телефона или из браузера. tmux/systemd сохраняет процесс активным, а Remote Control даёт доступ откуда угодно (Claude Code v2.1.51+).

Доступ

Caddy

Reverse proxy Caddy даёт безопасный доступ к веб-интерфейсу. Автоматический SSL от Let’s Encrypt и предельно простая конфигурация.

Caddyfile

ai.sinudomeen.ee {
  reverse_proxy localhost:18789
}

Validate & reload

$ sudo caddy validate --config /etc/caddy/Caddyfile
$ sudo systemctl reload caddy

Автоматический HTTPS у Caddy предполагает, что DNS-запись домена указывает на твой VPS и порты 80/443 открыты. Для приватного UI не открывай его в публичный интернет — используй Tailscale, ограничение по IP или Basic Auth.

Усиление SSH (базовое)

sshd_config

После того как протестируешь вход по SSH-ключу, задай эти значения по умолчанию:

$ sudo sed -i 's/^#\?PasswordAuthentication.*/PasswordAuthentication no/' /etc/ssh/sshd_config
$ sudo sed -i 's/^#\?PermitRootLogin.*/PermitRootLogin no/' /etc/ssh/sshd_config
$ sudo sshd -t
$ sudo systemctl reload ssh

Внимание: Делай это только после того, как успешно протестировал вход по SSH-ключу во ВТОРОЙ SSH-сессии. Иначе ты заблокируешь себе доступ к серверу. sshd -t проверяет синтаксис перед перезагрузкой.

ДЕМО ТЕРМИНАЛА

Всё начинается с одной команды.

Выбери вкладку и посмотри, как устанавливается и запускается Claude Code, OpenClaw или Hermes.

Команды приведены для примера. Перед установкой всегда проверяй официальную документацию проекта и никогда не вставляй на сервер непроверенные команды установки.

# Примеры проверены: июль 2026

API И РАСХОДЫ

Плати только за то, что используешь.

Умная маршрутизация моделей держит счета под контролем. Отправляй простые запросы на дешёвую модель, а тяжёлый анализ — на более мощную.

VPS Фиксированная ежемесячная плата

Счёт за VPS приходит от нас — фиксированная ежемесячная сумма независимо от нагрузки. Точные цены и тарифы ты найдёшь на странице серверов.

Посмотреть тарифы →
API Pay-per-token

Счёт за API приходит напрямую от провайдера (Anthropic, OpenAI, Google). Ты платишь ровно столько, сколько потребляют твои агенты.

Phi-4 / Gemini 3.5 Flash ~$0.001

«Какая сегодня погода в Таллинне?» — простой вопрос/чат

GPT-5.5 / Claude Opus 4.8 ~$0.01–$0.05

«Отрефактори этот модуль и напиши тесты» — сложный анализ кода

(для примера — точная стоимость зависит от модели и размера запроса)

Подписка или API — что выбрать?

Для повседневной работы подписка обычно намного дешевле, чем API с оплатой за токены: одна интенсивная сессия кодинга через API может обойтись в разы дороже месячного тарифа. Важный нюанс — подписка действует только для официальных CLI.

Claude Code → подписка (Pro/Max) — самый выгодный вариант для ежедневного кодинга.

OpenClaw и Hermes → API-ключ, OpenRouter или локальная модель. Сторонние агенты не могут использовать подписку (Anthropic закрыл эту возможность в апреле 2026).

Сервис Подписка Цена/мес Инструмент
Anthropic Claude Pro / Max 5x / Max 20x $20 / $100 / $200 Claude Code
OpenAI ChatGPT Plus / Pro / Pro $20 / $100 / $200 Codex CLI
Google Gemini AI Pro / AI Ultra ~$20 / ~$100 Gemini CLI
Локально (Ollama) €0 за модель OpenClaw / Hermes / любой

* Актуальные цены уточняй у провайдера (они могли измениться с июля 2026 года). Локальная модель = только стоимость VPS, без оплаты за токены.

* Цифры приведены для примера. Реальная стоимость зависит от модели, объёма запросов и длины контекста. USD — официальная валюта API-провайдеров.

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Вопросы и ответы

Готов запустить своих ИИ-агентов?

Перенеси среду разработки в облако, где она безопасна, быстра и всегда доступна.