ТВОЙ24/7AI АГЕНТ В ЭСТОНИИ.
Запускай Claude Code, OpenClaw, RAG-пайплайны и небольшие локальные языковые модели на собственном VPS. Тяжёлые вычисления берут на себя API-модели, а твои сессии, файлы и данные остаются полностью под твоим контролем на сервере.
Зачем переносить ИИ на сервер?
Ноутбук — для экспериментов. Сервер — для работы. VPS держит сессию агента активной и выполняет вебхуки, запланированные сценарии, RAG-базы и приватные инструменты даже тогда, когда твой компьютер выключен.
- Стабильность: tmux/systemd держат агентов в работе
- Доступ: SSH, Tailscale, Caddy, HTTPS
- Контроль: файлы, векторные базы и логи на твоём сервере
Небольшие локальные модели
Экосистема открытых весов
Небольшие модели с открытыми весами отлично подходят для приватности, RAG, классификации, суммаризации и внутренних инструментов. Большие модели уровня frontier (DeepSeek V4, Qwen3-235B, Llama 4 Maverick, Kimi K2.6) обычно требуют отдельной GPU-конфигурации или внешнего inference-сервиса.
- ✓ Фиксированная ежемесячная стоимость — без сюрпризов
- ✓ Данные остаются на 100% на твоём сервере
- ✓ Настраиваемые модели (fine-tuning, LoRA)
Автономные агенты
На базе API
Агенты на базе API, где тяжёлые вычисления выполняются на серверах провайдера (Anthropic, OpenAI, Google). Твой VPS хранит память агента, сценарии, файлы и сессии. tmux держит сессию живой, Tailscale делает соединение безопасным.
- ✓ Агент работает круглосуточно, даже когда ты закрыл терминал
- ✓ Pay-per-token — платишь только за использование
- ✓ Frontier-модели 2026 года: GPT-5.5, Claude Opus 4.8 / Fable 5, Gemini 3.1 Pro — созданы для сложного анализа кода, агентных сценариев и работы с длинным контекстом.
Твой сервер — твои правила.
Чистый Linux, root-доступ и полная свобода в выборе того, что запускать. Вот несколько примеров.
Локальные LLM
Небольшие модели с открытыми весами (Gemma 4, Phi-4, меньший Qwen3) идеальны для приватного RAG, классификации и внутренних инструментов. Большим моделям нужна отдельная GPU-конфигурация.
RAG-пайплайны
Подключи к ИИ свои чувствительные документы, базы данных и внутреннюю вики. Данные остаются под твоим контролем, а не в облаке третьей стороны.
Автономные агенты
Claude Code, Hermes и другие агенты в сессии tmux. Поставь задачу и дай агенту работать в фоне — обрыв SSH-соединения не помешает.
LoRA, адаптеры и AI Lab
Эксперименты с LoRA/адаптерами на небольших моделях возможны на сервере подходящего размера. Обучение больших моделей и более тяжёлый GPU-inference требуют отдельного железа или индивидуальной конфигурации AI Lab.
Три самых полезных агента на твоём сервере.
Твой виртуальный Senior-разработчик.
Claude Code — это CLI-агент, который читает твою кодовую базу, пишет тесты и делает Git-коммиты. На VPS он работает в сессии tmux. Ты даёшь ему задачу с телефона, кладёшь телефон в карман, а агент в фоне продолжает рефакторить файлы.
Открываешь Termius на телефоне → SSH на свой VPS
В сессии tmux даёшь Claude Code задачу
Убираешь телефон, агент работает в фоне
Через 2 часа — работа готова, ты проверяешь результат через Caddy
Это vibe coding во всей красе.
Твой личный ИИ-ассистент 24/7.
OpenClaw превращает твой VPS в личного ассистента, который живёт в твоём WhatsApp, Telegram или Slack. Он умеет искать в интернете, запускать скрипты, читать почту и отправлять напоминания. Состояние и память остаются на 100% на твоём сервере.
Софт бесплатный — ты платишь только за использование API выбранной модели
Выбирай модель сам: Claude Opus 4.8, GPT-5.5, Gemini 3.1 Pro, DeepSeek V4 — или используй локальную Ollama
Открытый код — адаптируй и расширяй под свои нужды
В отличие от SaaS-решений, ты сам контролируешь каждый слой — от модели до инфраструктуры.
Агент, который учится на твоих сценариях.
Hermes Agent (Nous Research) — самый серьёзный конкурент OpenClaw: он не просто выполняет задачи, а учится на них. Агент сам создаёт себе навыки на ходу, оттачивает их в процессе работы и накапливает знания между сессиями. Состояние и память остаются на 100% на твоём сервере.
Замкнутый цикл обучения — сам создаёт и улучшает навыки, без ручного создания файлов
Постоянная память между сессиями (поиск FTS5) + семиуровневая модель безопасности
300+ провайдеров моделей (Anthropic, OpenAI, OpenRouter, локальные) + cron и суб-агенты
Одна команда — hermes claw migrate — переносит твои настройки OpenClaw. Тот же VPS, более мощный мозг.
Какой сервер тебе нужен?
Три уровня на выбор — в зависимости от того, запускаешь ли ты агентов на базе API, локальный RAG или более серьёзную AI-лабораторию.
Agent Starter
Сценарии на базе API
- ✓ Claude Code, OpenClaw, Hermes
- ✓ Боты Telegram/Discord, вебхуки, cron
- ✓ Сессии tmux 24/7
- ✓ Достаточно 2–4 ГБ RAM
Рекомендуется для
Соло-разработчик · Хобби-проект · Telegram-бот
Private AI Server
Локальный RAG и небольшие LLM
- ✓ ChromaDB, pgvector, Ollama
- ✓ Gemma 4, Phi-4, меньшие модели Qwen
- ✓ Приватные документы и векторные базы
- ✓ 8–32 ГБ RAM, в зависимости от модели
Рекомендуется для
Внутренний инструмент компании · Приватный RAG · Чувствительно к комплаенсу
AI Lab
Индивидуальная GPU-конфигурация
- ✓ Большие модели с открытыми весами (DeepSeek V4, Qwen3-235B, Llama 4 Maverick, Kimi K2.6)
- ✓ Fine-tuning с LoRA и эксперименты с адаптерами
- ✓ Более тяжёлые inference-нагрузки
- ✓ GPU или отдельная договорённость — типового GPU-тарифа у нас нет, но мы делаем индивидуальные конфигурации
Рекомендуется для
Исследователь · ML-команда · Inference frontier-моделей
Что ты реально делаешь с этим сервером?
Три примера того, как другие разработчики и компании выполняют реальную работу на своём AI-сервере.
Клиентская поддержка в Telegram
Клиент пишет Telegram-боту, OpenClaw принимает сообщение, через RAG достаёт ответ из документации компании и отвечает на естественном языке. Логи и переписка остаются на твоём сервере.
Stack
Стоимость
VPS + небольшая стоимость API, в зависимости от объёма запросов и модели.
Рекомендуемый уровень
AGENT STARTER (VPS 2/3)
Приватный поиск по компании
Внутренняя вики, NDA-документы, файлы проектов — всё векторизовано в ChromaDB или pgvector. Локальная модель (Gemma 4, Phi-4 или меньший Qwen) генерирует ответы. Данные не уходят во внешний AI-API, весь пайплайн работает локально.
Stack
Стоимость
Только стоимость VPS — внешних API-сборов нет, когда весь пайплайн работает локально.
Рекомендуемый уровень
PRIVATE AI SERVER (8–32 ГБ RAM)
Автономный разработчик
Claude Code работает в сессии tmux 24/7. Помогает ревьюить pull request-ы, пишет тесты и рефакторит код по твоей команде. Ты ставишь задачу с телефона через Termius, а агент работает в фоне до готовности.
Stack
Стоимость
VPS + подписка Claude Max или оплата API.
Рекомендуемый уровень
AGENT STARTER (VPS 2/3)
Чистая ОС, полная свобода.
Практический гайд по первоначальной настройке VPS. Мы предоставляем unmanaged, чистую ОС (или твой собственный ISO) — а ты строишь поверх неё свою AI-среду.
Unmanaged VPS
Virtuaal.comVirtuaal.com даёт тебе чистый Linux (Ubuntu, AlmaLinux, Debian — или загрузи свой ISO) и root-доступ. Никакого bloatware, никаких ограничивающих промежуточных слоёв. Благодаря чистой ОС не всегда нужен самый большой тариф — для агентов на базе API справится даже VPS 2 или отдельная индивидуальная конфигурация.
Безопасность
How-toПо возможности не открывай SSH всему интернету. Используй Tailscale, фиксированный список разрешённых IP и вход только по SSH-ключу. Если публичный SSH временно нужен, ограничь его по IP и отключи вход по паролю.
1) Установка Tailscale
$ curl -fsSL https://tailscale.com/install.sh | sh
$ sudo tailscale up
2) UFW — SSH только через Tailscale
$ sudo ufw default deny incoming
$ sudo ufw default allow outgoing
$ sudo ufw allow in on tailscale0 to any port 22 proto tcp
$ sudo ufw enable
3) Проверка
$ sudo ufw status verbose
$ tailscale ip -4
Стабильность
Tmux · Systemd · RCtmux и systemd гарантируют, что агенты продолжат работать, даже если твоё SSH-соединение оборвётся.
$ tmux new -s ai-agent
$ cd ~/projects/my-project
$ claude --remote-control
# detach: Ctrl+B, then D — or steer from phone
$ tmux attach -t ai-agent
Новое: Remote Control (claude --remote-control) позволяет управлять той же локальной сессией с телефона или из браузера. tmux/systemd сохраняет процесс активным, а Remote Control даёт доступ откуда угодно (Claude Code v2.1.51+).
Доступ
CaddyReverse proxy Caddy даёт безопасный доступ к веб-интерфейсу. Автоматический SSL от Let’s Encrypt и предельно простая конфигурация.
Caddyfile
ai.sinudomeen.ee {
reverse_proxy localhost:18789
}
Validate & reload
$ sudo caddy validate --config /etc/caddy/Caddyfile
$ sudo systemctl reload caddy
Автоматический HTTPS у Caddy предполагает, что DNS-запись домена указывает на твой VPS и порты 80/443 открыты. Для приватного UI не открывай его в публичный интернет — используй Tailscale, ограничение по IP или Basic Auth.
Усиление SSH (базовое)
sshd_configПосле того как протестируешь вход по SSH-ключу, задай эти значения по умолчанию:
$ sudo sed -i 's/^#\?PasswordAuthentication.*/PasswordAuthentication no/' /etc/ssh/sshd_config
$ sudo sed -i 's/^#\?PermitRootLogin.*/PermitRootLogin no/' /etc/ssh/sshd_config
$ sudo sshd -t
$ sudo systemctl reload ssh
Внимание: Делай это только после того, как успешно протестировал вход по SSH-ключу во ВТОРОЙ SSH-сессии. Иначе ты заблокируешь себе доступ к серверу. sshd -t проверяет синтаксис перед перезагрузкой.
Всё начинается с одной команды.
Выбери вкладку и посмотри, как устанавливается и запускается Claude Code, OpenClaw или Hermes.
Команды приведены для примера. Перед установкой всегда проверяй официальную документацию проекта и никогда не вставляй на сервер непроверенные команды установки.
# Примеры проверены: июль 2026
Плати только за то, что используешь.
Умная маршрутизация моделей держит счета под контролем. Отправляй простые запросы на дешёвую модель, а тяжёлый анализ — на более мощную.
Счёт за VPS приходит от нас — фиксированная ежемесячная сумма независимо от нагрузки. Точные цены и тарифы ты найдёшь на странице серверов.
Посмотреть тарифы →Счёт за API приходит напрямую от провайдера (Anthropic, OpenAI, Google). Ты платишь ровно столько, сколько потребляют твои агенты.
«Какая сегодня погода в Таллинне?» — простой вопрос/чат
«Отрефактори этот модуль и напиши тесты» — сложный анализ кода
(для примера — точная стоимость зависит от модели и размера запроса)
Подписка или API — что выбрать?
Для повседневной работы подписка обычно намного дешевле, чем API с оплатой за токены: одна интенсивная сессия кодинга через API может обойтись в разы дороже месячного тарифа. Важный нюанс — подписка действует только для официальных CLI.
Claude Code → подписка (Pro/Max) — самый выгодный вариант для ежедневного кодинга.
OpenClaw и Hermes → API-ключ, OpenRouter или локальная модель. Сторонние агенты не могут использовать подписку (Anthropic закрыл эту возможность в апреле 2026).
| Сервис | Подписка | Цена/мес | Инструмент |
|---|---|---|---|
| Anthropic Claude | Pro / Max 5x / Max 20x | $20 / $100 / $200 | Claude Code |
| OpenAI ChatGPT | Plus / Pro / Pro | $20 / $100 / $200 | Codex CLI |
| Google Gemini | AI Pro / AI Ultra | ~$20 / ~$100 | Gemini CLI |
| Локально (Ollama) | — | €0 за модель | OpenClaw / Hermes / любой |
* Актуальные цены уточняй у провайдера (они могли измениться с июля 2026 года). Локальная модель = только стоимость VPS, без оплаты за токены.
* Цифры приведены для примера. Реальная стоимость зависит от модели, объёма запросов и длины контекста. USD — официальная валюта API-провайдеров.
Вопросы и ответы
Готов запустить своих ИИ-агентов?
Перенеси среду разработки в облако, где она безопасна, быстра и всегда доступна.