Skip to content

Discipline-слой для AI-кодинг-агентов

AI-агенты, которые
не врут «готово».

Локальный Python-фреймворк, который перехватывает Claude Code, Cursor, Qwen и Windsurf в двух точках, где AI-агенты врут чаще всего: старт задачи без цели и заявление «готово» без доказательств. Три сообщения покрывают весь цикл.

ed25519 подписанные чеки·Apache 2.0·Python 3.11+·4 445 тестов проходит·0 core-зависимостей
~/your-project — claude code
agent › Edit("src/auth.py", "...")tausik › BLOCKED — no active task (SENAR Rule 9.1) you › start workingtausik › session #74 opened · handoff loaded · memory tail refreshed you › fix the mobile button bugtausik › 4 edge cases collected → task T-219 · 3 AC draftedQG-0 passed · goal + AC locked pytest · ruff · tsc · 6 review agents · cachedQG-2 passed · every AC has evidence you › ship ittausik › tausik verify · cached 10m · committed a91f3e2 push? [y/N] _

Проблема · Механизм

Без TAUSIK vs С TAUSIK

Принуждение, а не подсказка. Агент физически не может пропустить шаг — хук блокирует Write/Edit до того, как tool call долетит до runtime.

Без TAUSIK
С TAUSIK
Агент говорит "сейчас быстро отрефакторю" и правит 30 файлов.
task_gate.py хук возвращает: BLOCKED — нет активной задачи (SENAR Rule 9.1).QG-0
Агент рапортует "Готово, всё зелёное" — без запуска тестов.
task_done_verify блокирует закрытие: у AC #2 нет evidence-строки в verification_runs.QG-2
Новая сессия стартует чистой. Агент задаёт те же вопросы заново.
SessionStart хук инжектит handoff + memory tail. Последнее решение и dead-end грузятся вместе с CLAUDE.md.
Через два дня агент пытается тот же неработающий подход.
tausik dead-end сохраняет провальные подходы. Search всплывает их до того, как агент сожжёт ещё токены.
Агент гоняет "очевидные тесты" — обычно никаких.
tausik verify запускает матрицу из 25 стеков (pytest, ruff, tsc, eslint, cargo, go vet, hadolint…) и кэширует результат.
Спрашиваешь "что изменилось?" — читаешь 200 строк чата.
tausik metrics печатает throughput, defect rate, lead time, cost-per-task. Каждый gate-exit лежит в events.

Проверяемое доверие · differentiator

Когда агент говорит «зелёно» —
ты получаешь чек.

Именно это отличает TAUSIK от любого prompt-based свода правил. «Зелёно» — не утверждение на веру, а ed25519-подписанный чек, привязанный к конкретному гейту и HEAD-коммиту. Нельзя подделать, нельзя переиграть, проверяется офлайн.

tausik verify выдаёт подписанный чек

Формат tausik-signed/v1, ed25519, привязан к сигнатуре гейта и sha HEAD-коммита.

task done проверяет его перед закрытием

«Зелёно», которого на самом деле не было — или было для другого коммита — валит QG-2.

Чеки переносимы

Экспортируй один и проверь офлайн: без SDK, через stateless HTTP-эндпоинт или no-SDK пример.

Релизы тоже подписаны

Установка скиллов и стеков проверяет подпись до записи единого байта на диск.

tausik verify → чек
you › tausik verify --task T-219 tausik › pytest · ruff · tsc passed receipt tausik-signed/v1 alg ed25519 gate a1b2c3… · head a91f3e2 sig 3045022100… ✓ valid tausik › task done · QG-2 reads receipt
Как работают подписанные чеки

Когда агент говорит, что билд зелёный, тебе не нужно верить. У тебя есть чек, который это доказывает — или доказывает, что агент соврал.

Жизненный цикл задачи

Три сообщения. Полный цикл.

Ты описываешь что хочешь. Фреймворк принуждает к шагам, которые ты пропускаешь, когда слишком доверяешь агенту.

01 старт сессии
сообщение 1 из 3
you › start working tausik › session #74 opened handoff: fix(auth): retry on 401 memory tail: 14 patterns · 3 gotchas CLAUDE.md refreshed last commit: a14c2bf · 2h ago ready.

Открывает сессию, грузит handoff с прошлой, обновляет memory-tail в CLAUDE.md.

02 жизненный цикл задачи
сообщение 2 из 3
you › fix the bug — button doesn't work on mobile tausik › interviewing on edge cases…4 edge cases collected task T-219 · 3 AC draftedQG-0 passed writing code → pytest · ruff · tsc5 review agents · parallel AC evidence: 3 / 3QG-2 passed

Опрашивает тебя про edge cases, создаёт задачу с acceptance criteria, пишет код, гоняет тесты + линтеры + 6 review-агентов параллельно, проверяет evidence в БД для каждого AC.

03 релиз
сообщение 3 из 3
you › ship it tausik › $ tausik verify cache hit · 10m TTLQG-2 passed staging 7 files commit a91f3e2 "fix(ui): mobile button"  push to origin/main?[y/N] _

Запускает tausik verify (кэш 10 мин), проходит QG-2, коммитит, спрашивает перед push.

Что внутри

Шесть вещей, ни одна не опциональная.

Фреймворк маленький намеренно. Каждый кусок принуждает к одному конкретному поведению.

Quality gates

QG-0 блокирует task start без цели и AC. QG-2 блокирует task done без verify-evidence.

Память проекта

SQLite + FTS5 для паттернов, gotchas, решений, тупиков. Перезагружается в начале сессии.

Verify-First

Тяжёлые тесты на отдельном verify-шаге, кэшируются 10 минут; закрытие задачи — миллисекунды.

21 real-time хуков

Task-гейт, bash-firewall, push-гейт, авто-формат, memory-аудиты — блокируют плохие действия до того, как они случатся.

124 MCP-инструментов

Полный программный доступ к БД проекта. Одинаково работает в Claude Code, Cursor, Qwen Code, Windsurf.

Cross-project brainопционально

Зеркалирование решений, паттернов, gotchas в Notion с приватными project-хешами.

Быстрый старт — 10 минут (после установки AI IDE)

Четыре команды, потом перезапусти IDE.

Bootstrap сам определяет твой стек (Python, TS, Rust, Go) и включает подходящие quality gates.

bash
# 1 · go to your project
$ cd your-project

# 2 · add tausik-core as a submodule
$ git submodule add https://github.com/Kibertum/tausik-core .tausik-lib

# 3 · bootstrap (detects stack, wires hooks)
$ python .tausik-lib/bootstrap/bootstrap.py --init

# 4 · ignore local state
$ echo ".tausik/" >> .gitignore

Перезапусти IDE — готово. Bootstrap сам определяет стек и включает подходящие гейты.

Dogfooding

TAUSIK построил TAUSIK.

Каждая фича, каждый рефакторинг, каждый багфикс прошли через те же gates, которые поставляются с фреймворком. Числа ниже — состояние самого dogfood-проекта.

800+
задач закрыто — каждая с целью + AC
0
задач закрыто без verify-evidence
4 445
тестов проходит
0
core-зависимостей / phone-home вызовов

Снимок на момент v1.5.6. Живые числа — через tausik metrics.

Поддерживаемые IDE и агенты

Шесть рантаймов. Один слой принуждения.

VSCode + Claude Extension
Официально протестировано
Cursor
Официально протестировано
Claude Code (CLI)
Ожидается · частичная матрица
Qwen Code
Ожидается · частичная матрица
Windsurf
Ожидается · частичная матрица
Codex / OpenCode-style агенты
Ожидается · ручная валидация

124 MCP-инструментов и 13 core-скиллов работают везде. Real-time хуки сегодня живут в Claude Code и Qwen Code; Cursor и Windsurf получают то же принуждение на переходах QG-0 и QG-2.

Ясность

TAUSIK — это не…

Расставляем ожидания до установки.

Не SaaS.
Всё работает локально. БД задач лежит в .tausik/ рядом с твоим кодом. Никакой phone-home, телеметрии, обязательного аккаунта.
Не модель.
TAUSIK не генерирует код. Он сторожит существующего coding-агента (Claude Code, Cursor, Qwen, Windsurf) и трекает его работу.
Не замена Cursor / Claude Code.
Работает внутри них как MCP-инструменты, хуки и скиллы. Твой IDE-workflow сохраняется.
Не tool для онбординга джунов.
Принуждает к практике инженеров, которые уже знают как выглядит good — он не объясняет что такое AC.
Не авто-merge.
QG-0 и QG-2 требуют у агента доказательств; финальное push агент всё равно подтверждает у тебя.

Ландшафт

Чем TAUSIK отличается.

Одна строка — одна возможность. Пустая ячейка — инструмент не закрывает её нативно.

CapabilityTAUSIKAiderCursor RulesContinueClaude Skills
Enforced task-модель (goal + AC)✓ QG-0 хук блокирует правки
Подписанные verify-чеки (ed25519)✓ tausik-signed/v1
Verify-кеш отделён от close✓ 10-мин TTL
Tracked decisions / dead-ends✓ SQLite + FTS5
Cross-project memory (опционально)✓ Notion-backed brain
Stack-aware verify-сьюты✓ 25 стековsingle-language
Multi-IDE один surface✓ MCP + skillsтолько CLIтолько Cursorтолько Continueтолько Claude
Editor-agnostic install✓ Python-скрипт

Ответы

Частые вопросы.

Нужен ли отдельный API-ключ помимо AI-IDE?

Нет. TAUSIK никогда не зовёт LLM напрямую. Агент (Claude Code / Cursor / Qwen / Windsurf) использует тот API-ключ, который ты уже настроил для своего IDE.

Phone home есть?

Нет. Всё локально: SQLite в .tausik/, хуки в .claude/. Опциональный Shared Brain пишет только в твой Notion-workspace, если ты сам его подключишь.

Можно ли шарить decisions/patterns в команде?

Да, через опциональный Shared Brain. Per-project хеши прячут имена; cross-project контент проходит scrubbing-линтер перед записью в Notion.

Windows работает?

Да. CLI ставит .tausik/tausik.cmd для PowerShell/cmd. Несколько хуков (pre-commit shell, push gate) предпочитают Git Bash или WSL; остальной pipeline идёт нативно.

А мой текущий AGENTS.md / CLAUDE.md?

TAUSIK управляет маленьким dynamic-блоком внутри CLAUDE.md (сессия + счётчики). Твои инструкции в CLAUDE.md или AGENTS.md остаются нетронутыми — TAUSIK их читает, но не перезаписывает.

Фундамент

Построено на SENAR.

SENAR

TAUSIK реализует SENAR — открытый инженерный стандарт AI-assisted разработки. Quality gates, управление сессиями, метрики, чек-листы верификации — всё определено в SENAR. Спецификация: senar.tech. А также адаптирует RENAR — стандарт рассуждения и governance (renar.tech) — advisory-first: интерпретация становится видимой на каждом quality gate.