Discipline-слой для AI-кодинг-агентов

AI-агенты, которые
не врут «готово».

Локальный Python-фреймворк, который перехватывает Claude Code, Cursor, Qwen и Windsurf в двух точках, где AI-агенты врут чаще всего: старт задачи без цели и заявление «готово» без доказательств. Три сообщения покрывают весь цикл.

Начать →Открыть GitHub

ed25519 подписанные чеки·Apache 2.0·Python 3.11+·4 445 тестов проходит·0 core-зависимостей

~/your-project — claude code

agent › Edit("src/auth.py", "...")tausik › BLOCKED — no active task (SENAR Rule 9.1) you › start workingtausik › session #74 opened · handoff loaded · memory tail refreshed you › fix the mobile button bugtausik › 4 edge cases collected → task T-219 · 3 AC draftedQG-0 passed · goal + AC locked pytest · ruff · tsc · 6 review agents · cachedQG-2 passed · every AC has evidence you › ship ittausik › tausik verify · cached 10m · committed a91f3e2 push? [y/N] _

Проблема · Механизм

Без TAUSIK vs С TAUSIK

Принуждение, а не подсказка. Агент физически не может пропустить шаг — хук блокирует Write/Edit до того, как tool call долетит до runtime.

Без TAUSIK

С TAUSIK

Агент говорит "сейчас быстро отрефакторю" и правит 30 файлов.

task_gate.py хук возвращает: BLOCKED — нет активной задачи (SENAR Rule 9.1).QG-0

Агент рапортует "Готово, всё зелёное" — без запуска тестов.

task_done_verify блокирует закрытие: у AC #2 нет evidence-строки в verification_runs.QG-2

Новая сессия стартует чистой. Агент задаёт те же вопросы заново.

SessionStart хук инжектит handoff + memory tail. Последнее решение и dead-end грузятся вместе с CLAUDE.md.

Через два дня агент пытается тот же неработающий подход.

tausik dead-end сохраняет провальные подходы. Search всплывает их до того, как агент сожжёт ещё токены.

Агент гоняет "очевидные тесты" — обычно никаких.

tausik verify запускает матрицу из 25 стеков (pytest, ruff, tsc, eslint, cargo, go vet, hadolint…) и кэширует результат.

Спрашиваешь "что изменилось?" — читаешь 200 строк чата.

tausik metrics печатает throughput, defect rate, lead time, cost-per-task. Каждый gate-exit лежит в events.

Проверяемое доверие · differentiator

Когда агент говорит «зелёно» —
ты получаешь чек.

Именно это отличает TAUSIK от любого prompt-based свода правил. «Зелёно» — не утверждение на веру, а ed25519-подписанный чек, привязанный к конкретному гейту и HEAD-коммиту. Нельзя подделать, нельзя переиграть, проверяется офлайн.

tausik verify выдаёт подписанный чек

Формат tausik-signed/v1, ed25519, привязан к сигнатуре гейта и sha HEAD-коммита.

task done проверяет его перед закрытием

«Зелёно», которого на самом деле не было — или было для другого коммита — валит QG-2.

Чеки переносимы

Экспортируй один и проверь офлайн: без SDK, через stateless HTTP-эндпоинт или no-SDK пример.

Релизы тоже подписаны

Установка скиллов и стеков проверяет подпись до записи единого байта на диск.

tausik verify → чек

you › tausik verify --task T-219 tausik › pytest · ruff · tsc passed receipt tausik-signed/v1 alg ed25519 gate a1b2c3… · head a91f3e2 sig 3045022100… ✓ valid tausik › task done · QG-2 reads receipt ✓

Как работают подписанные чеки →

Когда агент говорит, что билд зелёный, тебе не нужно верить. У тебя есть чек, который это доказывает — или доказывает, что агент соврал.

Жизненный цикл задачи

Три сообщения. Полный цикл.

Ты описываешь что хочешь. Фреймворк принуждает к шагам, которые ты пропускаешь, когда слишком доверяешь агенту.

01 старт сессии

сообщение 1 из 3

you › start working tausik › session #74 opened handoff: fix(auth): retry on 401 memory tail: 14 patterns · 3 gotchas CLAUDE.md refreshed last commit: a14c2bf · 2h ago ready.

Открывает сессию, грузит handoff с прошлой, обновляет memory-tail в CLAUDE.md.

02 жизненный цикл задачи

сообщение 2 из 3

you › fix the bug — button › doesn't work on mobile tausik › interviewing on edge cases…4 edge cases collected task T-219 · 3 AC draftedQG-0 passed writing code → pytest · ruff · tsc5 review agents · parallel AC evidence: 3 / 3QG-2 passed

Опрашивает тебя про edge cases, создаёт задачу с acceptance criteria, пишет код, гоняет тесты + линтеры + 6 review-агентов параллельно, проверяет evidence в БД для каждого AC.

03 релиз

сообщение 3 из 3

you › ship it tausik › $ tausik verify cache hit · 10m TTLQG-2 passed staging 7 files commit a91f3e2 "fix(ui): mobile button"  push to origin/main?[y/N] _

Запускает tausik verify (кэш 10 мин), проходит QG-2, коммитит, спрашивает перед push.

Что внутри

Шесть вещей, ни одна не опциональная.

Фреймворк маленький намеренно. Каждый кусок принуждает к одному конкретному поведению.

Quality gates

QG-0 блокирует task start без цели и AC. QG-2 блокирует task done без verify-evidence.

Память проекта

SQLite + FTS5 для паттернов, gotchas, решений, тупиков. Перезагружается в начале сессии.

Verify-First

Тяжёлые тесты на отдельном verify-шаге, кэшируются 10 минут; закрытие задачи — миллисекунды.

21 real-time хуков

Task-гейт, bash-firewall, push-гейт, авто-формат, memory-аудиты — блокируют плохие действия до того, как они случатся.

124 MCP-инструментов

Полный программный доступ к БД проекта. Одинаково работает в Claude Code, Cursor, Qwen Code, Windsurf.

Cross-project brainопционально

Зеркалирование решений, паттернов, gotchas в Notion с приватными project-хешами.

Быстрый старт — 10 минут (после установки AI IDE)

Четыре команды, потом перезапусти IDE.

Bootstrap сам определяет твой стек (Python, TS, Rust, Go) и включает подходящие quality gates.

bash

# 1 · go to your project
$ cd your-project

# 2 · add tausik-core as a submodule
$ git submodule add https://github.com/Kibertum/tausik-core .tausik-lib

# 3 · bootstrap (detects stack, wires hooks)
$ python .tausik-lib/bootstrap/bootstrap.py --init

# 4 · ignore local state
$ echo ".tausik/" >> .gitignore

Перезапусти IDE — готово. Bootstrap сам определяет стек и включает подходящие гейты.

Dogfooding

TAUSIK построил TAUSIK.

Каждая фича, каждый рефакторинг, каждый багфикс прошли через те же gates, которые поставляются с фреймворком. Числа ниже — состояние самого dogfood-проекта.

800+

задач закрыто — каждая с целью + AC

задач закрыто без verify-evidence

4 445

тестов проходит

core-зависимостей / phone-home вызовов

Снимок на момент v1.5.6. Живые числа — через tausik metrics.

Поддерживаемые IDE и агенты

Шесть рантаймов. Один слой принуждения.

VSCode + Claude Extension

Официально протестировано

Cursor

Официально протестировано

Claude Code (CLI)

Ожидается · частичная матрица

Qwen Code

Ожидается · частичная матрица

Windsurf

Ожидается · частичная матрица

Codex / OpenCode-style агенты

Ожидается · ручная валидация

124 MCP-инструментов и 13 core-скиллов работают везде. Real-time хуки сегодня живут в Claude Code и Qwen Code; Cursor и Windsurf получают то же принуждение на переходах QG-0 и QG-2.

Ясность

TAUSIK — это не…

Расставляем ожидания до установки.

Не SaaS.

Всё работает локально. БД задач лежит в .tausik/ рядом с твоим кодом. Никакой phone-home, телеметрии, обязательного аккаунта.

Не модель.

TAUSIK не генерирует код. Он сторожит существующего coding-агента (Claude Code, Cursor, Qwen, Windsurf) и трекает его работу.

Не замена Cursor / Claude Code.

Работает внутри них как MCP-инструменты, хуки и скиллы. Твой IDE-workflow сохраняется.

Не tool для онбординга джунов.

Принуждает к практике инженеров, которые уже знают как выглядит good — он не объясняет что такое AC.

Не авто-merge.

QG-0 и QG-2 требуют у агента доказательств; финальное push агент всё равно подтверждает у тебя.

Ландшафт

Чем TAUSIK отличается.

Одна строка — одна возможность. Пустая ячейка — инструмент не закрывает её нативно.

Capability	TAUSIK	Aider	Cursor Rules	Continue	Claude Skills
Enforced task-модель (goal + AC)	✓ QG-0 хук блокирует правки	—	—	—	—
Подписанные verify-чеки (ed25519)	✓ tausik-signed/v1	—	—	—	—
Verify-кеш отделён от close	✓ 10-мин TTL	—	—	—	—
Tracked decisions / dead-ends	✓ SQLite + FTS5	—	—	—	—
Cross-project memory (опционально)	✓ Notion-backed brain	—	—	—	—
Stack-aware verify-сьюты	✓ 25 стеков	single-language	—	—	—
Multi-IDE один surface	✓ MCP + skills	только CLI	только Cursor	только Continue	только Claude
Editor-agnostic install	✓ Python-скрипт	✓	—	—	—

Ответы

Частые вопросы.

Нужен ли отдельный API-ключ помимо AI-IDE?

Нет. TAUSIK никогда не зовёт LLM напрямую. Агент (Claude Code / Cursor / Qwen / Windsurf) использует тот API-ключ, который ты уже настроил для своего IDE.

Phone home есть?

Нет. Всё локально: SQLite в .tausik/, хуки в .claude/. Опциональный Shared Brain пишет только в твой Notion-workspace, если ты сам его подключишь.

Можно ли шарить decisions/patterns в команде?

Да, через опциональный Shared Brain. Per-project хеши прячут имена; cross-project контент проходит scrubbing-линтер перед записью в Notion.

Windows работает?

Да. CLI ставит .tausik/tausik.cmd для PowerShell/cmd. Несколько хуков (pre-commit shell, push gate) предпочитают Git Bash или WSL; остальной pipeline идёт нативно.

А мой текущий AGENTS.md / CLAUDE.md?

TAUSIK управляет маленьким dynamic-блоком внутри CLAUDE.md (сессия + счётчики). Твои инструкции в CLAUDE.md или AGENTS.md остаются нетронутыми — TAUSIK их читает, но не перезаписывает.

Фундамент

Построено на SENAR.

SENAR

TAUSIK реализует SENAR — открытый инженерный стандарт AI-assisted разработки. Quality gates, управление сессиями, метрики, чек-листы верификации — всё определено в SENAR. Спецификация: senar.tech. А также адаптирует RENAR — стандарт рассуждения и governance (renar.tech) — advisory-first: интерпретация становится видимой на каждом quality gate.

AI-агенты, которыене врут «готово».

Без TAUSIK vs С TAUSIK

Когда агент говорит «зелёно» —ты получаешь чек.

tausik verify выдаёт подписанный чек

task done проверяет его перед закрытием

Чеки переносимы

Релизы тоже подписаны

Три сообщения. Полный цикл.

Шесть вещей, ни одна не опциональная.

Quality gates

Память проекта

Verify-First

21 real-time хуков

124 MCP-инструментов

Cross-project brainопционально

Четыре команды, потом перезапусти IDE.

TAUSIK построил TAUSIK.

Шесть рантаймов. Один слой принуждения.

TAUSIK — это не…

Чем TAUSIK отличается.

Частые вопросы.

Построено на SENAR.

AI-агенты, которые
не врут «готово».

Когда агент говорит «зелёно» —
ты получаешь чек.