За 4 місяці закритої бети (Q4 2025 – Q1 2026) через merged пройшло 340 кандидатів у 11 командах. Ось чесний звіт.
Що підтвердилось
Hiring-менеджери хочуть скоротити фінальну воронку. Середнє скорочення циклу найму — 38%. Не через те, що ми прискорили скринінг, а через те, що фінальна зустріч тепер одна замість чотирьох.
Рекрутери хочуть незалежності. До merged вони зависали в чергах на технічну валідацію. Зараз 73% скринінгів — без жодного інженера в петлі. Це не "заміна сеньйора LLM-ом" — це звільнення сеньйора від повторюваної роботи.
Кандидати не бойкотують завдання. Прогноз казав: 30% відмовляться проходити "ще одне тестове". Реальність: 4%. Ключовий фактор — тривалість (медіана 1 год 12 хв) і те, що вони можуть одразу побачити автоматичний фідбек.
Що ми відкинули
Gamification. Спробували показувати "скор" у реальному часі під час виконання. Виявилось — псує сигнал. Кандидати, які бачили низький проміжний скор, починали панічно переписувати все, втрачаючи сфокусованість дифу. Прибрали.
Ранжування кандидатів. Hiring-менеджери просили "сортуй мені кандидатів по скору". Відмовились. Скор — для pass/fail/borderline gate, не для рейтингу. Інакше ми будуємо калькулятор людей, а не фільтр якості.
Власну IDE. Експеримент з вбудованим редактором провалився. Кандидати хочуть працювати у своєму VS Code/JetBrains з власними асистентами. Залишили git-based flow — воно і природніше.
Три відкриті питання
1. Як оцінювати task design без human-in-the-loop?
Задачу калібрує staff-інженер замовника. Це наше вузьке місце. Одна задача = 3–5 годин його часу. Ми автоматизували оцінку кандидата, але не автоматизували оцінку задачі.
Гіпотеза: після 200+ прогонів задача сама себе калібрує — за розкидом скорів, кореляцією з peer-reviewed PR-ами в тій самій базі. Ще перевіряємо.
2. Pricing на staff-level ролі
Рубрика для сеньйора працює. Для staff — починає "плавати". Причина: staff-рішення часто ортогональні наявному коду (вибір підходу, декомпозиція сервісів). Рубрика-на-дифф такого не ловить.
Наразі staff-рівень закритий. Відкриємо тоді, коли знайдемо форму задачі, де рішення-як-дизайн виражається як артефакт — не обовʼязково код.
3. Європейський ринок vs український
Закрита бета — переважно UA (8 команд) + PL/DE (3 команди). Відкрите питання: чи масштабується культура "робимо PR як інтервʼю" на ринки, де тестове завдання вважається неоплачуваною працею і є reputational risk для компанії.
План: паралельний запуск в DACH з оплачуваними задачами як default. Якщо сигнал прийнятний — buyback economy виграє.
Публічний запуск
Q2 2026. До того — ще одна бета-хвиля на ~30 команд. Якщо хочете туди потрапити — [email protected] з описом команди і ролі, яку хочете закрити.
Без мерчу, без вебінарів, без "please book a demo". Просто пишіть.