Чому ми відмовились від leetcode — і що поставили замість

ПРАКТИКА6 хв читання16 квітня 2026 р.

У 2015-му тест з динамічного програмування на дошці ще мав сенс. У 2026-му — вже ні.

Кандидат з підпискою на один із трьох популярних AI-асистентів розвʼязує типову leetcode-задачу за 40 секунд. Без підписки — за 4 хвилини. Без асистента, але з досвідом — за 8. Проблема не в тому, що хтось списує. Проблема в тому, що сигнал перестав корелювати з тим, що ми насправді хочемо знайти.

Що ми хочемо знайти

Коли менеджер наймає інженера, він не шукає людину, яка памʼятає, як виглядає reverse-linked-list ітеративно. Він шукає людину, яка:

Жоден leetcode цього не вимірює. Натомість він вимірює, наскільки зручно кандидату розвʼязувати задачі без контексту, без бази коду, без тестів і без обмежень реальної системи.

Чим ми це замінили

Ми даємо кандидату калібровану задачу в реальному репо. Не в навчальному — у справжньому, зі своїми шрамами: legacy-модуль білінгу, який п'ять років ніхто не чіпав, або API-гейтвей з дивною схемою ретраїв.

Кандидат:

  1. форкає репо або отримує гілку;
  2. читає контекст — код, тести, короткий опис того, що поламано чи чого бракує;
  3. відкриває pull request з реалізацією;
  4. відповідає на автоматичні ревʼю-коменти.

Далі система вимірює по рубриці:

СигналЩо дивимось
CIтести проходять; нові тести додано
Диффокусність, розмір, релевантність змін
Комітиатомарність, читабельність повідомлень
Ревʼюадекватність відповідей, здатність аргументувати
Code qualityчитабельність, ідіоматичність, інваріанти

Але ж AI розвʼязує й таке

Так. І це перевага, а не проблема.

Задачі спроєктовані так, що AI-асистент необхідний, але недостатній. Ми хочемо, щоб кандидат ним користувався — ми бачимо це у всьому робочому процесі після найму. Але ми будуємо задачі з такими властивостями:

За два роки калібрації ми побачили чіткий патерн: найкращі кандидати використовують AI у 2–3 рази активніше за середніх. І при цьому роблять менше помилок — бо знають, де йому не довіряти.

Що це дало

Після 18 місяців пілоту з 11 командами:

Що залишилось відкритим

Ми досі не знаємо, як оцінювати дизайн-рішення верхнього рівня в межах 2-годинної задачі. Це відбувається на фінальному інтервʼю з hiring manager-ом — і це правильно. Наша роль — зняти з цієї зустрічі все, що можна зняти обʼєктивно.

У наступній статті розберемо, як саме сконструйована рубрика і чому LLM-суддя тут кращий за людського ревʼюера у 87% випадків.

#hiring#work-sample#leetcode#рубрика#PR

Поділитись

Спробувати merged

Технічний скринінг без співбесід

Калібрована задача, автоматична рубрика, звіт за ~2 хвилини. Закрита бета, Q2 2026.