トーランのAI搭載エンジニア面接プロセス

Tolanは、エンジニアがAIコーディングエージェントと実際にどのように働くかを反映するために、エンジニア面接プロセスを再設計しました。従来のアルゴリズム問題の代わりに、AIがほとんどの本番コードを書く際に重要な実践的スキルに焦点を当てています。
面接の構造
候補者はサンフランシスコのオフィスで午前中を過ごし、Tolan自身が解決した小さな問題に取り組みます。問題は、基本的なFigmaファイルや短い仕様書から提供され、通常は1〜2日で構築される単純なフローや軽量機能を表しています。
候補者は問題に取り組むのにわずか数時間しか与えられておらず、完成品を作るには十分な時間ではありません。この制約は意図的で、候補者が制限の中でどのように働くかを見たいと考えています。
AIツールの推奨
候補者は問題を解決するためにAIを使用することが明示的に推奨されています。必要に応じて、TolanはClaude、Codex、Cursor、Geminiのライセンスを提供します。重要な期待は、候補者がLLM生成コードと自身の判断をバランスさせることであり、たとえコードを書いていなくても、出力には責任を持つ必要があります。
彼らが探しているもの:
- 候補者が問題にどのようにアプローチするか
- 解決策をどのように構造化するか
- 制約をどのように考え抜くか
- 実際に重要なものをどのように判断するか
評価基準
作業セッションの後、作成されたものについて20〜30分の対話が行われます。面接官は、もし時間があれば何を改善するか、レビュー前に何を変更するか、出荷前に何を変更するかを候補者に尋ねます。
危険信号には以下が含まれます:
- プロジェクトをどのように完了すべきかを考えるためにLLMを使用する候補者(例:FigmaをスクリーンショットしてClaudeに解決を依頼する)
- 不明確な仕様を疑問視しない候補者
- 「この部分が何をするのかまだわからない」と言いながら、人間のレビュー前に何も変更しない候補者
好ましい兆候には以下が含まれます:
- 問題文を明確にし、エッジケースを探求すること
- トレードオフを認識すること
- 何かが変に感じたり正しくないと思ったりする時に指摘すること
- 創造性を示すこと(例:LLM応答待ちの間にユーザーを楽しませるミニゲームを構築する)
- 作業が十分でない時と改善方法を知っていること
核となる哲学:実装が容易になる世界では、最も重要なのは判断力です。動作するコードがゴールではなく、それを理解し維持することが重要です。
📖 完全なソースを読む: HN AI Agents
👀 See Also

Kimi K2.6 vs Claude Opus 4.7: Minetest Bounty Board Modを使った実機テスト
ある開発者が、TypeScriptバックエンドとGoogle Sheetsログ機能を備えたMinetest/Luantiのバウンティボードmodの構築において、Kimi K2.6とClaude Opus 4.7をテストしました。Opusはスムーズに動作しましたが、Kimiは統合部分で失敗しました。

コーディングエージェントのセッションログはローカルに保存され、オープンフェデレーテッドトレーニングを可能にする可能性があります
Claude CodeやCodex CLIのようなコーディングエージェントは、詳細なセッションログをローカルに保存します。これにはタスク、推論プロセス、ツール呼び出し、環境応答などが含まれます。Redditの投稿では、このデータを連合学習で活用し、独自のトレーニングデータセットに相当するオープンな代替を作成することを提案しています。
Opus 4.7 推論努力ベンチマーク: 実タスクでは中が高と最大を上回る
GraphQL-go-toolsリポジトリの29タスクにおいて、Claude Code内のOpus 4.7は中程度の推論努力で最高のパフォーマンスを発揮しました。それ以上の設定では、パッチ品質を向上させることなく正解率が低下し、コストが増加しました。

デビッド・シルバーの"言い表せない知性"が人間データなしのRLベースのスーパーラーナー向けに11億ドルを調達
DeepMind出身のデイビッド・シルバー氏が創業したIneffable Intelligenceは、人間のデータなしに知識を発見する強化学習ベースの「スーパー学習者」を構築するため、51億ドルの評価額で11億ドルを調達した。