Claude Codeを3日触ってわかった、AIに任せていい仕事・任せると震える仕事

結論から言うと、私の作業時間は3日でだいたい3割減りました。

ただし初日の30分は、便利さより怖さが勝っていました。夜中の1時、地方の静かな部屋でコーヒーを飲みながら試していたら、READMEに架空の機能が3つ増えていて、私は一度キーボードから手を離しました。

さらに悪いことに、同居の猫がEnterキーを踏みました。AIより先に猫の権限管理を考える羽目になりました。

目次

最初にやったこと

いきなり本番のリポジトリで試す勇気はありませんでした。そこで、検証用に12行だけのPythonスクリプトを置いたフォルダを作りました。

mkdir claude-code-lab
cd claude-code-lab
git init

最初の教材はこれです。

# hello.py
from datetime import datetime


def main() -> None:
    now = datetime.now().strftime("%Y-%m-%d %H:%M")
    print(f"now: {now}")


if __name__ == "__main__":
    main()

この程度なら、何を変えられてもすぐ戻せます。最初の検証に必要なのは、大きなコードベースではなく、失敗しても笑える小ささでした。

12個ハマったうち、特に痛かった3つ

1つ目は「いい感じに整えてください」と頼んだことです。これが本当に雑でした。Claude CodeはREADMEを書き、改善案を出し、フォルダ構成まで提案してくれました。見た目は優等生です。

でも、そこに書かれていた機能のうち3つは、まだ実装していませんでした。

「設定ファイル対応」「ログ出力」「複数コマンド対応」。どれも将来やりたいことではあります。でも、現在形でREADMEに書かれると、それは嘘です。私はこの時点で、AIが嘘つきなのではなく、私の依頼が雑だと気づきました。

2つ目は、OS前提のズレです。私はWindows PowerShellで触っているのに、返ってくる例がUnix系コマンドに寄りました。1回なら脳内変換できますが、5回続くとじわじわ疲れます。

3つ目は、差分確認を後回しにしたことです。10分だけのつもりが、気づけば47行の変更になっていました。焦って戻そうとして、関係ないメモまで消しかけました。夜中の2時にやる作業ではありません。

依頼は「読むだけ」から始める

初日に一番効いたプロンプトは、派手なものではありません。

このリポジトリを読んでください。
まだファイルは変更しないでください。
構成、実行方法、不明点だけを箇条書きで教えてください。

これで空気が変わりました。AIに「編集者」ではなく「調査員」として入ってもらう感覚です。

最初から修正を頼むと、こちらは差分の監査員になります。読むだけに限定すると、まず地図ができます。地図なしで運転するより、地図を見てからハンドルを握ったほうが安全です。

私が使っている最初の安全セット

Claude Codeを触る前に、私は必ずこの3つを確認するようにしました。

git status
git diff
git log --oneline -5

さらに、検証フォルダには小さなテストを置きました。

# test_hello.py
import subprocess
import sys


def test_hello_runs() -> None:
    result = subprocess.run(
        [sys.executable, "hello.py"],
        capture_output=True,
        text=True,
        check=True,
    )
    # ハマりポイント: 出力の全文一致にすると時刻で落ちるので、固定文字だけ見る
    assert "now:" in result.stdout

これだけでも安心感が違います。AIが良い提案をしても、動かなければ採用しない。単純ですが、この線引きがあると判断が速くなります。

任せていい仕事、任せると怖い仕事

3日触って、任せていい仕事はかなり見えてきました。

READMEの下書き、既存コードの要約、ログから怪しい箇所を探す作業、単純なリファクタ、テストケースのたたき台。これらは速いです。私の体感では、30分かかっていた調査が10分まで縮むことがありました。

一方で、任せると怖い仕事もあります。

仕様の最終判断、未実装機能を公開文書に書くこと、データ削除を伴う変更、認証情報の扱い、複数ファイルをまたぐ大きな設計変更。このあたりは、人間が先に境界線を引くべきです。

AIは疲れません。でも、責任も取りません。ここを混同すると、便利さが一気に怖さへ変わります。

3日目に残った使い方

最終的に私の使い方は、かなり地味になりました。

まず読ませる。次に1ファイルだけ直させる。最後に差分を見る。必要ならテストを走らせる。この4ステップです。

派手な自動開発というより、横にいる作業の速い先輩に「ここ見ておいてください」と頼む感覚に近いです。ただし、その先輩はたまに自信満々で間違えます。そこが人間らしくないのに、妙に人間くさいところです。

導入初日のチェックリスト

今から始めるなら、私は最初の60分をこう使います。

まず10分で検証フォルダを作ります。次の10分で小さなPythonファイルを1つ置きます。次の15分でClaude Codeに「読むだけ」を頼みます。残り25分で、1ファイルだけ修正させて差分を見ます。

この順番にすると、AIのすごさと怖さを両方見られます。逆に、初日に本番リポジトリへ入れて大きな改修を頼むと、成功しても失敗しても学びが濁ります。

私は初日に、3回「これは便利だ」と思い、2回「今の変更は怖い」と思いました。この両方を感じるのが大事です。便利さだけ見てしまうと雑に任せます。怖さだけ見ると使わなくなります。

Claude Codeは、最初の1時間で評価するより、3日間で使い方を調整する道具でした。

もう1つ、初日にやってよかったのは「やらせないこと」をメモしたことです。

初日はやらせない:
- ファイル削除
- 複数ファイルの一括変更
- 認証情報に触る作業
- 公開文書の断定的な更新

この4つを決めておくだけで、かなり落ち着いて触れます。AIを信じるか疑うかではなく、最初は狭い場所で働いてもらう。この感覚が近いです。

まとめ

Claude Codeは、導入した瞬間に開発力を2倍にする魔法ではありません。

でも、指示を小さく切り、差分を確認し、テストで足場を作れば、毎日の小さな摩擦を確実に削ってくれます。私の場合、初日だけで12個ハマりましたが、3日目には「調べる」「直す」「確認する」の往復がかなり軽くなりました。

結局、AIに任せるべきは退屈な作業ではなく、判断のいらない作業です。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

コメント

コメントする

目次