ช่วงนี้ผมสนุกกับการใช้ Coding Agent มากครับ ลองนึกภาพว่ามันคือ “ผู้ช่วยส่วนตัว” (อารมณ์เหมือนมี Jarvis ประจำตัว) แทนที่จะแค่ตอบคำถามเหมือน chatbot ทั่วไป เจ้าเอเจนท์ตัวนี้จะรับคำสั่งแล้วลงมือทำตามขั้นตอนต่าง ๆ ให้เราจนเสร็จงาน เพียงแค่เราบอกความต้องการ มันทำงานผ่าน terminal สามารถอ่านไฟล์ เขียนโค้ด และแก้ bug ได้เองจนจบงาน

บทความนี้เหมาะสำหรับทุกคนที่อยากสร้างอะไรบางอย่างแต่ติดที่เขียนโค้ดไม่เป็น ไม่ว่าจะเป็นการทำกราฟสวยๆ สรุปไฟล์ PDF กองโต หรือสั่งให้คอมทำงานน่าเบื่อแทน การมีเอเจนท์ช่วยจัดการเรื่อง “how-to” ทำให้เราโฟกัสที่ “จินตนาการ” ได้เต็มที่ครับ

การเริ่มต้นก็ไม่แพงอย่างที่คิด มีตัวเลือก open-source อย่าง OpenCode ที่ใช้คู่กับ Gemini ตัวฟรีได้ หรือถ้าอยากได้ความล้ำขึ้นไปอีกก็ขยับไปใช้ Claude Code ได้ series นี้จะพาไปดูทั้งสองทาง โดยตัวอย่างด้านล่างนี้ผมใช้ Gemini CLI สร้างขึ้นมาฟรีทั้งหมดครับ

ตัวอย่างสิ่งที่ทำได้

  1. สร้างเครื่องมือใหม่จากศูนย์: ผมลองสั่งให้ทำโปรแกรมแต่งรูป

    • เอเจนท์เลือกใช้ library อย่าง gradio และ pillow เอง
    • ติดตั้งและเขียนโค้ดสร้าง web app ให้เสร็จสรรพ พร้อมเพิ่ม feature ปรับความสว่าง และใส่ filter สวยๆ ให้โดยที่ผมไม่ได้เขียนโค้ดสักบรรัด
  2. สรุปข้อมูลปริมาณมาก: ผมส่งรายงานเศรษฐกิจยาวๆ เป็น PDF ให้มันทำเป็น presentation

    • เอเจนท์อ่านเอกสารและดึงประเด็นสำคัญ เช่น GDP หรือราคาน้ำมันมาสรุป
    • ออกแบบ slide ให้ 8 หน้า พร้อมสร้างไฟล์ PowerPoint และ PDF ให้ทันที ช่วยประหยัดเวลาได้มหาศาล
  3. จัดการข้อมูลที่ยุ่งเหยิง: ผมส่งโฟลเดอร์ข้อมูลดิบให้เอเจนท์

    • ใช้ library pandas ทำความสะอาดข้อมูล
    • สร้าง dashboard แบบโต้ตอบได้และ slide presentation ที่ข้อมูลตรงกันเป๊ะ เหมือนมีนักวิเคราะห์ข้อมูลมาทำให้เลย

แผนการเดินทางของเรา

#หัวข้อรายละเอียด
0บทนำ (คุณอยู่ตรงนี้)ภาพรวมและตัวอย่างสิ่งที่ทำได้
1พื้นฐานที่ควรรู้เรื่องของ terminal, Python และการทำงานของเอเจนท์
2ติดตั้งเอเจนท์ตัวแรกเริ่มต้นใช้งาน OpenCode และ Claude Code จากศูนย์
3ปรับแต่งให้เข้ามือวิธีใช้ custom prompt และเพิ่มทักษะใหม่ๆ
4แบ่งปันผลงานวิธีนำสิ่งที่สร้างขึ้นไป online ให้คนอื่นใช้

ตอนต่อไปจะเริ่มเข้าสู่เนื้อหาเทคนิคเล็กน้อยครับ การรู้พื้นฐานว่า terminal ทำงานยังไง หรือ AI ตัดสินใจแบบไหน จะช่วยให้เราสร้างสิ่งที่ซับซ้อนขึ้นได้มาก พอพื้นฐานแม่นแล้วความสนุกจะเริ่มขึ้นครับ

ลิงก์ที่น่าสนใจ

Coding Agent:

  • Claude Code — ตัวท็อปจาก Anthropic (มีค่าใช้จ่าย)
  • Gemini CLIopen-source จาก Google
  • OpenCode — ทำงานร่วมกับ Gemini ได้ดีมาก

Terminal:

Language & Runtime:

  • Python — ภาษาหลักที่ใช้ใน project
  • Node.js — สำหรับ Gemini CLI และ JavaScript