ช่วงนี้ผมสนุกกับการใช้ Coding Agent มากครับ ลองนึกภาพว่ามันคือ “ผู้ช่วยส่วนตัว” (อารมณ์เหมือนมี Jarvis ประจำตัว) แทนที่จะแค่ตอบคำถามเหมือน chatbot ทั่วไป เจ้าเอเจนท์ตัวนี้จะรับคำสั่งแล้วลงมือทำตามขั้นตอนต่าง ๆ ให้เราจนเสร็จงาน เพียงแค่เราบอกความต้องการ มันทำงานผ่าน terminal สามารถอ่านไฟล์ เขียนโค้ด และแก้ bug ได้เองจนจบงาน
บทความนี้เหมาะสำหรับทุกคนที่อยากสร้างอะไรบางอย่างแต่ติดที่เขียนโค้ดไม่เป็น ไม่ว่าจะเป็นการทำกราฟสวยๆ สรุปไฟล์ PDF กองโต หรือสั่งให้คอมทำงานน่าเบื่อแทน การมีเอเจนท์ช่วยจัดการเรื่อง “how-to” ทำให้เราโฟกัสที่ “จินตนาการ” ได้เต็มที่ครับ
การเริ่มต้นก็ไม่แพงอย่างที่คิด มีตัวเลือก open-source อย่าง OpenCode ที่ใช้คู่กับ Gemini ตัวฟรีได้ หรือถ้าอยากได้ความล้ำขึ้นไปอีกก็ขยับไปใช้ Claude Code ได้ series นี้จะพาไปดูทั้งสองทาง โดยตัวอย่างด้านล่างนี้ผมใช้ Gemini CLI สร้างขึ้นมาฟรีทั้งหมดครับ
ตัวอย่างสิ่งที่ทำได้
สร้างเครื่องมือใหม่จากศูนย์: ผมลองสั่งให้ทำโปรแกรมแต่งรูป
สรุปข้อมูลปริมาณมาก: ผมส่งรายงานเศรษฐกิจยาวๆ เป็น
PDFให้มันทำเป็นpresentation- เอเจนท์อ่านเอกสารและดึงประเด็นสำคัญ เช่น
GDPหรือราคาน้ำมันมาสรุป - ออกแบบ
slideให้ 8 หน้า พร้อมสร้างไฟล์PowerPointและPDFให้ทันที ช่วยประหยัดเวลาได้มหาศาล
- เอเจนท์อ่านเอกสารและดึงประเด็นสำคัญ เช่น
จัดการข้อมูลที่ยุ่งเหยิง: ผมส่งโฟลเดอร์ข้อมูลดิบให้เอเจนท์
- ใช้
librarypandasทำความสะอาดข้อมูล - สร้าง
dashboardแบบโต้ตอบได้และslide presentationที่ข้อมูลตรงกันเป๊ะ เหมือนมีนักวิเคราะห์ข้อมูลมาทำให้เลย
- ใช้
แผนการเดินทางของเรา
| # | หัวข้อ | รายละเอียด |
|---|---|---|
| 0 | บทนำ (คุณอยู่ตรงนี้) | ภาพรวมและตัวอย่างสิ่งที่ทำได้ |
| 1 | พื้นฐานที่ควรรู้ | เรื่องของ terminal, Python และการทำงานของเอเจนท์ |
| 2 | ติดตั้งเอเจนท์ตัวแรก | เริ่มต้นใช้งาน OpenCode และ Claude Code จากศูนย์ |
| 3 | ปรับแต่งให้เข้ามือ | วิธีใช้ custom prompt และเพิ่มทักษะใหม่ๆ |
| 4 | แบ่งปันผลงาน | วิธีนำสิ่งที่สร้างขึ้นไป online ให้คนอื่นใช้ |
ตอนต่อไปจะเริ่มเข้าสู่เนื้อหาเทคนิคเล็กน้อยครับ การรู้พื้นฐานว่า terminal ทำงานยังไง หรือ AI ตัดสินใจแบบไหน จะช่วยให้เราสร้างสิ่งที่ซับซ้อนขึ้นได้มาก พอพื้นฐานแม่นแล้วความสนุกจะเริ่มขึ้นครับ
ลิงก์ที่น่าสนใจ
Coding Agent:
- Claude Code — ตัวท็อปจาก Anthropic (มีค่าใช้จ่าย)
- Gemini CLI —
open-sourceจาก Google - OpenCode — ทำงานร่วมกับ
Geminiได้ดีมาก
Terminal:
- PowerShell — สำหรับ Windows
- Terminal / Bash — สำหรับ macOS และ Linux
Language & Runtime:
