Show Notes
- Amazon USA Store: https://www.amazon.com/dp/1633437167?tag=9natree-20
- Amazon Worldwide Store: https://global.buys.trade/Build-a-Large-Language-Model-Sebastian-Raschka.html
- Apple Books: https://books.apple.com/us/audiobook/build-a-large-language-model-from-scratch-unabridged/id1790107106?itsct=books_box_link&itscg=30200&ls=1&at=1001l3bAw&ct=9natree
- eBay: https://www.ebay.com/sch/i.html?_nkw=Build+a+Large+Language+Model+Sebastian+Raschka+&mkcid=1&mkrid=711-53200-19255-0&siteid=0&campid=5339060787&customid=9natree&toolid=10001&mkevt=1
- Shopee: https://asia.buys.trade/shopee_Build-a-Large-Language-Model-Sebastian-Raschka.html
- Lazada: https://asia.buys.trade/lazada_Build-a-Large-Language-Model-Sebastian-Raschka.html
- Tiktok: https://asia.buys.trade/tiktok_Build-a-Large-Language-Model-Sebastian-Raschka.html
- อ่านเพิ่มเติม: https://thai.9natree.com/read/1633437167/
#การสร้างGPTจากศูนย์ #selfattentionแบบcausal #tokenizationและembedding #pretrainingบนข้อความไม่มีlabel #finetuningด้วยLoRA #BuildaLargeLanguageModel
บิลด์ อะ ลาร์จ แลงเกวจ โมเดล ฟรอม สแครตช์ ของ เซบาสเตียน ราชกา เป็นหนังสือเทคนิคเชิงปฏิบัติ ว่าด้วยการสร้างโมเดลภาษาแบบ GPT ตั้งแต่พื้นฐาน จนถึงการนำไปปรับแต่งสำหรับงานจริง. หนังสืออยู่ในกลุ่มวิศวกรรมปัญญาประดิษฐ์ และการเรียนรู้เชิงลึก โดยเน้นให้ผู้อ่านเข้าใจกลไกภายในของ LLM ผ่านการเขียนโค้ดด้วย Python และ PyTorch มากกว่าการใช้ไลบรารีสำเร็จรูปเป็นกล่องดำ. เนื้อหาเริ่มจากการทำความเข้าใจข้อมูลข้อความ การแปลงข้อความเป็นโทเคน การสร้าง embedding และ attention จากนั้นค่อยประกอบเป็นสถาปัตยกรรม Transformer แบบ GPT. จุดมุ่งหมายหลัก ไม่ใช่การฝึกโมเดลขนาดเท่าระบบเชิงพาณิชย์ แต่คือการทำให้ผู้อ่านเห็นว่า ส่วนประกอบสำคัญของ LLM ทำงานร่วมกันอย่างไร. หนังสือยังครอบคลุมการ pretraining, การ fine tuning สำหรับการจำแนกข้อความ, การปรับให้ทำตามคำสั่ง และการใช้โมเดลที่ฝึกไว้แล้วอย่างเป็นระบบ.